165
РС 800 RDRAM оказалась самой быстрой памятью среди протестированных типов ОЗУ. Ее ближайший конкурент — память DDR 333 SDRAM — почти не уступает РС 800 в производительности, за исключением приложений, активно работающих с большими объемами данных, проигрывая здесь на 7—16 %. С учетом более низкой стоимости модулей памяти РС 800 RDRAM, она пока остается лучшим выбором для мощных систем на базе
ЦП Pentium 4.
Кроме того, РС 800 RDRAM имеет лучший запас по наращиванию тактовой частоты процессора, и предел ее производительности для программ, в которых не оптимизируется работа ЦП с ОЗУ, будет достигнут при частоте Pentium 4 в 4,3 ГГц (использование шины памяти для 2,0 ГГц Pentium 4 составляет 46 %). При агрессивной оптимизации предел производительности программ для Pentium 4 будет достигнут при частотах порядка 3,4 ГГц, так как для Pentium 4 с частотой 2,0 ГГц загрузка составляет 58 %, при сверхагрессивном способе оптимизации взаимодействия ОЗУ и процессора (что на реальных приложениях недостижимо) предел производительности программ будет достигнут при 2,5 ГГц (79 %). В действительности РС800 начнет замедлять работу системы только при тактовой частоте ЦП около 3,5 ГГц и выше.
В итоге РС 800 RDRAM, несмотря на свой возраст, все еще остается самой быстрой и перспективной памятью для высокопроизводительных ПК.
5.2.10 Память DDR2
Для понимания основных плюсов и минусов использования DDR2 SDRAM по сравнению с традиционной DDR SDRAM, необходимо кратко познакомиться с её архитектурой. Прежде всего, заметим, что по сути DDR2 память не имеет кардинальных отличий от DDR SDRAM. Однако в то время как DDR SDRAM осуществляет две передачи данных по шине за такт, DDR2 SDRAM выполняет четыре таких передачи. При этом построена DDR2 память из таких же ячеек памяти, что и DDR SDRAM, а для удвоения пропускной способности используется техника мультиплексирования.
166
DRAM core frequency |
|
|
|
|
|
|
|
Clock frequency |
|
|
Data bus speed |
|
|||||||||||||||||
|
100MHz |
|
|
|
|
|
|
|
|
|
200MHz |
|
|
|
400Mbps |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
DDR-II |
|
|
|
|
|
|
Memory |
|
I/O |
|
|
SDRAM |
|
|
|
||
|
Cell |
|
Buffer |
|
|
|
|
|
|
||
|
|
Array |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
DRAM core frequency Clock frequency Data bus speed 100 MHz 100 MHz 200 Mbps
DDR-I SDRAM
Memory
I/O
Cell Buffer
Array
DRAM core frequency Clock frequency Data bus speed 100 MHz 100 MHz 100 Mbps
SDR |
Memory |
I/O |
SDRAM |
Cell |
Buffer |
|
Array |
|
Рис. 5.6
Само по себе ядро чипов памяти DDR2 продолжает работать на той же самой частоте, на которой оно работало и в DDR и в SDR SDRAM. Однако в DDR2 SDRAM увеличилась частота работы буферов ввода вывода, а также по сравнению с обычной DDR в два раза расширилась шина, связывающая ядро памяти с буферами. Таким образом, на буфера ввода-вывода возлагается задача мультиплексирования. Данные, поступающие из ячеек памяти по широкой шине, уходят из них по шине обычной ширины, но с частотой вдвое превышающей частоту шины DDR SDRAM. Таким нехитрым способом достигается возможность очередного увеличения пропускной способности памяти без увеличения частоты работы самих ячеек памяти. То есть, фактически, ячейки памяти DDR2-533 работают с той же частотой, что ячейки памяти
DDR266 SDRAM или PC133 SDRAM, а переход от DDR SDRAM
к DDR2 SDRAM по сути аналогичен переходу от SDR SDRAM к DDR SDRAM.
167
Однако столь простой метод увеличения пропускной способности памяти имеет и свои отрицательные стороны. В первую очередь — это рост латентности. Очевидно, что латентность не определяется ни частотой работы буферов ввода-вывода, ни шириной шины, по которой данные поступают из ячеек памяти. Первоочередной фактор, определяющий латентность — это латентность самих ячеек памяти. Таким образом, латентность
DDR2-533 сравнима с латентностью DDR266 или PC133 SDRAM
и, очевидно, уступает латентности DDR памяти, работающей с частотой 400 МГц и более. Таким образом, DDR2 SDRAM, хотя и обеспечивает более высокую пропускную способность, чем DDR SDRAM, её латентность оказывается несколько выше латентности предшественницы. Именно этим и обуславливается тот факт, что в реальных приложениях системы, снабжённые DDR2 памятью, нередко проигрывают по быстродействию системам с DDR SDRAM. Большинство приложений критично относится не только к скорости поступления данных для обработки, но и ко времени выборки этих данных. Помимо увеличения частоты работы буферов ввода-вывода и использования вдвое большего коэффициента мультиплексирования, есть у DDR2 памяти и другие отличия, которые, впрочем, не имеют такого же ключевого значения. Поэтому, просто приведём их в виде таблицы:
Таблица 5.1
|
DDR SDRAM |
DDR2 SDRAM |
|
Частота передачи |
200, 266, 333, 400 МГц |
400,533 (667, 800) МГц |
|
данных |
|||
|
|
||
Упаковка чипов |
TSOP и FBGA |
FBGA |
|
Напряжение питания |
2,5 В |
1,8 В |
|
Ёмкость чипов |
64 Мбит — 1 Гбит |
256 Мбит — 4 Гбит |
|
Внутренние банки |
4 |
4 и 8 |
|
Prefetch (MIN Write |
2 |
4 |
|
Burst) |
|||
|
|
||
CAS Latency(CL) |
2, 2.5, 3 |
3, 4, 5 |
|
Additive Latency(AL) |
Не поддерживает |
0, 1, 2, 3, 4 |
|
Латентность чтения |
CL |
CL+AL |
|
Латентность записи |
1 |
Латентность чтения — |
|
|
1 |
||
|
|
||
Burst Lengths |
2, 4, 8 |
4, 8 |
168
Фактически, среди перечисленных нововведений выделить особо стоит лишь механизм Additive Latency и встроенную в чипы терминацию шины. Благодаря механизму Additive Latency несколько увеличивается эффективность передачи данных: данный алгоритм решает изредка встречающуюся с DDR SDRAM проблему с невозможностью одновременной подачи команд на чтение инициализированного банка памяти и инициализацию следующего банка. Впрочем, на реальной производительности данное нововведение сказывается совсем незначительно. Что же касается on-die termination, то теперь терминирующие шину резисторы, предназначенные для гашения отраженных от конца шины сигналов, располагаются не на материнской плате, а непосредственно в чипах. С одной стороны это позволяет улучшить саму терминацию, а с другой — несколько удешевить материнские платы благодаря отсутствию необходимости установки большого числа резисторов в окрестности слотов DIMM.
Чипы DDR2 SDRAM имеют FBGA упаковку — это явно оговаривается на уровне спецификации. Использование корпусировки такого типа позволяет более эффективно организовать теплоотвод, а также минимизировать взаимное электромагнитное влияние чипов друг на друга. Помимо сменившегося типа упаковки чипов (напомним, что большинство чипов DDR SDRAM упаковывалось в TSOP), чипы DDR2 SDRAM имеют меньшее напряжение питания, и, как следствие, примерно на 30 % меньшее тепловыделение. В частности, именно поэтому вполне реальным становится создание чипов DDR2 большей ёмкости и частоты, чем в случае с DDR SDRAM.
Таким образом, слабым местом технологии DDR2, из-за которого системы, снабжённые памятью этого типа, проигрывают системам с DDR памятью, является более высокая латентность. Именно поэтому основным направлением, на котором сосредоточили свои усилия производители памяти, заинтересованные в популяризации DDR2 SDRAM, стало уменьшение латентности. И, надо сказать, определённые успехи на этом поприще были достигнуты.
Первые модули DDR2-533 SDRAM, которые были доступны с момента анонса чипсетов семейств i925 и i915, имели тайминги
4-4-4 (CAS Latency — RAS to CAS Delay — RAS Prechage Time).
169
Сегодня же многие производители памяти, в особенности производители модулей для энтузиастов, такие как Corsair или OCZ, предлагают модели DDR2 SDRAM, способные работать при частоте 533 МГц с таймингами 3-3-3. Причём, это не разгон, а официально утверждённый JEDEC стандарт. В рамках официально утверждённой спецификации предусмотрена модификация DDR2-533 с таймингами 3-3-3, но с повышенным до 1.9В напряжением питания. Использование в LGA775 системах DDR2-533 SDRAM с таймингами 3-3-3 было одобрено и Intel. Компания официально подтвердила совместимость своих новых чипсетов с такой памятью и специально подчеркнула, что эта память будет являться наилучшим выбором для энтузиастов, стремящихся достичь наивысший уровень производительности. Понять Intel несложно: даже с теоретических позиций совершенно понятно, что уменьшение латентности CAS DDR2-533 до 3 циклов может позволить значительно усилить параметры DDR2.
Таблица 5.2
|
|
|
Пропускная способ- |
Память |
Тайминги |
Латентность |
ность в двухканаль- |
|
|
|
ном режиме |
DDR400SDRAM |
2.5-3-3 |
12.5 нс |
6.4 Гбайт/сек |
DDR400SDRAM |
2-3-2 |
10 нс |
6.4 Гбайт/сек |
DDR533SDRAM |
3-4-4 |
11.2 нс |
8.5 Гбайт/сек |
DDR533SDRAM |
2.5-3-3 |
9.4 нс |
8.5 Гбайт/сек |
DDR2-533SDRAM |
5-5-5 |
18.8 нс |
8.5 Гбайт/сек |
DDR2-533SDRAM |
4-4-4 |
15 нс |
8.5 Гбайт/сек |
DDR2-533SDRAM |
3-3-3 |
11.2 нс |
8.5 Гбайт/сек |
DDR2-600SDRAM |
5-5-5 |
16.6 нс |
9.6 Гбайт/сек |
DDR2-600SDRAM |
4-4-4 |
13.3 нс |
9.6 Гбайт/сек |
Как видим, DDR2-533 SDRAM c таймингами 4-4-4 с точки зрения латентности проигрывает повсеместно распространённой DDR400 SDRAM в полтора раза. Сомнительно, что 30процентный рост пропускной способности способен компенсировать такое ухудшение времени выборки. Однако уменьшение таймингов DDR2-533 до 3-3-3 значительно снижает латентность и она становится лишь на 12 % хуже латентности DDR400