80
Окончание табл. 2.9
|
Athlon 64 FX |
Athlon 64 FX |
|
|
Athlon 64 X2 |
Athlon 64 X2 |
|
L1 кеш данных |
2 х 64 Кбайт |
2 х 64 Кбайт |
|
L2 кеш |
2 х 1024/512 Кбайт |
2 х 1024/512 Кбайт |
|
Технологии энерго- |
Cool,n,Quiet |
Cool,n,Quiet |
|
сбережения |
|
|
|
64-битные расшире- |
AMD64 |
AMD64 |
|
ния |
|||
|
|
||
Технология виртуали- |
Есть(Pacifica) |
Нет |
|
зации |
|||
|
|
||
SIMD инструкции |
SSE3 |
SSE3 |
2.3 Процессоры Core 2 Duo и Core 2 Extreme (Intel)
На настоящее время процессоры Core 2 Duo и Core 2 Extreme (Intel) предлагают самый высокий уровень быстродействия.
Помимо впечатляющего быстродействия Core 2 Duo могут похвастать не только сравнительно невысоким тепловыделением и энергопотреблением, но и значительным оверклокерским потенциалом.
Микроархитектура Core среди прочих возможностей предполагает поддержку 64-битных расширений Enhanced Memory 64 Technology (EM64T). Процессоры Core 2 Duo — первые CPU с
поддержкой x86-64 в эволюционном ряду Pentium III — Pentium M — Core Duo — Core 2 Duo.
EM64T в Core 2 Duo
Поддержка EM64T в микроархитектуре Core имеет два ограничения: во-первых, при работе в 64-битных режимах процессорами Core 2 Duo не поддерживается технология Macrofusion, во-вторых, применений инструкций, работающих с дополнительными регистрами, доступными только при активации EM64T, снижает темп декодирования процессором исполняемого кода.
Технология Macrofusion — это одна из ключевых особенностей новой микроархитектуры Core, направленная на увеличение числа исполняемых процессором за такт команд и заключается в том, что ряд пар связанных между собой последовательных x86
81
инструкций, таких как сравнение со следующим за ним условным переходом, представляются внутри процессора одной микроинструкцией. Такая микроинструкция рассматривается планировщиком и выполняется на исполнительных устройствах как одна команда. Этим путём достигается увеличение темпа исполнения кода, позволяющее, при удачном стечении обстоятельств, обрабатывать процессору до 5 команд за такт.
Instruction Queue
incecx
store[mem3], ebx
jnetarg
cmpeax, [mem2]
loadeax, [mem1]
des0 des1 des2 des3
incecx
store[mem3], ebx
cmpjneeax, [mem2], targ
loadeax, [mem1]
Рис. 2.11 — Технология Macrofusion
Однако неработоспособность Macrofusion в 64-битном режиме вряд ли может драматически повлиять на скорость работы процессора. В идеальном случае, при наличии в исходном коде одной инструкции условного перехода на каждые пять x86 команд, и при попадании всех этих пяти последовательных инструкций в 16-байтовую выборку, обрабатываемую процессором за один такт, теоретическое ускорение составит 25 %. Но в реальных условиях данная технология даёт устойчивый положительный эффект лишь при соблюдении целого ряда условий. Как минимум потому, что данная частота условных переходов на прак-
82
тике, естественно, не встречается. Более того, технология Macrofusion эффективна только при средней длине инструкций в коде не более 4 байт. В результате, по оценке специалистов, данная технология сама по себе вряд ли может приносить выигрыш в быстродействии более 3—5 %. Иными словами, одно лишь отсутствие технологии Macrofusion при активации EM64T не может служить поводом для паники: на производительность она влияет не так уж и сильно.
Что же касается замедления работы, вызванного использованием инструкций, работающих с дополнительными регистрами, то обуславливается оно появлением в коде дополнительного однобайтового префикса REX, добавляемого при всех 64битовых операциях. Этот префикс, очевидно, влияет на среднюю длину инструкций, обрабатываемых процессором в 64-битных режимах, что в конечным итоге может вызвать уменьшение числа инструкций, попадающих в 16-байтовую выборку из L1 кэша, обрабатываемую CPU за один такт. Иными словами, в то время как средняя длина инструкции в x86 коде равна порядка 2.5—3.5 байт, при переходе в 64-битный режим она увеличивается из-за необходимости применения префикса REX. При её возрастании до более чем 4 байт, процессор может утратить свою способность выполнять 4 инструкции за такт.
Полностью аналогичный 32-битному код выполняется на процессорах Core 2 Duo лишь чуть медленнее из-за неработоспособности Macrofusion, а падение скорости работы при наличии в коде 64-битных операций, очевидно, будет компенсироваться дополнительными возможностями по работе с большим числом регистров и увеличением их разрядности.
Таблица 2.10
|
Core 2 Extreme |
Pentium Ex- |
Pentium Ex- |
|
treme |
treme |
|
|
|
||
|
Core 2 Duo |
Edition 9XX |
Edition 8X |
|
Pentium D 9XX |
Pentium D 8X |
|
|
|
||
Кодовое имя |
Conroe/Allendale |
Presler |
Smithfield |
Тактовая частота |
1.86—2.93 ГГц |
2.8—3.73 ГГц |
2.8—3.2 ГГц |
Микроархитектура |
Core |
NetBurst |
NetBurst |
83
Окончание табл. 2.10
|
Core 2 Extreme |
Pentium Ex- |
Pentium Ex- |
|
|
treme |
treme |
||
|
|
|||
|
Core 2 Duo |
Edition 9XX |
Edition 8X |
|
|
Pentium D 9XX |
Pentium D 8X |
||
|
|
|||
Технологический |
65 нм |
65 нм |
90 нм |
|
процесс |
||||
|
|
|
||
Корпус |
LGA775 |
LGA775 |
LGA775 |
|
Частота сист ши- |
1067 МГц |
1067/800 МГц |
800/533 МГц |
|
ны |
||||
|
|
|
||
Число транзисто- |
291 млн/167 млн |
376 млн |
230 млн |
|
ров |
||||
|
|
|
||
Площадь кристал- |
143 |
162 кв. мм |
206 кв. мм |
|
ла |
кв. мм/111кв.мм |
|||
|
|
|||
L1 кеш инструк- |
2 x 32 Кбайт |
2 х 12000 uops |
2 x 12000 uops |
|
ций |
||||
|
|
|
||
L1 кеш данных |
2 x 32 Кбайт |
2 x 16 Кбайт |
2 x 16 Кбайт |
|
L2 кеш |
4096/2048 Кбайт |
2 x 2048 Кбайт |
2 x 1024 Кбайт |
|
Технология Hyper- |
|
Опционально, у |
Опционально, |
|
Threading |
Нет |
ХЕ |
у ХЕ |
|
|
|
моделей |
моделей |
|
Технология энер- |
C1E, EIST |
C1E, EIST |
C1E, EIST |
|
госбережения |
||||
|
|
|
||
64-битные расши- |
EM64T |
EM64T |
EM64T |
|
рения |
||||
|
|
|
||
Технология вир- |
Есть(Vaderpool) |
Опционально |
Нет |
|
туализации |
|
(Vaderpool) |
|
|
SIMD инструкции |
SSE3 |
SSE3 |
SSE3 |
Энергопотребление
Энергопотребление по мнению Intel, в скором времени должно стать основным мерилом потребительских качеств процессоров.
При высокой производительности новые процессоры Intel, основанные на микроархитектуре Core, могут похвастать и блестящей экономичностью. Пока что им не видно реальных соперников и по этому параметру.
Процессоры Core 2 Duo сочетают высокую производительность и низкое энергопотребление. Pentium D, наоборот, имеют низкую производительность при высоком энергопотреблении.
84
Athlon 64 X2 пока что занимают промежуточную позицию. Однако данный результат, видимо, следует признать лишь предварительным. С намеченным на ближайшее время внедрением Energy Efficient процессоров AMD приведённая картинка, очевидно, претерпит значительные изменения.
Core 2Duo E6300 (1.86 GHz)
44
Core 2Duo E6400 (2.13 GHz)
50
Core 2Duo E6600 (2.4 GHz) 
52
Core 2Duo E6700 (2.67 GHz) 
59
Core Extreme X6800 (2.93 GHz)
65
Athlon 64 X2 3800+ |
(2.0 GHz) |
|
|
82 |
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Athlon 64 X2 4200+ |
(2.2 GHz) |
|
|
|
87 |
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
96 |
|
|
|
|
|
|||
Athlon 64 X2 4600+ |
(2.4 GHz) |
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
100 |
|
|
|
|
|
||
Athlon 64 X2 5000+ |
(2.6 GHz) |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Athlon 64 FX-62 |
(2.8 GHz) |
|
|
|
|
|
|
|
|
|
130 |
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
145 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Pentium D 820 |
(2.8 |
GHz) |
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Pentium D 915 |
(2.8 |
GHz) |
|
|
|
|
|
|
94 |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Pentium D 945 |
(3.4 |
GHz) |
|
|
|
|
|
|
|
109 |
|
|
|
|||
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
126 |
|
|
|||
Pentium XE 956 (3.73 |
GHz) |
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
50 |
100 |
150 |
200 |
||||||||||
Рис. 2.12 — Энергопотребление при полной загрузке процессоров
Рывок Intel спровоцировал падение цен на процессоры. Для наглядности восприятия новой ценовой политики ниже предлагается график, на котором стоимость процессоров и их усреднённый уровень быстродействия показан одновременно.
Почти все точки на графике практически точно ложатся на единую кривую. Это означает, что любой из двухъядерных процессоров имеет полностью оправданное соотношение цены и производительности. Иными словами, стоимость CPU вполне соответствует его быстродействию, несмотря на то, о каком из