Материал: 835

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

80

Окончание табл. 2.9

 

Athlon 64 FX

Athlon 64 FX

 

Athlon 64 X2

Athlon 64 X2

L1 кеш данных

2 х 64 Кбайт

2 х 64 Кбайт

L2 кеш

2 х 1024/512 Кбайт

2 х 1024/512 Кбайт

Технологии энерго-

Cool,n,Quiet

Cool,n,Quiet

сбережения

 

 

64-битные расшире-

AMD64

AMD64

ния

 

 

Технология виртуали-

Есть(Pacifica)

Нет

зации

 

 

SIMD инструкции

SSE3

SSE3

2.3 Процессоры Core 2 Duo и Core 2 Extreme (Intel)

На настоящее время процессоры Core 2 Duo и Core 2 Extreme (Intel) предлагают самый высокий уровень быстродействия.

Помимо впечатляющего быстродействия Core 2 Duo могут похвастать не только сравнительно невысоким тепловыделением и энергопотреблением, но и значительным оверклокерским потенциалом.

Микроархитектура Core среди прочих возможностей предполагает поддержку 64-битных расширений Enhanced Memory 64 Technology (EM64T). Процессоры Core 2 Duo — первые CPU с

поддержкой x86-64 в эволюционном ряду Pentium III — Pentium M — Core Duo — Core 2 Duo.

EM64T в Core 2 Duo

Поддержка EM64T в микроархитектуре Core имеет два ограничения: во-первых, при работе в 64-битных режимах процессорами Core 2 Duo не поддерживается технология Macrofusion, во-вторых, применений инструкций, работающих с дополнительными регистрами, доступными только при активации EM64T, снижает темп декодирования процессором исполняемого кода.

Технология Macrofusion — это одна из ключевых особенностей новой микроархитектуры Core, направленная на увеличение числа исполняемых процессором за такт команд и заключается в том, что ряд пар связанных между собой последовательных x86

81

инструкций, таких как сравнение со следующим за ним условным переходом, представляются внутри процессора одной микроинструкцией. Такая микроинструкция рассматривается планировщиком и выполняется на исполнительных устройствах как одна команда. Этим путём достигается увеличение темпа исполнения кода, позволяющее, при удачном стечении обстоятельств, обрабатывать процессору до 5 команд за такт.

Instruction Queue

incecx

store[mem3], ebx

jnetarg

cmpeax, [mem2]

loadeax, [mem1]

des0 des1 des2 des3

incecx

store[mem3], ebx

cmpjneeax, [mem2], targ

loadeax, [mem1]

Рис. 2.11 — Технология Macrofusion

Однако неработоспособность Macrofusion в 64-битном режиме вряд ли может драматически повлиять на скорость работы процессора. В идеальном случае, при наличии в исходном коде одной инструкции условного перехода на каждые пять x86 команд, и при попадании всех этих пяти последовательных инструкций в 16-байтовую выборку, обрабатываемую процессором за один такт, теоретическое ускорение составит 25 %. Но в реальных условиях данная технология даёт устойчивый положительный эффект лишь при соблюдении целого ряда условий. Как минимум потому, что данная частота условных переходов на прак-

82

тике, естественно, не встречается. Более того, технология Macrofusion эффективна только при средней длине инструкций в коде не более 4 байт. В результате, по оценке специалистов, данная технология сама по себе вряд ли может приносить выигрыш в быстродействии более 3—5 %. Иными словами, одно лишь отсутствие технологии Macrofusion при активации EM64T не может служить поводом для паники: на производительность она влияет не так уж и сильно.

Что же касается замедления работы, вызванного использованием инструкций, работающих с дополнительными регистрами, то обуславливается оно появлением в коде дополнительного однобайтового префикса REX, добавляемого при всех 64битовых операциях. Этот префикс, очевидно, влияет на среднюю длину инструкций, обрабатываемых процессором в 64-битных режимах, что в конечным итоге может вызвать уменьшение числа инструкций, попадающих в 16-байтовую выборку из L1 кэша, обрабатываемую CPU за один такт. Иными словами, в то время как средняя длина инструкции в x86 коде равна порядка 2.5—3.5 байт, при переходе в 64-битный режим она увеличивается из-за необходимости применения префикса REX. При её возрастании до более чем 4 байт, процессор может утратить свою способность выполнять 4 инструкции за такт.

Полностью аналогичный 32-битному код выполняется на процессорах Core 2 Duo лишь чуть медленнее из-за неработоспособности Macrofusion, а падение скорости работы при наличии в коде 64-битных операций, очевидно, будет компенсироваться дополнительными возможностями по работе с большим числом регистров и увеличением их разрядности.

Таблица 2.10

 

Core 2 Extreme

Pentium Ex-

Pentium Ex-

 

treme

treme

 

 

 

Core 2 Duo

Edition 9XX

Edition 8X

 

Pentium D 9XX

Pentium D 8X

 

 

Кодовое имя

Conroe/Allendale

Presler

Smithfield

Тактовая частота

1.86—2.93 ГГц

2.8—3.73 ГГц

2.8—3.2 ГГц

Микроархитектура

Core

NetBurst

NetBurst

83

Окончание табл. 2.10

 

Core 2 Extreme

Pentium Ex-

Pentium Ex-

 

treme

treme

 

 

 

Core 2 Duo

Edition 9XX

Edition 8X

 

Pentium D 9XX

Pentium D 8X

 

 

Технологический

65 нм

65 нм

90 нм

процесс

 

 

 

Корпус

LGA775

LGA775

LGA775

Частота сист ши-

1067 МГц

1067/800 МГц

800/533 МГц

ны

 

 

 

Число транзисто-

291 млн/167 млн

376 млн

230 млн

ров

 

 

 

Площадь кристал-

143

162 кв. мм

206 кв. мм

ла

кв. мм/111кв.мм

 

 

L1 кеш инструк-

2 x 32 Кбайт

2 х 12000 uops

2 x 12000 uops

ций

 

 

 

L1 кеш данных

2 x 32 Кбайт

2 x 16 Кбайт

2 x 16 Кбайт

L2 кеш

4096/2048 Кбайт

2 x 2048 Кбайт

2 x 1024 Кбайт

Технология Hyper-

 

Опционально, у

Опционально,

Threading

Нет

ХЕ

у ХЕ

 

 

моделей

моделей

Технология энер-

C1E, EIST

C1E, EIST

C1E, EIST

госбережения

 

 

 

64-битные расши-

EM64T

EM64T

EM64T

рения

 

 

 

Технология вир-

Есть(Vaderpool)

Опционально

Нет

туализации

 

(Vaderpool)

 

SIMD инструкции

SSE3

SSE3

SSE3

Энергопотребление

Энергопотребление по мнению Intel, в скором времени должно стать основным мерилом потребительских качеств процессоров.

При высокой производительности новые процессоры Intel, основанные на микроархитектуре Core, могут похвастать и блестящей экономичностью. Пока что им не видно реальных соперников и по этому параметру.

Процессоры Core 2 Duo сочетают высокую производительность и низкое энергопотребление. Pentium D, наоборот, имеют низкую производительность при высоком энергопотреблении.

84

Athlon 64 X2 пока что занимают промежуточную позицию. Однако данный результат, видимо, следует признать лишь предварительным. С намеченным на ближайшее время внедрением Energy Efficient процессоров AMD приведённая картинка, очевидно, претерпит значительные изменения.

Core 2Duo E6300 (1.86 GHz) 44

Core 2Duo E6400 (2.13 GHz) 50

Core 2Duo E6600 (2.4 GHz) 52

Core 2Duo E6700 (2.67 GHz) 59

Core Extreme X6800 (2.93 GHz) 65

Athlon 64 X2 3800+

(2.0 GHz)

 

 

82

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Athlon 64 X2 4200+

(2.2 GHz)

 

 

 

87

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

96

 

 

 

 

 

Athlon 64 X2 4600+

(2.4 GHz)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

Athlon 64 X2 5000+

(2.6 GHz)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Athlon 64 FX-62

(2.8 GHz)

 

 

 

 

 

 

 

 

 

130

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

145

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Pentium D 820

(2.8

GHz)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Pentium D 915

(2.8

GHz)

 

 

 

 

 

 

94

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Pentium D 945

(3.4

GHz)

 

 

 

 

 

 

 

109

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

126

 

 

Pentium XE 956 (3.73

GHz)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

50

100

150

200

Рис. 2.12 — Энергопотребление при полной загрузке процессоров

Рывок Intel спровоцировал падение цен на процессоры. Для наглядности восприятия новой ценовой политики ниже предлагается график, на котором стоимость процессоров и их усреднённый уровень быстродействия показан одновременно.

Почти все точки на графике практически точно ложатся на единую кривую. Это означает, что любой из двухъядерных процессоров имеет полностью оправданное соотношение цены и производительности. Иными словами, стоимость CPU вполне соответствует его быстродействию, несмотря на то, о каком из