Материал: 835

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

55

Самым быстрым процессором Athlon XP стал Barton 3200+, оснащённый 512 Кбайт кэша L2. Линейка Athlon XP слишком расширилась, поэтому было решено вывести на рынок новую торговую марку — Sempron. Он имеет ту же архитектуру, что и стареющий Athlon XP.

Socket 940: с сентября 2003 по март 2004

Вероятно, Socket 940 прожил меньше всех других сокетов для настольных систем AMD. Первый 64-битный процессор от AMD для настольных ПК был представлен в сентябре 2003, после 18-месячной задержки. С этого момента AMD начинает терять репутацию производителя дешёвых процессоров.

Если Socket 754 предназначался для настольных ПК, то Socket 940, как планировалось, должен был стать уделом серверов и рабочих станций. Но из-за больших задержек производительности Socket 754 стало не хватать, поэтому пришлось срочно перебрасывать Socket 940 с двухканальной памятью на рынок настольных ПК. Довольно любопытно, но Athlon 64, поддерживающий SSE2, стал поставляться в керамической упаковке. В качестве особой функции, этот процессор имеет канал HyperTransport, позволяющий обмениваться информацией с чипсетом или другим CPU, — с пропускной способностью до 3,2 Гбайт/с.

Но, к большому сожалению пользователей, процессор работал только с регистровой памятью, а наличие плат оставляло желать лучшего. Для нового процессора были предложены два чип-

сета: nVidia nForce 3 150 и VIA K8T800. В марте 2004 вышел по-

следний Athlon64 FX для Socket 940. Оба процессора базируются на 130-нм технологии.

Socket 754: с сентября 2003 по июнь 2004

Когда Athlon 64 выходил на рынок, для Socket 754 были представлены три версии процессора: оригинальное ядро Clawhammer с 1 Мбайт кэша L2, то же самое ядро с уполовиненным кэшем и ядро Newcastle с 512 Кбайт кэша L2 и меньшей площадью кристалла. Начиная с 2005 года, к Socket 754 присоединятся и новые модели Sempron, но только с кэшем L2 256 Кбайт.

56

Все процессоры для Socket 754 используют одноканальный интерфейс памяти DDR400, в результате чего максимальная пропускная способность памяти составляет 3 Гбайт/с. А объём памяти свыше одного гигабайта может привести к ряду проблем. Процессоры работают с 200-МГц каналом HyperTransport, максимальное тепловыделение составляет 89 Вт, а тактовые частоты меняются от 1,8 до 2,4 ГГц. Дальнейший рост частоты для Socket 754 не планируется. На рынке присутствуют чипсеты от nVidia (nForce 3 150/250), VIA K8T800 и SiS 755 FX. Все процессоры из-

готавливаются по 130-нм техпроцессу.

Socket 939: с июня 2004

Socket 939 был введён в роли преемника Socket 940 для рынка настольных ПК. Пока здесь существуют четыре разных версии процессора. Ядро Newcastle производится по 130-нм техпроцессу и оснащено 512 Кбайт кэша L2, в то время как Athlon 64 3400+ является единственным ядром с 200-МГц каналом HyperTransport. Все остальные процессоры могут использовать более скоростной интерфейс 250 МГц, обеспечивающий передачу данных со скоростью 4 Гбайт/с. Кроме того, недавно появилось ядро Winchester. Оно оснащено 512 Кбайт кэша L2 и производится по 90-нм техпроцессу. Во многом благодаря технологии Cool'n'Quiet процессор Athlon смог обеспечить сенсационно минимальное тепловыделение — всего 3 Вт. При максимальной нагрузке оно возрастает до 33 Вт, что тоже весьма немного.

Четвёртой вариацией стал Athlon 64 FX на классическом ядре Clawhammer. Он производится для Socket 939 с частотами 2,4 и 2,6 ГГц — в виде FX-53 и FX-55. Эти очень дорогие процессоры оснащены 1 Мбайт кэша L2.

Некоторую путаницу внёс Athlon 64 4000+, идентичный FX53. Единственное отличие заключается в том, что множитель FX можно свободно менять (увеличивать и уменьшать), а у процессоров Athlon 64 его можно только уменьшать. Хорошей основой для повышения производительности стал двухканальный интерфейс небуферизованной памяти — у всех процессоров. AMD планирует и дальше развивать 90-нм технологии и в 2005 году представила двуядерные процессоры.

 

 

57

 

 

Таблица 1 — История развития CPU

 

 

 

 

 

 

 

 

 

Год

Модель CPU

 

Шины дан-

Частота, MHz

 

 

ные/адрес, bit

 

 

 

 

 

 

1970

4004

 

4/4

 

 

1973

8008

 

8/8

2

 

1974

8080

 

8/8

 

 

1978

8086(7)

 

16/20

4.77 / 8

 

1979

8088

 

16/8

4.77

 

1980

186/188

 

16/16/8

4.77

 

1981

286

 

16/20

6—8—20

 

1985

386DX

 

32/32

40

 

1986

386SX

 

16/24

16—33

 

1987

386SL

 

32/32

25

 

1989

486DX

 

32/32

25—50

 

1991

486SX

 

32/32

16—33

 

1992

486DX2

 

32/32

23—80

 

1993

486DX4

 

32/32

40—120

 

1993

Pentium

 

64/32

60—200

 

1995

Pentium Pro

 

64/36

150—200

 

1997

Pentium II

 

64/36

233—600

 

1998

AMD K6

 

64/36

233—500

 

1998

Pentium II Xeon

 

64/36

400—500

 

1998

Celeron

 

64/36

266—1100

 

1999

Pentium III

 

64/36

533—1260

 

1999

Pentium III Xeon

 

64/36

500—900

 

 

 

 

 

 

 

1999

AMD K7 Athlon

 

64/36

600—1100

 

2000

AMD Athlon, Duron

 

64/36

600—1400

 

 

 

 

 

 

 

2001

Athlon XP

 

64/36

1200—1800

 

2001

Pentium 4

 

64/36

1400—2530

 

2002

Pentium 4 Celeron

 

64/36

>1700

 

 

 

 

 

 

2.2 Двухъядерные процессоры

Внедрение двухъядерности — это ещё один, весьма очевидный, путь увеличения производительности CPU. Поскольку в общем случае производительность представляет собой произведение частоты процессора на количество выполняемых им инструкций за один такт, внедрение двухъядерной архитектуры способно поднять эту характеристику вдвое, так как добавление вто-

58

рого ядра увеличивает в два раза число исполнительных устройств.

Внедрению двухъядерных архитектур объясняется тем, что иные методы для наращивания производительности себя уже исчерпали. Рост тактовых частот даётся очень тяжело, а увеличение скорости шины и размера кэш-памяти не приводит к ощутимому результату. В то же время совершенствование 90 нм технологического процесса дошло да той точки, когда производство гигантских кристаллов с площадью порядка 200 кв.мм стало рентабельным. Именно этот факт дал возможность производителям CPU начать кампанию по внедрению двухъядерных архитектур.

Двухъядерные процессоры представляют собой два расположенных на одной кремниевой пластине полноценных процессорных ядра с полным набором ресурсов, в том числе с кэшпамятью первого уровня (L1). Кэш-память второго уровня (L2) может быть раздельной для каждого ядра или общей для обоих ядер. На той же подложке может располагаться контроллер шины памяти, контроллер межъядерных коммуникаций, коммутатор и т.п. Многочисленные тестирования показывают преимущества двухъядерных процессоров над одноядерными в ряде задач, поддерживающих многопоточную работу.

2.2.1Двухъядерное процессорное ядро Smithfield (Intel) (Pentium D; Pentium Extreme Edition 840)

Процессорное ядро Smithfield представляет собой конкатенацию двух ядер Prescott с архитектурой NetBurst, выполненную на одном полупроводниковом кристалле. Также, на это же кристалл помещается и арбитр, позволяющий двум CPU разделять между собой процессорную шину. То есть, фактически, всё взаимодействие между ядрами в Smithfield происходит только на уровне системной шины. Поскольку процессорные ядра Prescott и Prescott-2M имеют крайне небольшой запас по тактовым частотам, ограниченный сверху величиной 4 ГГц, так что тактовая частота процессоров на ядре Smithfield сильно понижена по сравнению с максимальными частотами процессоров в одноядерных линейках. Встает выбор между реальной многопоточностью (на заниженных частотах) и высокими тактовыми частотами.

59

Следствием такого объединения стало удвоение размеров процессорного ядра Smithfield по сравнению я процессорным ядром Prescott. Так, число транзисторов в двухъядерных процессорах Intel равно 230 млн, а площадь ядра составляет 206 кв. мм.

Суммарный размер его кеш-памяти второго уровня составляет 2 Мбайта. Однако эта кеш-память разделяется пополам между двумя ядрами таким образом, что каждое из них оперирует с собственным мегабайтным L2 кешем.

Smithfield наследует от Prescott весь спектр технологий, включая поддержку 64-битных расширений EM64T, технологию безопасности Execute Disable Bit, а также полный набор средств Demand Based Switching для управления тепловыделением и энергопотреблением, включающий технологии C1E, TM2 и

EIST.

Execution

Execution

Core

Core

1 MB L2

1 MB L2

Cache

Cache

Bus 1/F

Bus 1/F

MCH FSB

Рис. 2.1

Объединение двух ядер на одном кристалле приводит к значительному росту характеристик тепловыделения и энергопотребления процессоров, поэтому, двухъядерные процессоры Smithfield имеют гораздо более низкую тактовую частоту, чем CPU, основанные на ядрах Prescott.