55
Самым быстрым процессором Athlon XP стал Barton 3200+, оснащённый 512 Кбайт кэша L2. Линейка Athlon XP слишком расширилась, поэтому было решено вывести на рынок новую торговую марку — Sempron. Он имеет ту же архитектуру, что и стареющий Athlon XP.
Socket 940: с сентября 2003 по март 2004
Вероятно, Socket 940 прожил меньше всех других сокетов для настольных систем AMD. Первый 64-битный процессор от AMD для настольных ПК был представлен в сентябре 2003, после 18-месячной задержки. С этого момента AMD начинает терять репутацию производителя дешёвых процессоров.
Если Socket 754 предназначался для настольных ПК, то Socket 940, как планировалось, должен был стать уделом серверов и рабочих станций. Но из-за больших задержек производительности Socket 754 стало не хватать, поэтому пришлось срочно перебрасывать Socket 940 с двухканальной памятью на рынок настольных ПК. Довольно любопытно, но Athlon 64, поддерживающий SSE2, стал поставляться в керамической упаковке. В качестве особой функции, этот процессор имеет канал HyperTransport, позволяющий обмениваться информацией с чипсетом или другим CPU, — с пропускной способностью до 3,2 Гбайт/с.
Но, к большому сожалению пользователей, процессор работал только с регистровой памятью, а наличие плат оставляло желать лучшего. Для нового процессора были предложены два чип-
сета: nVidia nForce 3 150 и VIA K8T800. В марте 2004 вышел по-
следний Athlon64 FX для Socket 940. Оба процессора базируются на 130-нм технологии.
Socket 754: с сентября 2003 по июнь 2004
Когда Athlon 64 выходил на рынок, для Socket 754 были представлены три версии процессора: оригинальное ядро Clawhammer с 1 Мбайт кэша L2, то же самое ядро с уполовиненным кэшем и ядро Newcastle с 512 Кбайт кэша L2 и меньшей площадью кристалла. Начиная с 2005 года, к Socket 754 присоединятся и новые модели Sempron, но только с кэшем L2 256 Кбайт.
56
Все процессоры для Socket 754 используют одноканальный интерфейс памяти DDR400, в результате чего максимальная пропускная способность памяти составляет 3 Гбайт/с. А объём памяти свыше одного гигабайта может привести к ряду проблем. Процессоры работают с 200-МГц каналом HyperTransport, максимальное тепловыделение составляет 89 Вт, а тактовые частоты меняются от 1,8 до 2,4 ГГц. Дальнейший рост частоты для Socket 754 не планируется. На рынке присутствуют чипсеты от nVidia (nForce 3 150/250), VIA K8T800 и SiS 755 FX. Все процессоры из-
готавливаются по 130-нм техпроцессу.
Socket 939: с июня 2004
Socket 939 был введён в роли преемника Socket 940 для рынка настольных ПК. Пока здесь существуют четыре разных версии процессора. Ядро Newcastle производится по 130-нм техпроцессу и оснащено 512 Кбайт кэша L2, в то время как Athlon 64 3400+ является единственным ядром с 200-МГц каналом HyperTransport. Все остальные процессоры могут использовать более скоростной интерфейс 250 МГц, обеспечивающий передачу данных со скоростью 4 Гбайт/с. Кроме того, недавно появилось ядро Winchester. Оно оснащено 512 Кбайт кэша L2 и производится по 90-нм техпроцессу. Во многом благодаря технологии Cool'n'Quiet процессор Athlon смог обеспечить сенсационно минимальное тепловыделение — всего 3 Вт. При максимальной нагрузке оно возрастает до 33 Вт, что тоже весьма немного.
Четвёртой вариацией стал Athlon 64 FX на классическом ядре Clawhammer. Он производится для Socket 939 с частотами 2,4 и 2,6 ГГц — в виде FX-53 и FX-55. Эти очень дорогие процессоры оснащены 1 Мбайт кэша L2.
Некоторую путаницу внёс Athlon 64 4000+, идентичный FX53. Единственное отличие заключается в том, что множитель FX можно свободно менять (увеличивать и уменьшать), а у процессоров Athlon 64 его можно только уменьшать. Хорошей основой для повышения производительности стал двухканальный интерфейс небуферизованной памяти — у всех процессоров. AMD планирует и дальше развивать 90-нм технологии и в 2005 году представила двуядерные процессоры.
|
|
57 |
|
|
|
Таблица 1 — История развития CPU |
|
|
|||
|
|
|
|
|
|
|
Год |
Модель CPU |
|
Шины дан- |
Частота, MHz |
|
|
ные/адрес, bit |
|||
|
|
|
|
|
|
|
1970 |
4004 |
|
4/4 |
|
|
1973 |
8008 |
|
8/8 |
2 |
|
1974 |
8080 |
|
8/8 |
|
|
1978 |
8086(7) |
|
16/20 |
4.77 / 8 |
|
1979 |
8088 |
|
16/8 |
4.77 |
|
1980 |
186/188 |
|
16/16/8 |
4.77 |
|
1981 |
286 |
|
16/20 |
6—8—20 |
|
1985 |
386DX |
|
32/32 |
40 |
|
1986 |
386SX |
|
16/24 |
16—33 |
|
1987 |
386SL |
|
32/32 |
25 |
|
1989 |
486DX |
|
32/32 |
25—50 |
|
1991 |
486SX |
|
32/32 |
16—33 |
|
1992 |
486DX2 |
|
32/32 |
23—80 |
|
1993 |
486DX4 |
|
32/32 |
40—120 |
|
1993 |
Pentium |
|
64/32 |
60—200 |
|
1995 |
Pentium Pro |
|
64/36 |
150—200 |
|
1997 |
Pentium II |
|
64/36 |
233—600 |
|
1998 |
AMD K6 |
|
64/36 |
233—500 |
|
1998 |
Pentium II Xeon |
|
64/36 |
400—500 |
|
1998 |
Celeron |
|
64/36 |
266—1100 |
|
1999 |
Pentium III |
|
64/36 |
533—1260 |
|
1999 |
Pentium III Xeon |
|
64/36 |
500—900 |
|
|
|
|
|
|
|
1999 |
AMD K7 Athlon |
|
64/36 |
600—1100 |
|
2000 |
AMD Athlon, Duron |
|
64/36 |
600—1400 |
|
|
|
|
|
|
|
2001 |
Athlon XP |
|
64/36 |
1200—1800 |
|
2001 |
Pentium 4 |
|
64/36 |
1400—2530 |
|
2002 |
Pentium 4 Celeron |
|
64/36 |
>1700 |
|
|
|
|
|
|
2.2 Двухъядерные процессоры
Внедрение двухъядерности — это ещё один, весьма очевидный, путь увеличения производительности CPU. Поскольку в общем случае производительность представляет собой произведение частоты процессора на количество выполняемых им инструкций за один такт, внедрение двухъядерной архитектуры способно поднять эту характеристику вдвое, так как добавление вто-
58
рого ядра увеличивает в два раза число исполнительных устройств.
Внедрению двухъядерных архитектур объясняется тем, что иные методы для наращивания производительности себя уже исчерпали. Рост тактовых частот даётся очень тяжело, а увеличение скорости шины и размера кэш-памяти не приводит к ощутимому результату. В то же время совершенствование 90 нм технологического процесса дошло да той точки, когда производство гигантских кристаллов с площадью порядка 200 кв.мм стало рентабельным. Именно этот факт дал возможность производителям CPU начать кампанию по внедрению двухъядерных архитектур.
Двухъядерные процессоры представляют собой два расположенных на одной кремниевой пластине полноценных процессорных ядра с полным набором ресурсов, в том числе с кэшпамятью первого уровня (L1). Кэш-память второго уровня (L2) может быть раздельной для каждого ядра или общей для обоих ядер. На той же подложке может располагаться контроллер шины памяти, контроллер межъядерных коммуникаций, коммутатор и т.п. Многочисленные тестирования показывают преимущества двухъядерных процессоров над одноядерными в ряде задач, поддерживающих многопоточную работу.
2.2.1Двухъядерное процессорное ядро Smithfield (Intel) (Pentium D; Pentium Extreme Edition 840)
Процессорное ядро Smithfield представляет собой конкатенацию двух ядер Prescott с архитектурой NetBurst, выполненную на одном полупроводниковом кристалле. Также, на это же кристалл помещается и арбитр, позволяющий двум CPU разделять между собой процессорную шину. То есть, фактически, всё взаимодействие между ядрами в Smithfield происходит только на уровне системной шины. Поскольку процессорные ядра Prescott и Prescott-2M имеют крайне небольшой запас по тактовым частотам, ограниченный сверху величиной 4 ГГц, так что тактовая частота процессоров на ядре Smithfield сильно понижена по сравнению с максимальными частотами процессоров в одноядерных линейках. Встает выбор между реальной многопоточностью (на заниженных частотах) и высокими тактовыми частотами.
59
Следствием такого объединения стало удвоение размеров процессорного ядра Smithfield по сравнению я процессорным ядром Prescott. Так, число транзисторов в двухъядерных процессорах Intel равно 230 млн, а площадь ядра составляет 206 кв. мм.
Суммарный размер его кеш-памяти второго уровня составляет 2 Мбайта. Однако эта кеш-память разделяется пополам между двумя ядрами таким образом, что каждое из них оперирует с собственным мегабайтным L2 кешем.
Smithfield наследует от Prescott весь спектр технологий, включая поддержку 64-битных расширений EM64T, технологию безопасности Execute Disable Bit, а также полный набор средств Demand Based Switching для управления тепловыделением и энергопотреблением, включающий технологии C1E, TM2 и
EIST.
Execution |
Execution |
Core |
Core |
1 MB L2 |
1 MB L2 |
Cache |
Cache |
Bus 1/F |
Bus 1/F |
MCH FSB |
|
Рис. 2.1 |
|
Объединение двух ядер на одном кристалле приводит к значительному росту характеристик тепловыделения и энергопотребления процессоров, поэтому, двухъядерные процессоры Smithfield имеют гораздо более низкую тактовую частоту, чем CPU, основанные на ядрах Prescott.