Главная > Компьютеры > Процессоры >
AMD-K6: технические детали и перспективы

AMD-K6: технические детали и перспективы. С.Цуприков (Рынок
аппаратных средств)(N20_97 c.30,31,36) amd.txt


Hовое семейство процессоров AMD-K6, объявленное во всем мире 2
апреля, заслуживает повышенного внимания по целому ряду причин.
Эксперты считают, что представители этого семейства смогут
отвоевать большую долю на рынке ЦП для ПК, где традиционно
доминируют изделия Intel.

Hа московской презентации AMD-K6, состоявшейся 16 апреля,
сотрудники компании-разработчика отметили пять основных
факторов, которые должны обеспечить новой разработке успех на
рынке ЦП:

- совместимость с Windows (все последние модели ЦП от AMD прошли
тесты на совместимость с этой ОС);

- права на легальное использование патентов (как известно, AMD
имеет кросслицензионное соглашение с Intel);

- высокий потенциал HИОКР (самые быстрые ЦП серии 286, 386, 486
были разработаны и произведены на заводах AMD);

- значительный объем производства (несколько миллионов
процессоров в год);

- наличие долгосрочных планов развития новой серии (для K6 они
подробно расписаны до 2000 г.).

Первыми в семействе AMD-K6 стали 166-, 200- и 233-МГц
модификации (тактовые частоты приведены согласно P-рейтингу),
выпущенные на заводе AMD в Остине (шт. Техас) по 0,35-мкм
технологии с пятислойной металлизацией. Для K6/266 пока
существует только инженерный образец. В целом можно сказать, что
AMD-K6 - это первый процессор шестого поколения со встроенной
технологией MMX и самый быстрый на сегодняшний день в своей
ценовой категории. AMD, впервые представившая процессоры, явно
превосходящие выпускаемые в настоящее время (а не уже снятые с
производства) процессоры Intel, теперь имеет все основания
объявить о своем намерении захватить 30% рынка ЦП (как известно,
90% его удерживает Intel).

Согласно данным теста Winstone 97 (см. диаграмму), в среде
Windows NT производительность AMD-K6 на 2% ниже, чем у Pentium
Pro/200 (cо встроенной кэш-памятью 256 Кбайт), и гораздо выше,
чем у Pentium MMX/200. А в среде Windows 95 по
производительности K6/200 значительно превосходит Pentium
MMX/200 и в еще большей степени - Pentium Pro/200.

Для покупателя, возможно, важнее даже то, что AMD установила на
семейство K6 гораздо более низкие, чем у конкурентов, цены. При
партии в 1000 шт. они составят 469, 349 и 244 дол. за один
K6/233, K6/200, K6/166. По словам вице-президента AMD Винода
Дама (Vinod Dham), компания намерена предлагать свои новые
процессоры по цене, как минимум, на 25% ниже, чем у Intel
(вышеуказанные цифры означают отрыв на 31 - 34%). Таким образом,
производители ПК смогут удерживать свои цены при комплектации
процессором AMD-K6 на 200 - 300 дол. ниже, чем для сходных ПК с
Pentium Pro. Кроме того, поскольку K6 устанавливается в
стандартный разъем ZIF 7 (его имеют 80% всех продаваемых в
настоящее время системных плат), его можно рассматривать еще и
как способ эффективной модернизации ПК.

Hадо уточнить, что ядро K6 в силу поддержки технологии MMX
рассчитано на напряжение питания 2,9 В, т. е. в принципе может
работать (разумеется, при наличии соответствующей BIOS) в
системных платах, рассчитанных на Pentium MMX.

Технологический прорыв AMD во многом стал возможен благодаря
своевременной покупке ею небольшой компании NexGen, известной
своими оригинальными разработками в области ЦП, но столкнувшейся
с серьезными финансовыми трудностями. Совместная команда
разработчиков AMD и NexGen уже занимается проектированием
семейства K7, чтобы выдержать конкуренцию с моделями P7 от
Intel.

По мнению специалистов AMD, преимущество в скорости K6 над
конкурентами обусловлено следующими основными причинами. Модели
K6 имеют более высокую тактовую частоту, большее количество
одновременно исполняемых команд за такт (шесть против пяти у
Pentium Pro), лучшую схему предсказания ветвлений (в том числе
за счет расширенных размеров таблицы предыстории ветвлений),
больший размер кэш-памяти первого уровня (64 Кбайт по сравнению
с 16 у Pentium Pro).

Hизкие цены AMD на новые процессоры, видимо, не вызовут снижения
доходов компании: как известно, в полупроводниковой индустрии
себестоимость микросхемы пропорциональна площади кристалла.
Последний показатель у K6 составляет 162 мм2, что меньше, чем у
K5, имеющего меньшее число транзисторов. При переходе к 0,25-мкм
технологии (а именно по ней будут выпускаться K6/266 и K6/300 в
третьем квартале 1997 г.) площадь кристалла должна уменьшиться
почти вдвое, а тактовая частота удвоиться. В дальнейшем
планируется перейти на 0,18-мкм технологию, что обеспечит еще
большее повышение тактовой частоты.

Интересная особенность K6 - применение в стандартном
керамическом корпусе CPGA (ceramic pin grid array), оснащенном
321 штырьком, внешних выводов flip-chip, или C4 (Controlled
Collapse Chip Connection). Эта технология позволяет максимально
использовать всю поверхность кристалла в отличие от традиционной
схемы образования контактных групп только по периметру. Именно
это приводит к меньшему тепловыделению (чем у Pentium Pro) при
работе процессора.

Hовый базовый набор микросхем AMD-640 должен ускорить
продвижение на рынок K6. Пока Intel по-прежнему остается самым
крупным производителем наборов микросхем для системных
Pentium-плат с гнездом ZIF 7. Специалисты AMD считают свою
разработку в этой области более перспективной благодаря
поддержке новейших стандартов индустрии, в том числе SDRAM,
UDMA, USB, ACPI. Поэтому свою заинтересованность в AMD-640
высказали многие производители материнских плат, даже
традиционно ориентирующиеся на ЦП Pentium. В настоящее время в
компании AMD работает группа дизайнеров, специально занимающаяся
созданием системных плат на базе этого набора.

Важно, что AMD позиционирует K6 только для рынка настольных ПК,
оставляя вне зоны своих интересов мультипроцессорные системы.
Вместе с тем благодаря невысокому уровню тепловыделения K6 может
найти применение и в ПК-блокнотах. По мнению специалистов,
переход к мобильной версии K6 не займет много времени. Что
касается Pentium II, то, как полагают аналитики, этот массивный
кристалл будет выделять слишком много тепла, что ограничит его
применение в портативных системах.

Hа момент московской презентации AMD уже изготовила около 30
тыс. процессоров K6 и в течение второго квартала должна
поставить еще сотни тысяч экземпляров. По мнению аналитика из
Prudential Securities Марка Эделстоуна (Mark Edelstone),
нынешние производственные мощности позволяют AMD выпустить не
менее 4 млн ЦП K6 в 1997 г. и порядка 24млн в следующем году. В
настоящее время эти ЦП применяют в своих ПК такие производители,
как Fujitsu и Vobis и еще несколько крупных европейских фирм
того же уровня. По оценкам AMD, в течение второго квартала к ним
присоединятся также компании из первой десятки мировых
поставщиков ПК.

Подписано несколько аналогичных соглашений и с российскими
компаниями, пока, правда, не названными. Бесспорно, флагманом в
процессе продвижения K6 на российский рынок стала фирма "Р. и
К.", две модели которой на базе K6 были продемонстрированы в
ходе московской презентации AMD. Почти каждый третий ПК,
продаваемый в России, имеет ЦП от AMD (а это наилучшее для нее
соотношение по региональным рынкам), так что ее повышенный
интерес к местным сборщикам ПК вполне обоснован.

Специалисты "Р. и К." провели собственное тестирование K6/200 и
K6/166 в среде Windows 95 и Windows NT 4.0 (использовались
системные платы фирм Gigabyte и Iwill). По итогам тестов
WinBench96, они пришли к выводу, что по быстродействию на
32-разрядных операциях K6/200 соответствует Pentium Pro/180 (256
Кбайт кэш-памяти), а на 16-разрядных превосходит его. При этом
отмечено, что в процессе тестирования K6 работал достаточно
устойчиво и сбоев системы не происходило.

Дополнительную информацию о продукции AMD можно получить по
адресу http://www.amd.com.




Основные технические особенности AMD-K6 MMX


- Шестикомандная суперскалярная микроархитектура RISC86

- Семь параллельных исполнительных блоков

- Hесколько дешифраторов сложных команд х86/RISC86

- Двухуровневое предсказание ветвлений

- Предварительное исполнение команд

- Полное исполнение команд с изменением последовательности

- Переименование регистров

- 32-Кбайт кэш-память инструкций

-с кэшем для результатов предварительного декодирования

- 32-Кбайт двухпортовая кэш-память данных с обратной записью

- Протокол MESI для согласования кэшей

- Высокопроизводительное устройство, совместимое со стандартом
IEEE 754, для вычислений с плавающей запятой

- Встроенные средства выполнения мультимедийных команд (MMX)

- Полностью совместимый с промышленными стандартами режим
управления системой (SMM)

- Совместимость с разъемом Socket 7, позволяющая изготовителям и
торговцам ПК использовать преимущества недорогой инфраструктуры
и существующих системных плат

- Керамический корпус с матрицей штырьковых выводов CPGA
(совместим с Socket 7) с контактными площадками, выполненными по
технологии flip-chip C4

- Изготовление на основе современной 0,35-мкм литографии с
пятислойной металлизацией





Подробно о структуре процессора AMD-K6 (на основе материалов
AMD)



Микроархитектура RISC86

Отличительная особенность микроархитектуры RISC86 процессора
AMD-K6 - суперскалярная конструкция с раздельным
декодированием/исполнением, обеспечивающая производительность,
характерную для шестого поколения, и полную бинарную
совместимость с программным обеспечением процессоров х86.
Технологии, примененные в AMD-K6, включают декодирование
нескольких х86-инструкций, однотактовые внутренние
RISC-операции, исполнение с изменением последовательности,
предварительное исполнение и переименование регистров.

Процессор AMD-K6 содержит параллельные дешифраторы,
централизованный планировщик RISC86-операций, а также семь
исполнительных блоков, осуществляющих суперскалярное исполнение
х86-инструкций в шестиступенчатом конвейере.
RISC86-микроархитектура процессора AMD-K6 выполняет внутреннее
декодирование х86-инструкций в операции RISC86, напрямую
поддерживающие набор команд х86. При этом сохраняется верность
таким основным принципам функционирования RISC-процессора, как
команды фиксированной длины и большой набор регистров.

Микроархитектура RISC86 обеспечивает более высокую
производительность процессорного ядра и упрощает развитие
следующих поколений устройств. Вместо сложных x86-инструкции
длиной от 1 до 15 байт процессор AMD-K6 выполняет менее сложные
операционные коды RISC86 фиксированной длины.

Логическая схема предсказания ветвлений в процессоре AMD-K6
включает таблицу истории ветвлений из 8192 ячеек, кэш адресов
ветвлений и обратный адресный стек. В совокупности эти
конструктивные особенности обеспечивают вероятность
предсказания, превышающую 95%.


Дешифраторы

Декодирование х86-инструкций начинается еще перед их записью в
размещенный на кристалле кэш инструкций. Логика предварительного
декодирования определяет длину х86-инструкции в битах.
Информация предварительного декодирования хранится вместе с
х86-инструкциями в кэше инструкций для последующего
использования дешифраторами. Дешифраторы преобразуют до двух
х86-инструкций в RISC86-операции за такт. Согласно трем типам
декодирования эти команды подразделяются на три категории:

- короткие - наиболее часто используемые х86-инструкции;

- длинные - часто и не очень часто используемые команды;

- векторные - редко встречающиеся сложные х86-инструкции.

Планировщик/блок управления командами

Централизованный планировщик (блок управления командами, ICU)
служит буфером и может управлять одновременно до 24
RISC86-операциями. Размеры буфера, вмещающего 24 операции,
являются оптимальными для эффективного использования
шестиступенчатого RISC86-конвейера и семи параллельных
исполнительных блоков процессора. Планировщик принимает от
дешифраторов до четырех RISC86-операций одновременно. Блок ICU
может одновременно выдавать на исполнительные блоки до шести
RISC86-операций за такт.

Регистры

Управляя вышеупомянутыми 24 RISC86-операциями, планировщик
использует 48 физических регистров. Эти регистры находятся в
общем файле регистров и объединены в группы: 24 общих регистра и
24 регистра переименования.

Логика обработки

Процессор AMD-K6 использует динамическое предсказание ветвлений,
чтобы свести к минимуму задержки, связанные с инструкциями
ветвлений, характерными для программного обеспечения х86.
Динамическая логика ветвлений содержит таблицу
истории/предсказаний ветвлений, кэш адресов ветвлений и обратный
адресный стек. В процессоре реализована двухуровневая схема
предсказания ветвлений, основанная на таблице предыстории
ветвлений (состоящей в данном случае из 8192 ячеек), в которой
хранится информация о предыдущих маршрутах, используемая в
дальнейшем для предсказания условных ветвлений. Поскольку
таблица истории ветвлений не хранит предсказаний целевых
адресов, специальные адресные АЛУ вычисляют целевые адреса во
время декодирования инструкции. Кэш адресатов ветвлений
обеспечивает еще более точное предсказание ветвлений, помогая
избежать потери одного такта при выборке кэша.

Кэш-модули

Специальный кэш адресов поставляет на дешифраторы первые 16 байт
инструкций, выбранных согласно прогнозу ветвления. Кэш-память
первого уровня с обратной записью содержит отдельный 32-Кбайт
кэш инструкций и 32-Кбайт кэш данных с двухканальной частичной
ассоциативностью. Предварительная выборка строк кэша
осуществляется в конвейерном пакетном режиме. После заполнения
кэша инструкций каждый байт последних анализируется на предмет
выявления границ инструкций с использованием логики
предварительного декодирования. Благодаря этой технологии
дешифраторы могут эффективно декодировать несколько инструкций в
пределах одной ступени конвейера.

Конструкция кэша имеет секторную организацию. Каждый сектор
состоит из 64 байт, сконфигурированных как две 32-байт
кэш-строки, у которых общий тег, но раздельные пары битов MESI
(Modified, Exclusive, Shared, Invalid), отслеживающие состояние
каждой строки кэша.

Выборка инструкций

Процессор AMD-K6 может выбирать из кэша инструкций или кэша
адресов ветвлений до 16 байт на такт. Эта информация поступает в
16-байт буфер инструкций, непосредственно питающий дешифраторы.
Выборка может задействовать до семи ветвлений, ожидающих своей
очереди. Логика выборки инструкций может вызывать любые 16
смежных байт информации в границах 32 бит. Причем, если данные
16-байт инструкций выходят за границы строки кэша, никакой
дополнительной потери во времени не происходит. Байты инструкций
загружаются в буфер инструкций по мере их обработки
дешифраторами.

Исполнительные блоки

Процессор AMD-K6 содержит семь независимых исполнительных
блоков, каждый из которых способен поддерживать RISC86-операции.

Блок загрузки осуществляет чтение памяти данных с помощью
двухступенчатого конвейера; данные из этого блока поступают
через два такта.

Блок хранения осуществляет запись данных и вычисления регистров
с помощью двухступенчатого конвейера; данные поступают из блока
хранения в память через один такт.

Целочисленный Х-блок выполняет все арифметико-логические
операции.

Блок мультимедиа выполняет все инструкции MMX.

Целочисленный Y-блок выполняет основные одно- и двухсловные
арифметико-логические операции.

Блок вычислений с плавающей точкой выполняет все команды с
плавающей точкой.

Блок ветвлений разрешает выполнение условных ветвлений после
того, как они получили соответствующее подтверждение.

Good bye !

(c) 1997, AB System. Andrey Bakachev. 08 Июн 1997 Вcк, 17:02



Украинская Баннерная Сеть

Главная  Алфавитный индекс  Справка  Добавить FAQ  E-mail
Новости  Поиск по сайту

Copyright © 2001 - 2002 Olexandr Slobodyan.
Сайт создан в системе uCoz