Pull to refresh

Comments 15

Разве в те времена кто-то задумывался об энергопотреблении? Альфа была в начале 90х для серверных систем. Это не телефоны, это не ноутбуки. При чем тут энергопотребление? Эта хорошая архитектура увы сошла со сцены по иным причинам

На фоне сменившего Альфу в качестве альтернативного высокопроизводительного процессора Итаниума (известного в народе как "Итаник") энергопотребление Альфы было очень даже неплохое :)

Согласен, и 200МГц в середине 90х - это всегда та ещё печка, техпроцессы 0.35, а зачастую 0.5 и выше. первые материалы на кафедре по альфе я видел, боюсь лажануть, но, в районе 1994-1996 года. И тот же ППро жрал не меньше, при таких же или чуть меньших частотах (3*60/66=180/200MHz).

Да и это для ДЕКа был первенец в виде одночипового решения изначально, так как все предыдущие, включая ВАКС-11 были процессорными платами, набранными из м/с малой и средней логики.

Позже, когда стало сложно отводить тепло, стали загоняться с теми методами, что озвучил уважаемый Юрий - отключение от клока неиспользуемых блоков, понижение напряжения, это уже было тогда на П-ММХ, и другие методы уменьшения сквозных токов.

А у Альфы, я не помню какую держал в руках 21064, встроенный медный радиатор с двумя выступающими пеньками для фиксации кулеров.

А сколько жрут высокопроизводительные процессоры для настольных компьютеров и серверов сейчас... ниже пишут по 8 и 20 Ватт а сейчас уже 300 Ватт становится нормой нормой, подбираемся к 500. Четко видно по размерам охлаждения, причем не скажешь, что в охлаждении какие-то принципиально новые технологии.

сейчас много загоняются отключением неиспользуемых блоков и распараллеливание, чтобы они не простаивали. понижают до беспредела напругу, уже и 1.2 много. как на кремневых переходах делать переключение на 1.5-2 напряжения отпирания pn-перехода...
Да и тогда были больше ТТЛ(ш) логика, позже всё чаще использовалась разная CMOS.
скорее всего какие-то эксперименты с запретной зоной.

Ну я участвовал три года назад в дизайне роутерного чипа, который жрал сотни ватт, но в нем миллиарды транзисторов, а в Альфе было на три порядка меньше.

Во времена Alpha (середина 1990-х) эти трюки не считались важными, дизайнеры их не использовали, и это вероятно главная причина, почему Alpha жрала больше чем могла бы для своей частоты и техпроцесса.

Clock-gating в какой-то форме всё же был в Alpha. Есть статейка интересная на тему устройства клоков в этих процессорах (в открытом доступе тоже гуглится).

2) Почему они сказали что сделать low-power невозможно, они про их конкретную микроархитектурную реализацию?

Имхо, Alpha очень богата трюками, даже слишком. Мне кажется, проблема с переделкой Alpha в том, что многое на самом низком уровне (та же сеть клоков) рождено своими кустарными алгоритмами до нормальных EDA. Эти алгоритмы порождают серию допущений и предположений, на которых строится вся дальнейшая реализация. Поэтому возможно на других допущениях такая производительная вещь не соберётся.

Кроме того, этот процессор многими вещами заточен на высокую производительность, есть ощущение, что его целиком выстрадали под эту цель, на всех уровнях. Переделка под другие цели даст что-то среднее.

А ведь была и версия 21068 с низким потреблением и интегрированным северным мостом, кушала она, если не ошибаюсь 8 Вт супротив 20+ у обычной 21064. Да и 21066 не сильно горячая была, хотя порезана не то чтобы сильно.

да, но когда они появились и вследствии чего появились?

Чтобы их Альфы получить АRM того времени, нужно было бы перейти на 32 разряда, убрать FPU , да еще и умножение сделать через сложение. Это как из авто делать велосипед. Проще взять у кого-то образец велосипеда и сделать из него хороший велик.

Убрать FPU и блок умножения нетрудно. Переделать блок умножения из быстрого в итеративный чуть труднее. Менять разрядность труднее, да, но это ли имели в виду инженеры, которые говорили про "невозможно"? Может быть главным фактором было то, что это был full custom design (не синтезируемый из верилога ASIC) в который было трудно вставлять clock gating? Какой из факторов был главнее?

В
В

В какой версии Альфы с учетом одинакового техпроцесса можно с помощью "clock gating " уменьшить потребление до 550 мА?

Чтобы отвечать в абсолютных цифрах, мне нужно иметь на руках:

  1. RTL код для Альфы и ARM того времени. Учитывая, что Alpha - это custom design, в нем могут быть большие блоки, которые не синтезированы из HDL, так как синтез внедрялся в индустрии в 1988-1993 годах.

  2. Synopsys PrimeTime PX софтвер для оценки динамического энергопотребления.

  3. Набор тестов для Альфы и Арма, на которых применять PTPX.

Иначе я не умею.

А насчет не-абсолютных цифер, архитектура Альфы (система команд, не путать с микроархитектурой, устройством конвейера) ничем принципиально не отличается от архитектуры других RISC-процессоров, MIPS64, 64-битных вариантов ARM и PowerPC.

Поэтому при сходной микроархитектурной реализации (при сходной структуре конвейера), с применением сходных приемов многоуровневого clock gating-а и иногда раздельных power domains - результаты должны быть похожи.

Кстати FPU можно не удалить, а просто сделать его отдельным power domain, и отключать у него питание когда он не используется, просто по записи софтвером в конфигурационный регистр.

Понятно, что если мерять 64-битный против 32-битного, то да, разница в power будет значительна. Возможно это и было источником заключения "невозможно", но возможно в этом сыграли роль и 2) custom design (не синтезируемый из ASIC standard cells) 3) отсутствие с самого начала усилий по тому чтобы сделать дизайн low power через gated clocks и power domains.

Мой вопрос собственно о соотношении причин 1) 2) 3).

архитектура Альфы ничем принципиально не отличается от архитектуры 64-битных вариантов ARM Поэтому при сходной микроархитектурной реализации

Вы уже забыли , что вопрос был про StrongARM. :)

FPU можно не удалить, а просто сделать его отдельным power domain, и отключать у него питание когда он не используется

Звучит красиво :)

Sign up to leave a comment.

Articles