AMD в секретной презентации пообещала Radeon Instinct MI100, который превзойдет NVIDIA A100. Надо только подождать
Предполагаемые показатели производительности и детали об ускорителе Radeon Instinct MI100 на базе архитектуры CDNA следующего поколения были опубликованы ресурсом AdoredTV вместе со слайдами от компании AMD. В публикации рассказывается о производительности этого ускорителя HPC в сравнении с NVIDIA Volta и Ampere.
AdoredTV утверждает, что в их распоряжение попали слайды из официальной презентации AMD Radeon Instinct MI100. Они были переделаны во избежание обвинений, но все данные, как сообщается, оставлены нетронутыми. Прежде всего, в них сообщается о времени выхода ускорителя и серверных конфигураций с ним от партнеров.
Например, серверы с Radeon Instinct MI100 формата 1U с процессорами AMD EPYC поколений Rome и Milan должен быть запущен к декабрю 2020 года, в то время как вариант на базе Intel Xeon выйдет в феврале 2021 года. Такой сервер будет включать два процессора AMD EPYC. Каждый из них будет подключен к двум ускорителям Radeon Instinct MI100 через межкомпонентное соединение 2-го поколения Infinity Fabric. Четыре ускорителя вычислений на GPU смогут обеспечить 136 терафлопс производительности в операциях FP32 (SGEMM), то есть каждая карта Radeon Instinct MI100 способна обеспечить 34 терафлопса вычислительной мощи при потреблении в 300 Вт.
Среди прочих особенностей заявлена общая пропускная способность графики через PCIe в 256 Гбайт/с, что стало возможным благодаря PCIe 4.0. Объединенная пропускная способность памяти четырех графических процессоров составляет 4,9 Тбайт/с, что означает, что AMD использует память HBM2e DRAM (каждый ГП имеет полосу пропускания в 1,225 Тбайт/с). Общий объем составляет 128 Гбайт или 32 Гбайт на каждый ГП.
Ожидается, что второй сервер 3U будет запущен в марте 2021 года и предложит еще более впечатляющие спецификации: 8 Radeon Instinct MI100, подключенных к двум процессорам EPYC. Четыре ускорителя Instinct будут обеспечивать 272 терафлопс вычислительной мощи FP32, предлагать пропускную способность через PCIe в 512 Гбайт/с, пропускную способность HBM в 9,8 Тбайт/с и иметь в совокупности 256 Гбайт видеопамяти. Потребление одной такой стойки составит 3 кВт.
По производительности AMD сравнила Radeon Instinct MI100 с ускорителями NVIDIA Volta V100 и Ampere A100. Интересно, что на слайдах упоминается ускоритель Ampere A100 мощностью 300 Вт, хотя такого варианта не существует: видимо, AMD говорит о гипотетической конфигурации A100. Сейчас есть только модели на 400 Вт (SXM) и на 250 Вт (PCIe).
Согласно данным от AMD, ее ускоритель Radeon Instinct MI100 обеспечивает примерно на 13 % более высокую производительность FP32 по сравнению с NVIDIA A100 (Ampere) и более чем 2-кратный прирост по отношению к Tesla V100 (Volta). По показателю производительности на доллар MI100 превосходит V100 в 2,4 раза, а A100 - в 1,5 раза. Также показано, что масштабирование производительности является почти линейным даже при использовании до 32 ускорителей в Resenet, что весьма впечатляет.
На слайдах упоминается, что AMD предложит гораздо более высокую производительность в таких сегментах, как нефтегазовая отрасль, академические исследования и машинное обучение. В остальных рабочих нагрузках HPC, таких как вычисления FP64, ИИ или Data Analytics за NVIDIA A100, похоже, остается существенное преимущество.