Intel рассказала про чудовищную мощь флагманской графики Xe-HP на четырех кристаллах
Главный архитектор и старший вице-президент подразделения дискретной графики Intel Раджа Кодури (Raja Koduri) на конференции Hot Chips 2020 рассказал подробности о теоретической производительности будущих ускорителей компании. И заявленные цифры впечатляют.
Во время выступления господин Кодури достал из кармана самый большой и мощный графический процессор X e HP, объединяющий на одной подложке четыре кристалла (будут и более простые версии с один и два кристаллами). Каждый из них включает 512 вычислительных блоков (EU, Execution Units) и, вероятнее всего, два модуля многослойной памяти HBM2e.
Затем руководитель провел тест, чтобы показать отличную масштабируемость архитектуры X e и то, как увеличение количества кристаллов на подложке приводит к кратному масштабированию производительности. Работая на одном кристалле, ускоритель обеспечивает производительность до 10,588 терафлопс для операций с плавающей запятой FP32 при одинарной точности. Когда задействовано два кристалла, производительность масштабируется почти идеально и достигает 21,161 терафлопс (в 1,999 раза). Флагманское же решение с четырьмя кристаллами обеспечивает 3,993-кратное повышение производительности до 41,908 терафлопс.
Распределение задач между графическими процессорами в таких технологиях, как SLI и CrossFire, намного сложнее, а масштабирование от дополнительных ускорителей обычно дает игрокам в лучшем случае прирост в районе 50-80 %. Однако в вычислительных рабочих нагрузках задачи часто независимы и могут идеально масштабироваться. Поэтому в профессиональных задачах флагманские GPU Intel с четырьмя кристаллами явно покажет себя хорошо. А вот как будут обстоять дела у Intel с масштабированием графики - покажут независимые тесты.
Для сравнения: видеокарта GeForce RTX 2080 Ti в операциях FP32 способна обеспечить до 14,2 терафлопс производительности. Но это еще не все: господин Кодури также упомянул, что X e HP на базе четырех кристаллов способен обеспечивать производительность в петафлопсах. Другими словами, с помощью тензорных блоков новый графический процессор Intel будет невероятно быстрым в задачах машинного обучения и искусственного интеллекта, где не нужна высокая точность.