Intel показала монструозный графический процессор Xe-HPC - более десятка чипов в одной упаковке
Помимо выпуска настольной видеокарты Iris Xe на базе архитектуры X e -LP компания Intel сегодня порадовала еще одной новостью. Старший вице-президент компании и ее главный архитектор графики Раджа Кодури (Raja Koduri) опубликовал изображение гигантского графического процессора X e -HPC, предположительно основанного на 7-нм техпроцессе, который ляжет в основу ускорителей вычислений Ponte Vecchio.
К сожалению, господин Кодури не озвучил технические характеристики показанного блока GPU, поэтому информация о том, чем будет являться финальный продукт на его основе остается загадкой. Между тем ресурс Tom’s Hardware выделил на изображении ряд интересных особенностей. Например, сразу видно, что процессор состоит из двух чиплетов, объединенных шиной EMIB (Embedded Multi-die Interconnect Bridge). Вокруг двух основных блоков GPU расположено по пять дополнительных кристаллов. Любопытно, что не все они имеют одинаковый размер. Что это за чипы - информации нет.
Сам господин Кодури в опубликованном сообщении указал, что в составе X e -HPC используются семь продвинутых технологий. Можно предположить, что речь идет о 3D-упаковке Foveros, шине EMIB, улучшенном 10-нм техпроцессе SuperFIN, памяти Rambo Cache, памяти HBM и вычислительных блоках Compute Tile. Последняя седьмая технология неизвестна. И вообще, вполне вероятно, что сам архитектор графики Intel подразумевал иные особенности.
Xe HPC ready for power on!
7 advanced silicon technologies in a single package
Silicon engineers dream
Thing of beauty @intel pic.twitter.com/RF8Prsy05f
- Raja Koduri (@Rajaontheedge) January 26, 2021
Оба блока GPU с пятью дополнительными чипами кажутся отзеркаленными версиями друг друга. Правда, большинство из них справа обладает более квадратной формой (200 × 216 пикселей), а чипы слева - более прямоугольной (174 × 216 пикселей). При этом верхний левый чип имеет размеры 186 × 138, а нижний правый - 218 × 138 пикселей. Как указывает Tom’s Hardware, поскольку Intel применяет 3D-упаковку Foveros для ускорителей вычислений Ponte Vecchio, то учитывая ассиметричные размеры чипов можно предположить, что здесь используются стеки из нескольких кристаллов памяти HBM2, Rambo Cache и блоков вычислений.
Кристаллы основных блоков GPU затемнены, однако центральный канал между четырьмя прямоугольными площадками на каждом GPU, скорее всего, является структурой маршрутизации данных между исполнительными блоками. Слева и справа от центра расположено восемь плиток одинакового размера, в которых может содержаться по 64 исполнительных блоков (Execution Units, EU), то есть по восемь ALU (ядер GPU) на один EU. В общей сложности это дает 512 исполнительных блоков на один чип или 1024 EU на весь GPU в целом, что потенциально означает 8196 графических ядер.
Оставшиеся шесть прямоугольников с правой и левой сторон, вероятнее всего, являются интерфейсами для памяти HBM, Rambo Cache и вычислительных блоков, или просто интерфейсами памяти. Шесть контроллеров памяти предполагают наличие шины разрядностью 6144 бит. Такая же максимальная разрядность заложена для шины в ускорителе вычислений NVIDIA A100.
Все вышесказанное является лишь предположением, но одно точно - в составе представленного X e -HPC компания Intel заложила огромную вычислительную мощность. В середине прошлого года господин Кодури делился изображением процессора X e -HP в исполнении LGA. Вполне возможно, что представленный сегодня блок GPU является тем же самым изделием.