5 фактов про GeForce RTX 3080, которые прояснил анонс NVIDIA Ampere
Наконец-то NVIDIA представила архитектуру графических процессоров нового поколения. Спустя почти полтора года после запуска серии GeForce RTX 20 на базе NVIDIA Turing и через три года после появления графических процессоров Volta, ориентированных на центры обработки данных, исполнительный директор компании Дженсен Хуанг (Jensen Huang) представил новую архитектуру Ampere. Первый продукт на ней похож на абсолютного вычислительного монстра.
Ampere дебютировала в виде A100, огромного графического процессора для центров обработки данных, использующих новые платформы NVIDIA DGX-A100. Не заблуждайтесь: этот зверь с 6912 ядрами CUDA предназначен для исследователей, а аппаратные блоки оптимизированы для задач глубокого обучения. Для Cyberpunk 2077 подобные ускорители явно не предназначены. Но это не значит, что скромные геймеры на ПК не могут порадоваться анонсу ориентированного на ИИ ускорителя с архитектурой Ampere. Перечислим лишь пять ключевых моментов, которые архитектура NVIDIA Ampere принесет в следующее поколение GeForce.
1. Ampere рассчитан и на рынок ПК
Как и в случае предыдущих графических архитектур Volta и Pascal, сразу после анонса Ampere приняла форму огромного гигантского графического процессора, созданного для задач центров обработки данных. Однако в отличие от Volta, новая Ampere действительно появится и на рынке потребительских видеокарт.
На предварительной встрече с журналистами глава NVIDIA это подтвердил, заявив, что Ampere упростит линейку графических процессоров NVIDIA, заменив как Volta в ускорителях Tesla, так и Turing в видеокартах GeForce. Аппаратные блоки внутри каждого конкретного графического процессора будет адаптированы к задачам, на которые ориентирован конкретный рынок. "Существует большое сходство в архитектуре, но не в конфигурации", - заявил господин Хуанг о разнице между подходами к корпоративным и потребительским продуктам на базе Ampere.
2. Ampere перешла на 7-нм нормы
Как и ожидалось, ускорители NVIDIA Ampere, наконец, используют передовые 7-нм производственные нормы, уходя от старых добрых 12 нм, используемых для Turing и Volta. Это - большой прогресс, который означает рост производительности и энергоэффективности. AMD в видеокартах Radeon RX серии 5000 на базе архитектуры Navi (а ранее и Radeon VII на базе Vega) первой применила 7-нм техпроцесс, это позволило компании значительно повысить эффективность своих решений.
7-нм карты Navi показали превосходство в производительности и эффективности над своими аналогами из стана GeForce, что немаловажно. До этого переход NVIDIA от 28-нм техпроцесса GeForce GTX 900-й серии к 16-нм нормам GTX 10-серии привел к значительному увеличению показателей производительности на ватт. В общем, практика говорит, что можно ожидать большого прогресса от новых видеокарт GeForce не только благодаря Ampere, но и за счет передового техпроцесса.
3. На кристалле Ampere умещается много больше ядер
Переход на более компактные транзисторы означает, что на кристалле можно уместить куда больше вычислительных блоков. Графический процессор Volta флагманского ускорителя Tesla V100 состоит из 21,1 млрд транзисторов, которые позволили создать 80 блоков потоковых мультипроцессоров (SM) с 5120 ядрами CUDA на кристалле площадью 815 мм 2. В свою очередь новый A100 на базе Ampere вмещает 54 млрд транзисторов, из которых получилось 108 SM или 6912 ядер CUDA в почти идентичном кристалле площадью 826 мм 2.
Это большой шаг вперед: расширенное количество вычислительных блоков означает куда более быстрые видеокарты. Для справки: GeForce RTX 2080 Ti может предложить 4352 ядра CUDA на кристалле 754 мм 2. Преемник рискует стать королем по числу потоковых процессоров.
4. Блоки ИИ в Ampere стали более продвинутыми
Volta и Turing представили миру так называемые тензорные ядра. Это особые аппаратные ускорители задач машинного обучения, а в графических процессорах GeForce они обеспечивают работу технологии масштабирования Deep Learning Super Sampling (DLSS) 2.0 и отвечают за подавление шумов при использовании технологии гибридной визуализации с применением трассировки лучей в реальном времени.
В графическом процессоре A100 используются тензорные ядра третьего поколения, которые значительно повышают производительность в задачах с плавающей запятой при половинной точности (FP16), добавляют поддержку нового эффективного формата TF32 (tensor float 32) для вычислений ИИ с одинарной точностью, а также поддерживают задачи двойной точности FP64.
Еще неизвестно, как тензорные ядра третьего поколения будут развернуты в потребительских графических процессорах на базе Ampere, но NVIDIA очень агрессивно продвигает DLSS и машинное обучение, так что видеокарты GeForce следующего поколения наверняка в этой области станут значительно более продвинутыми. Тем более, что активное использование трассировки лучей в играх нового поколения потребует и более качественного шумоподавления, и других "интеллектуальных" уловок.
5. Ampere поддерживает PCIe 4.0
NVIDIA не объявила об этом для своей системы DGX-A100, но Supermicro также представила новые системы на базе графического процессора Ampere A100, и анонс подтвердил, что ГП следующего поколения поддерживают передовой интерфейс PCIe 4.0.
В потребительском сегменте процессоры AMD серии Ryzen 3000 стали первыми, которые обеспечили поддержку нового скоростного интерфейса. В видеокартах таковыми стали ускорители AMD Radeon 5700 на базе Navi. Впрочем, они на системах с PCIe 4.0 работают не быстрее, чем через PCIe 3.0: как правило, большинство современных видеокарт еще не приблизились к исчерпанию полосы пропускания интерфейса PCIe 3.0. Но вот уже GeForce RTX 2080 Ti за $1200 долларов действительно получает заметное повышение производительности при работе через слот PCIe 3.0 x16 вместо PCIe 3.0 x8, то есть этот графический монстр уже приближается к верхним границам возможностей PCIe 3.0 в системах с несколькими ГП.
Преемник GeForce RTX 2080 Ti на базе Ampere будет очевидно гораздо мощнее, так что это может привести к перегрузке соединений PCIe 3.0. Переход на интерфейс PCIe 4.0 позволит обойти эту проблему. Это также приведет к новому интересному повороту для сборщиков систем. Новейшие процессоры Intel Core 10-го поколения по-прежнему поддерживают лишь PCIe 3.0. И при создании мощных ПК с несколькими видеокартами Ampere, возможно, появится лишний повод присмотреться к AMD Ryzen. К слову, сама NVIDIA в своей системе DGX A100 использует как раз AMD EPYC Rome.
Анонс NVIDIA A100 не смог раскрыть некоторые характеристики, представляющие основной интерес для геймеров: в частности, тактовые частоты Ampere и производительность в области трассировки лучей. Более высокие тактовые частоты означают, как правило, более высокую производительность в играх. Улучшенные специализированные ядра RT могут значительно расширить возможности трассировки лучей графических процессоров GeForce следующего поколения и сделать новые эффекты не столь тяжелой задачей, особенно в сочетании с усовершенствованными тензорными ядрами. Недавние утечки и слухи говорят о том, что графические процессоры GeForce Ampere будут работать на еще более высоких частотах, чем GeForce RTX 20, а увеличение скорости трассировки лучей будет четырехкратным. Однако источник этих утечек не заслуживает особого доверия, так что лучше подождать более надежной информации.
С учетом подготовки запуска мощного ускорителя Radeon "Big Navi" и впечатляющих консолей следующего поколения, обеспечивающих более высокую производительность и поддержку трассировки лучей для графических процессоров AMD, компания NVIDIA наверняка постарается смазать триумф своего конкурента в ближайшие месяцы.