Стало известно как работают ядра в новых NVIDIA GeForce RTX 3000
Представители NVIDIA ответили на некоторые вопросы пользователей Reddit, благодаря чему появились первые технические подробности о видеокартах GeForce RTX 30.
Новинки поддерживают HDMI 2.1 в его максимальной интерпретации, то есть с пропускной способностью 48 Гбит/с и со сжатием DSC. То есть видеокарты поддерживают разрешение 8K при 60 Гц и с активным HDR.
Технология RTX IO, которая напрямую передает данные SSD, не будет иметь каких-то особых требований к твердотельным накопителям. Это должны быть SSD с поддержкой NVMe и с интерфейсом PCIe 4.0. И чем быстрее будет накопитель, тем эффективнее будет работать RTX IO.
Новые видеокарты удивили огромным количеством ядер CUDA - их оказалось вдвое больше, чем утверждали все источники. Оказалось, что производители видеокарт до самого анонса не знали об этой особенности, что и объясняет дезинформацию.
Каждый вычислительный блок в составе кластера SM содержит одну структуру с ядрами FP32 (это и есть ядра CUDA) и одну структуру с таким же количеством ядер FP32 и таким же количеством ядер INT8. То есть ядер CUDA попросту стало вдвое больше в рамках одного блока, чем было в Turing.
Однако это не привело к двукратному росту производительности в играх, потому что реализация Ampere подразумевает, что за один такт каждый блок способен выполнять либо 32 операции ядрами FP32, либо 16 операций ядрами FP32 и 16 операций ядрами INT8 - все вместе одновременно задействовано быть не может.
При этом, если говорить исключительно о ядрах CUDA (FP32), они могут быть задействованы сразу все, а в каждом кластере SM их теперь 128 против 64 у Turing.
А еще у Ampere выросла пропускная способность кэш-памяти первого уровня: до 219 ГБ/с против 116 ГБ/с у Turing.