NVIDIA GeForce RTX 30-й серии: под капотом Ampere

Вчера NVIDIA провела несколько виртуальных брифингов, чтобы придать дополнительную окраску мероприятию генерального директора Дженсена Хуанга, посвященному серии GeForce RTX 30, которое состоялось ранее на этой неделе. Было сделано не так много важных новых объявлений, но ряд слайдов, представленных Дженсеном, были более конкретизированы, с дополнительными подробностями и несколькими новыми визуальными эффектами, которые рисуют более полную картину Ampere и GeForce RTX 3090. GeForce RTX 3080 и RTX 3070.

Если вы еще не читали наш репортаж о запуске , настоятельно рекомендуем ознакомиться с ним. Предоставленный обзор заложит основу некоторых более глубоких деталей, представленных здесь, а изображения карт и кухни Дженсена чертовски круты…

Пристальный взгляд на графические процессоры NVIDIA Ampere

Блок-схема rtx 3080
ампер см конфигурация
NVIDIA GeForce RTX 3080 GPU And Ampere SM Block Diagrams
Во время вчерашнего брифинга была показана новая конфигурация потокового мультипроцессора Ampere. Самый большой вывод здесь заключается в том, что новый Ampere SM больше, мощнее и имеет новый канал передачи данных, который эффективно удваивает производительность вычислений. Архитектура предыдущего поколения (до Тьюринга ) имела только один путь данных. Однако у Тьюринга был второй математический путь данных — один для чисел с плавающей запятой, а другой для целых чисел. С другой стороны, в Ampere целочисленный путь был дополнен дополнительным модулем FP32, поэтому для тяжелых рабочих нагрузок FP доступно значительно больше ресурсов.

Новый блок Ampere SM также удваивает пропускную способность L1 и размер раздела кэша, а также увеличивает емкость L1 на 33%. Кроме того, RT Ampere второго поколения ( трассировка лучей ) ядра могут обрабатывать частоты пересечения треугольников в два раза быстрее, а его тензорные ядра третьего поколения удваивают математическую производительность для разреженных матриц (матрицы, в которой большинство элементов равны нулю).

ампер размытие движения 0

ампер размытие движения
Улучшенная частота пересечения треугольников улучшит производительность трассировки лучей
Удвоение частоты пересечения треугольников Ampere должно существенно повлиять на производительность рабочих нагрузок трассировки лучей . Что NVIDIA обнаружила, анализируя характеристики производительности Turing, так это то, что у него часто были хорошие показатели пересечения ограничивающей рамки, но показатели пересечения треугольников сдерживали ситуацию. С помощью Ampere NVIDIA хотела иметь возможность параллельно обрабатывать скорости пересечения Bounding Box и Triangle. Таким образом, отдельные ресурсы Bounding Box и Triangle Ampere могут работать параллельно, и, как уже упоминалось, скорость пересечения треугольников в два раза выше.

В Ampere также был добавлен новый блок интерполяции положения треугольника, помогающий создавать более точные эффекты размытия в движении.

Мощность и акустика NVIDIA Ampere

ампер производительность на ватт
Ampere имеет отдельные шины питания для графики и памяти
Во время выступления Дженсен показал слайд, объясняющий улучшение производительности Ampere на ватт в 1,9 раза по сравнению с Тьюрингом. Были предоставлены некоторые дополнительные сведения о том, как это было достигнуто, наряду с фактическими тепловыми и акустическими данными.

В архитектурах предыдущего поколения у NVIDIA была одна общая шина питания для ядер и системы памяти. Это означало, что если ядра перестают работать при высоком напряжении, то и памяти тоже. Однако с Ampere NVIDIA разделила шины питания ядра и памяти на отдельные домены, чтобы они могли работать независимо. Это позволит повысить эффективность и энергосбережение, а в конечном итоге улучшить энергетические и тепловые характеристики карт Ampere.

geforce rtx 3090 термики

Говоря о лучшей мощности и акустике, NVIDIA добавила и в них немного дополнительных красок. Согласно внутреннему тестированию NVIDIA, при любом уровне шума грядущее тепловое решение GeForce RTX 3080 может поддерживать температуру графического процессора примерно на 20°C ниже, чем эталонный дизайн на GeForce RTX 2080. Кроме того, при любой заданной температуре GeForce RTX 3080 будет работать на 10 бВА тише

Аналогичное сравнение проводилось между зверскими GeForce RTX 3090 и GeForce RTX Titan, но различия были более разительными. В аналогичных тестах GeForce RTX 3090 работала на 30°C холоднее, чем Titan RTX, и была примерно на 20 дБ тише при любой заданной температуре вдоль кривой.

Детали охлаждения серии rtx 30
Улучшенные тепловые и акустические характеристики карт серии GeForce RTX 30 обеспечиваются новым решением для охлаждения. Кулеры оснащены сдвоенными осевыми вентиляторами и раздельным радиатором, который работает тише, чем существующие решения, и в то же время обеспечивает возможность рассеивать до 90 Вт энергии больше. Передняя часть массива радиаторов расположена непосредственно над графическим процессором и памятью. Вентилятор наверху направляет воздух через радиатор прямо из корпуса. Однако радиатор на задней половине карты, который соединен с большой испарительной камерой через тепловые трубки, позволяет воздуху от второго вентилятора проходить полностью, где он поднимается к верхней части корпуса и в конечном итоге измученный.

плата geforce rtx 30
Более мощные кулеры в серии GeForce RTX 30 сочетаются с более плотной конструкцией печатной платы, а также с миниатюрным 12-контактным разъемом питания на некоторых картах. В дополнение к уникальным V-образным задним краям печатных плат, они также более плотно упакованы и, как сообщается, на 50% плотнее. Вы можете хорошо рассмотреть уникальный дизайн печатной платы GeForce RTX 3080 выше.

NVIDIA Ampere: повышение производительности несколькими способами

rtx io демо 1

rtx io демо 2
NVIDIA RTX IO работает с Microsoft DirectStorage, что должно серьезно сократить время загрузки игр

Также была показана демонстрация теоретических преимуществ NVIDIA RTX IO, которая работает в сочетании с Microsoft DirectStorage API. Во время демонстрации обработка загрузки уровня и декомпрессии заняла примерно в 4 раза больше времени на твердотельном накопителе PCIe Gen 4 с использованием текущих методов и использовала значительно больше ресурсов ядра ЦП. Демонстрация была запущена на 24-ядерной системе Threadripper, и стандартная загрузка/распаковка заняла более 5 секунд. С RTX IO это время сократилось до 1,61 секунды. Мы даже не будем говорить о производительности жесткого диска. Ой, больно просто смотреть на график.

Тьюринг против Ампера Производительность 1
Тьюринг против Ампера Производительность 2
Производительность Turing против Ampere Ray Tracing
NVIDIA также провела несколько прямых сравнений между Turing и Ampere, выполнив некоторые тесты трассировки лучей с Wolfenstein Youngblood в разрешении 4K. Как вы можете видеть, по предоставленным данным, графический процессор Ampere способен обрабатывать кадры (или, по крайней мере, кадр, предоставленный здесь для справки), значительно быстрее, чем эквивалентный графический процессор на основе Turing.

Конечно, также были сделаны некоторые сравнения частоты кадров. Во-первых, давайте посмотрим, на что способна GeForce RTX 3070…

производительность geforce rtx 3070
На приведенной выше диаграмме GeForce RTX 3070 сравнивается с GeForce RTX 2070 и GTX 1070 при разрешении 1440p. В Borderlands 3 , используя традиционную растеризацию, GeForce RTX 3070 преодолевает отметку в 80 кадров в секунду, тогда как RTX 2070 достигает около 50 кадров в секунду, а GTX 1070 не может достичь 40 кадров в секунду. Включите RTX с помощью Minecraft и Control, и производительность GeForce GTX 1070 снижается, но GeForce RTX 3070 сохраняет такие же большие преимущества по сравнению с RTX 2070.

geforce rtx 3080 производительность
При сравнении производительности GeForce RTX 3080 использовались те же игры, но разрешение увеличено до 4K, а для справки используются RTX 2080 и GTX 1080. Здесь мы видим аналогичные тенденции: GeForce RTX 3080 достигает частоты кадров в диапазоне 60–80 кадров в секунду, сохраняя значительное преимущество по сравнению с картами предыдущего поколения.

производительность geforce rtx 3090

перфоратор тензора ампер
Сравнение производительности NVIDIA GeForce RTX 3090 было проведено с GeForce RTX Titan, хотя было предоставлено больше данных (включая игры, рендеринг и вычислительные нагрузки), они не дают такой ясности с точки зрения фактической частоты кадров. Несмотря на это, данные NVIDIA показывают, что GeForce RTX 3090 опережает RTX Titan по всем направлениям. В частности, производительность тензорного ядра показывает значительный прирост производительности. По мере приближения к выпуску GeForce RTX 30-й серии

мы будем делиться дополнительной информацией . . На данный момент эти дополнительные детали должны вас задержать. Несмотря на то, что пиковая мощность выше у грядущих карт GeForce RTX 30-й серии на базе Ampere от NVIDIA, улучшения в эффективности, производительности, корпусе и охлаждении дают убедительную картину того, чего ожидать, и мы стремимся проверить это на себе. К счастью, теперь это ненадолго.

Источник (англ.)

Поставить оценку
Кофебрейкер | Интернет-журнал