7-нм графический процессор машинного обучения Ampere A100 Beast от NVIDIA запущен вместе с суперкомпьютером DGX A100 AI


Мы слышали об Ampere следующего поколения от NVIDIA в течение последних двух лет, но компания, наконец, готова рассказать о своей архитектуре графического процессора следующего поколения. Хотя сегодня вы не услышите никакой информации о  потребительских игровых видеокартах серии GeForce RTX 30 , NVIDIA обсуждает подробности об Ampere для центров обработки данных с машинным обучением и рынков высокопроизводительных вычислений. Короче говоря, эта версия Ampere является самым большим и самым мощным графическим процессором, который когда-либо производила NVIDIA, и компания заявляет, что это также самый большой в мире 7-нм чип. Без сомнения, это массивно.

По словам NVIDIA, ее графический процессор A100 на базе Ampere уже находится в полном производстве и доставляется клиентам, и утверждается, что A100 представляет собой самый большой прирост производительности графического процессора за всю его историю. Учитывая спецификации, у нас нет причин сомневаться в компании.

100 прыжок

A100 имеет колоссальные 54 миллиарда транзисторов, что, безусловно, позволяет ему стать самым большим в мире процессором, построенным на 7-нанометровой технологии. Всего имеется 6912 ядер FP32 CUDA, 432 ядра Tensor и 108 SM. На борту установлено 40 ГБ памяти HBM2e с максимальной пропускной способностью памяти 1,6 ТБ/с. Вычисления FP32 достигают ошеломляющих 19,5 TLFLOP по сравнению с 16,4 TFLOPS для Tesla V100. Вычисления FP64 составляют 9,7 терафлопс по сравнению с 8,2 терафлопс для Tesla V100. Кроме того, его тензорные ядра используют точность FP32, что позволяет повысить производительность ИИ в 20 раз. Что касается производительности FP64, эти тензорные ядра также обеспечивают повышение производительности в 2,5 раза по сравнению с его предшественником Volta в отношении приложений HPC (High Performance Compute).

характеристики нвидиа а100

Некоторые другие специфичные для Ampere функции включают в себя многоэкземплярный графический процессор, также известный как MIG, который позволяет разделить графический процессор A100 на семь отдельных экземпляров. Таким образом, необработанная мощность чипа может быть выделена для нескольких дискретных специализированных рабочих нагрузок. Ampere также интегрирует дизайн NVLink третьего поколения , который удваивает производительность соединения между несколькими графическими процессорами для улучшения масштабирования.

«Графический процессор NVIDIA A100 — это 20-кратный скачок в производительности ИИ и комплексный ускоритель машинного обучения — от анализа данных до обучения и логических выводов, — сказал основатель и генеральный директор NVIDIA Дженсен Хуанг . наши рабочие нагрузки могут быть ускорены на одной платформе. NVIDIA A100 одновременно повысит пропускную способность и снизит стоимость центров обработки данных».

дгх а100 2

NVIDIA DGX A100

Эти графические процессоры A100 также появятся в суперкомпьютере третьего поколения NVIDIA DGX AI с производительностью 5 петафлопсов. Дженсен дал нам ранний «вкус» DGX A100 , когда во вторник вытащил свежеиспеченную установку из своей личной домашней духовки. В то время он заявил, что это «самая большая видеокарта в мире», но, к сожалению, ее целевые функции не предназначены для игр.

DGX A100 имеет в общей сложности восемь графических процессоров A100, а также 320 ГБ памяти (пропускная способность 12,4 ТБ в секунду). Система также оснащена межсоединениями Mellanox HDR 200 Гбит/с. Как мы упоминали ранее, каждый графический процессор A100 может поддерживать до 7 экземпляров, а это означает, что с 8 встроенными графическими процессорами DGX A100 может поддерживать в общей сложности 56 экземпляров для атаки текущей рабочей нагрузки.

дгх а100

Тем не менее, NVIDIA также думает не только о DGX A100, и объявила о разработке DGX SuperPOD, который объединяет мощность 140 систем DGX A100, связанных с помощью вышеупомянутых межсоединений Mellanox. Вместе вы получаете 700 петафлопс вычислительной мощности ИИ, которую можно использовать для чего угодно — от медицинских исследований до помощи в анализе COVID-19, как мы видели в проекте Folding@Home .

Похоже, что NVIDIA успешно стартовала с Ampere и A100, но мы, конечно же, с нетерпением ждем того, что компания приготовила для рынка энтузиастов. Прошло более 18 месяцев с тех пор, как NVIDIA запустила свою архитектуру Turing для семейства GeForce RTX 20, и ожидания от семейства GeForce RTX 30 невероятно высоки.

Источник (англ.)

Поставить оценку
Кофебрейкер | Интернет-журнал