Тесты Intel показывают, что чип машинного обучения Habana Gaudi2 AI превосходит NVIDIA A100

Ускоритель искусственного интеллекта Intel Habana Gaudi2
После того, как в прошлом месяце компания представила свой процессор искусственного интеллекта Habana Gaudi2 второго поколения с некоторыми предварительными показателями производительности, Intel последовала этому примеру с внутренними тестами, показывающими, что ее необычный ускоритель опережает графический процессор NVIDIA A100 . Согласно Intel, его результаты демонстрируют явную эффективность обучения лидерству по сравнению с тем, что могут предложить конкуренты.
Gaudi2 представляет собой большую пластину кремния, как показано на изображении выше. Процессор Guadi2 в центре окружен шестью ячейками памяти с высокой пропускной способностью снаружи, что фактически утроило объем встроенной памяти с 32 ГБ в предыдущей версии до 96 ГБ HBM2E в текущей итерации, обеспечивая пропускную способность 2,45 ТБ/с.
Intel Habana Gaudi2 на сером градиентном фоне
Последние тесты Intel показывают то, что она считает «резким улучшением времени обучения (TTT)» по сравнению с чипом Gaudi первого поколения. Что еще более важно (для Intel), его последняя заявка на MLPerf подчеркивает несколько преимуществ производительности по сравнению с NVIDIA A100-80G для восьми ускорителей на моделях обучения зрению и языку.
Если вы пропустили это, Intel приобрела Habana Labs за 2 миллиарда долларов в конце 2019 года, чтобы дать ей импульс в гонке с высокими ставками против NVIDIA в обучении искусственному интеллекту и машинному обучению. Центры обработки данных — это источник больших денег, и на тот момент доход NVIDIA от центров обработки данных впервые превысил доход от игр в прошлом квартале (3,75 миллиарда долларов по сравнению с 3,62 миллиарда долларов).
И Intel, и NVIDIA серьезно заинтересованы в доминировании в центрах обработки данных. MLPerf — это стандартный отраслевой тест, о котором NVIDIA часто трубит о своих собственных победах в производительности, так что это честная игровая площадка. Также легко понять, почему Intel стремится изменить то, что она смогла сделать с помощью своего процессора Gaudi2.

Intel Habana Gaudi2 против NVIDIA A100 в MLPerf

График тестов MLPerf ResNet График тестов MLPerf BERT
Intel продемонстрировала два основных момента: время обучения ResNet-50 и BERT. ResNet — это модель распознавания зрения/изображения, а BERT — для обработки естественного языка. Это ключевые области искусственного интеллекта и машинного обучения, и обе модели являются отраслевыми стандартами.
На сервере с восемью ускорителями тесты Intel показывают повышение производительности до 45% в ResNet и до 35% в BERT по сравнению с графическим процессором NVIDIA A100. И по сравнению с чипом Gaudi первого поколения мы ожидаем увеличения до 3 и 4,7 раз соответственно.
«Эти достижения можно объяснить переходом с 16-нанометрового техпроцесса на 7-нм, утроением количества ядер тензорного процессора, увеличением вычислительной мощности двигателя GEMM, утроением встроенной памяти с высокой пропускной способностью, увеличением пропускной способности и удвоением размера SRAM. — говорит Интел.
«Для моделей машинного зрения в Gaudi2 есть новая функция в виде интегрированного медиа-движка, который работает независимо и может обрабатывать весь конвейер предварительной обработки для сжатых изображений, включая увеличение данных, необходимое для обучения ИИ», — добавляет Intel.
Вычислительная архитектура семейства Gaudi неоднородна и состоит из двух вычислительных механизмов: механизма умножения матриц (MME) и полностью программируемого кластера Tensor Processor Core (TPC). Первый обрабатывает операции, которые можно понизить до матричного умножения, а второй специально создан для операций глубокого обучения, чтобы ускорить все остальное.
То, что демонстрирует Intel, — это огромные успехи в MLPerf , которые можно перенести на реальные рабочие нагрузки. Это впечатляет, хотя имейте в виду, что технически A100 будет устаревшим кремнием, когда Hopper H100 выйдет на рынок . NVIDIA еще не представила результаты MLPerf для своего ускорителя H100, и будет интересно посмотреть, как все сложится, когда это произойдет.

Источник (англ.)

Поставить оценку
Кофебрейкер | Интернет-журнал