Запуск Intel 3-го поколения Xeon Scalable: 10-нм процессор Ice Lake-SP для повышения производительности центров обработки данных

Сегодня Intel выпускает свои первые серверные продукты, созданные с использованием передового 10-нанометрового производственного процесса: семейство масштабируемых процессоров Xeon 3-го поколения. Процессоры Xeon Scalable 3-го поколения основаны на микроархитектуре Ice Lake-SP, которая включает в себя ряд новых функций и улучшений. Например, количество ядер было значительно увеличено; Масштабируемые процессоры Intel 3-го поколения Intel Xeon Scalable имеют до 40 ядер на процессор по сравнению с 28 ядрами в предложениях 2-го поколения. Масштабируемая процессорная платформа Intel Xeon 3-го поколения также поддерживает до 8 каналов памяти DDR4-3200, до 6 терабайт общей системной памяти и до 64 линий подключения PCIe Gen4 на каждый сокет, что обеспечивает более высокую пропускную способность, более высокую емкость и большую производительность. ИО. Вместе с платформой также появляются новые возможности безопасности и криптографии.

масштабируемый процессор Xeon 3-го поколения

Детали Intel Ice Lake-SP

В основе масштабируемых процессоров Intel Xeon 3-го поколения лежит микроархитектура Ice Lake-SP. По сути, Ice Lake-SP похож на ранее выпущенный менее мощный Ice Lake (не-SP), дебютировавший пару лет назад. Тем не менее, он усилен и дополнен для удовлетворения потребностей современных центров обработки данных, облачных вычислений и рабочих нагрузок периферийных вычислений.

платформа Xeon 3-го поколения масштабируемая
Большая часть IP в Ice Lake-SP была обновлена ​​и улучшена по сравнению с архитектурами предыдущего поколения для повышения производительности или эффективности. Ice Lake-SP построен с использованием новейшей транзисторной технологии Intel. В ЦП используется более новая микроархитектура ядра с улучшением IPC примерно на 20% , получившая название Sunny Cove , и доступны дополнительные инструкции для ускорения различных растущих рабочих нагрузок.

Arch 3-го поколения Xeon масштабируемый
Sunny Cove шире и глубже, чем базовые микроархитектуры Intel предыдущего поколения. Он имеет более крупные ключевые внутренние структуры и более крупные кэши, что не только помогает улучшить IPC, но и общее многоядерное масштабирование и производительность. Теперь имеется 5 единиц распределения, 10 исполнительных портов, 4 AGU и больше пропускной способности хранилища L1 на ядро. Sunny Cove также имеет более точный блок предсказания переходов, среди ряда других настроек.

включает 2 масштабируемых процессора Xeon 3-го поколения
По сравнению со старыми микроархитектурами Haswell и Skylake, Ice Lake и его ядро ​​Sunny Cove улучшены практически по всем направлениям. В дополнение к вышеупомянутым функциям Sunny Cove имеет больше кэш-памяти L1 и L2 на ядро, а также увеличенный резервный буфер трансляции (TLB). Кэш uOP (микроопераций) архитектуры также больше, у него больше окно Out Of Order, и он может обрабатывать гораздо больше записей планировщика, а также выполнять загрузку и сохранение в процессе выполнения.

Arch 2 Xeon 3-го поколения масштабируемый
В дополнение к более широким и глубоким аспектам Sunny Cove, дизайн также имеет некоторые новые возможности. Он имеет два модуля FMA (1 x 512 и 1 x 256) и новые инструкции для ускорения шифрования (Intel Crypto Acceleration), арифметики больших чисел (IFMA), векторного AES, векторного умножения без переноса и шифрования SHA. По словам Intel, ее технология Crypto Acceleration обеспечивает особенно высокую производительность при использовании различных криптографических алгоритмов, что важно для клиентов, выполняющих рабочие нагрузки с интенсивным шифрованием; например, интернет-магазины, обрабатывающие миллионы клиентских транзакций в день. Intel утверждает, что ее Crypto Acceleration может защитить данные клиентов, не влияя на время отклика или общую производительность системы. Некоторые улучшения производительности для каждого ядра по сравнению с Cascade Lake предыдущего поколения показаны на слайде выше.

надежный масштабируемый процессор Xeon 3-го поколения
Ice Lake -SP также поддерживает Deep Learning Boost (DL Boost) для ускорения многих рабочих нагрузок ИИ, а также включает в себя дополнительные функции безопасности, такие как расширение Intel Software Guard (Intel SGX), которое предлагает до 512 ГБ защищенной емкости анклава на процессор (или до 1 ТБ в конфигурации 2P).

Больше вычислений, меньше задержек, больше пропускной способности

производительность 1 процессор Xeon 3-го поколения масштабируемый
В целом процессоры Intel Intel Xeon Scalable 3-го поколения предлагают больше ядер, дополнительную емкость памяти и пропускную способность, а также более высокую внутрипроцессорную и межпроцессорную пропускную способность. Intel заявляет о среднем увеличении производительности в 1,46 раза по сравнению с продуктами предыдущего поколения для традиционных вычислительных рабочих нагрузок и улучшении в 1,74 раза ИИ в рабочих нагрузках BERT (представление двунаправленного кодировщика от преобразователей), сравнивая новое поколение Xeon 8380 3-го поколения с предыдущим поколением 8280. По сравнению с платформой пятилетней давности Intel заявляет о среднем увеличении производительности в 2,65 раза.

производительность 3 xeon 3-го поколения масштабируемость

производительность 4 xeon 3-го поколения масштабируемость

масштабируемость производительности 5 xeon 3-го поколения
Intel предоставила множество данных о производительности своих новых масштабируемых процессоров Xeon 3-го поколения, сравнивая их как с предложениями Intel предыдущего поколения, так и с конкурирующей платформой AMD EPYC. В презентации Intel было множество сравнений, но несколько слайдов выше представляют собой хорошее резюме сравнения Intel и Intel. В рабочих нагрузках Cloud, HPC, 5G, IoT и AI новые процессоры Xeon Scalable 3-го поколения показывают значительный рост по всем направлениям. А в более традиционных рабочих нагрузках, связанных с вычислениями и памятью, по сравнению с предыдущими четырьмя поколениями платформ Xeon , новые процессоры Xeon Scalable 3-го поколения кажутся столь же впечатляющими. А клиенты Intel, использующие продукты серии Xeon E5, скорее всего, увидят значительное улучшение производительности, а также более высокую плотность и другие усовершенствования платформы.

масштабируемость производительности 2 xeon 3-го поколения
По сравнению с конкурирующей платформой AMD EPYC, Intel также одерживает множество побед, несмотря на монументальный дефицит до 24 ядер на процессор. Процессоры 3-го поколения Xeon Scalable имеют максимальное количество ядер — 40, тогда как серия AMD EPYC может иметь до 64 ядер. В стандартных вычислительных рабочих нагрузках, в которых не используются какие-либо специальные инструкции, масштабируемые процессоры Xeon 3-го поколения не смогут обогнать процессоры EPYC с большим числом ядер в большинстве случаев, независимо от сокета или сокета. Однако, когда к уравнению добавляются AVX-512, новые криптографические инструкции или DL Boost (в сочетании с оптимизацией программного обеспечения Intel), Intel заявляет о некоторых значительных преимуществах в производительности по сравнению с AMD, особенно в рабочих нагрузках Cloud и AI Inference.

amd сравнить масштабируемость Xeon 3-го поколения
Благодаря архитектурной эффективности монолитной конструкции Intel и усовершенствованиям Ice Lake-SP/Sunny Cove процессоры Intel Xeon Scalable 3-го поколения в некоторых ситуациях также могут обеспечивать значительно меньшие задержки. Анализ попаданий в кэш-память L1-L2-L3 подчеркивает один из недостатков архитектуры AMD на основе чипсетов. Оставаясь в пределах одного локального кристалла, AMD имеет преимущество в задержке по сравнению со вторым и третьим процессорами Xeon Scalable. Но как только данные должны быть получены с удаленного кристалла, задержка кеша с EPYC может быть в ~ 2-5 раз выше. Однако с огромным объемом кеша на EPYC это не будет серьезной проблемой для подавляющего большинства рабочих нагрузок, но с массивными наборами данных архитектура Intel может иметь преимущество в этом отношении в некоторых крайних случаях.

3rd Gen Xeon Scalable Processor Line-Up

стек sku 3-го поколения xeon масштабируемый
В разработке находится множество процессоров Intel Xeon Scalable 3-го поколения. В таблице выше они разбиты на множество категорий, но обратите внимание, что одна и та же модель может быть указана в нескольких разделах, и что варианты 4-8S фактически основаны на Cooper Lake. Количество ядер в линейке варьируется от 8 до 40 ядер на процессор, с кэш-памятью до 60 МБ и поддержкой до 8 каналов памяти со скоростью до DDR4-3200 на сокет, до 6 ТБ общей системной памяти ( с учетом DRAM и энергонезависимой памяти). Все процессоры поддерживают PCI Express Gen 4 с возможностью подключения до 64 линий, а также поддерживают технологию Intel Optane Persistent Memory. TDP варьируются в зависимости от максимальных базовых и повышающих частот, а также количества ядер/конфигурации (до 270 Вт TDP), а буквы в номерах моделей обозначают максимальное количество поддерживаемых сокетов. Масштабируемые процессоры Intel Xeon 3-го поколения поддерживают до 3 каналов UPI между процессорами со скоростью до 11,2 ГТ/с (по сравнению с 10,4 ГТ/с в процессорах Xeon 2-го поколения) и могут поддерживать до 8 сокетов — хотя и в приведенных выше конфигурациях. 2P максимальное количество ядер на процессор равно 28, поскольку они основаны на Cooper Lake. 40-ядерные процессоры Intel Xeon Scalable 3-го поколения доступны только в конфигурациях 1P и 2P.

Что касается цен, процессоры Intel Xeon Scalable 3-го поколения стоят чуть более 13 тысяч долларов, а флагманский 40-ядерный Xeon Scalable 8380 — 8099 долларов. В то время как процессоры Xeon с большим железом для критически важных приложений всегда стоят дороже, начальная цена Intel Xeon Scalable 8380 3-го поколения на тысячи меньше, чем у предыдущего поколения 8280, выпущенного в 2019 году.

Intel также быстро указывает на эти данные . центральные платформы — это не только процессоры. В комплексном платформенном решении Intel представлено множество смежных продуктов и программного обеспечения. Платформа Intel Xeon Scalable 3-го поколения включает поддержку Intel Optane энергонезависимая память серии 200, новейшие твердотельные накопители Intel Optane P5800X и D5-P5316 NAND SSD, а также сетевые адаптеры Intel Ethernet серии 800 и Intel Agilex FPGA. Intel также вложила значительные средства в программное обеспечение для оптимизации своих платформ. И это комплексное решение, которое помогло Intel сохранить лидирующие позиции в центрах обработки данных, несмотря на острую конкуренцию со стороны многих векторов.

В целом, несмотря на то, что 10-нм процессоры Intel Xeon Scalable 3-го поколения на базе Ice Lake-SP появятся позже, чем Intel первоначально надеялась, они являются важным шагом вперед для компании и ее клиентов. Усовершенствования платформы должны привести к значительному увеличению производительности и плотности для клиентов Intel, а также к дополнительным возможностям и функциям.

Источник (англ.)

Поставить оценку
Кофебрейкер | Интернет-журнал