События сегодня

AVX-512 удваивает AMD EPYC Bergamo, Genoa-X выигрывает от большого кэша

Хотя реализация AVX-512 в процессорах AMD на базе микроархитектуры Zen 4 сомнительна — в этих процессорах нет реальных 512-битных регистров и для этого используются существующие 256-битные регистры в два этапа, сама ситуация на рынке заставляет эти решения уникальные.

Популярный ресурс Phoronix опубликовал новые бенчмарки, в которых исследуются преимущества включения поддержки AVX-512 в системах на базе AMD Bergamo. Вопрос о влиянии на производительность большого 3D V-Cache в новом EPYC Genoa-X также тщательно рассматривается.

 Поддержка AVX-512 может быть очень полезна для процессора AMD EPYC. Источник здесь и ниже: Фороникс

Поддержка AVX-512 может быть очень полезна для процессора AMD EPYC. Источник здесь и ниже: Фороникс

Несмотря на то, что AVX-512 — детище Intel, ситуация довольно абсурдная: текущая серия Sapphire Rapids сильно отстает от AMD Bergamo по количеству ядер, а многоядерные (до 144 ядер) Xeon серии Sierra Forest, скорее всего, поддержки AVX-512/AVX10 не получат.

Таким образом, AMD Bergamo с ядрами Zen 4c — единственные в мире 128-ядерные процессоры с поддержкой 512-битных расширений. На примере AMD EPYC 9754 видно, что несмотря на отсутствие полноценных регистров такой ширины, выгода от активации AVX-512 может быть весьма существенной, в некоторых случаях почти двукратной, а в TensorFlow даже шестикратной или десятикратной.



Сводный результат показывает, что активация AVX-512 дает Бергамо двукратный прирост производительности, хотя, конечно, в итоге все зависит от конкретной нагрузки. Интересно, что использование 512-битных расширений практически не влияет на частотные характеристики процессора — в среднем этот показатель остался равным тем же 2,9 ГГц, что и без AVX-512.

А вот энергопотребление и тепловыделение в этом режиме заметно возрастают, но не настолько, чтобы вызвать какие-то проблемы с перегревом или активацией режима троттлинга, как у некоторых ранних моделей Intel Xeon с поддержкой AVX-512.

А теперь перейдем к EPYC 9684X (Genoa-X) — тоже достаточно уникальному процессору, который сочетает в себе 96 ядер, AVX-512 и 3D V-Cache, доводя общий кэш L3 до гигантских 1,1 ГБ. При этом разница также сильно различается в зависимости от характера нагрузки, но в ряде случаев может быть двукратной.

В среднем эффект выражается в увеличении производительности на 12%, что тоже неплохо. Отключение 3D V-Cache не влияет на тактовую частоту и энергопотребление. Таким образом, становится очевидным, что AMD EPYC 9684X — процессор специфический, уступающий по количеству ядер Bergamo и заточенный исключительно под нагрузки, способные эффективно использовать огромный объем кэша, такие как OpenFOAM или OpenVINO.

Информация для Вас была полезна?
0
0
0
0
0
0
0

Похожие статьи

Кнопка «Наверх»