NVIDIA анонсировала A2 — новое поколение энергоэффективных ускорителей

Ускоритель работы нейросетей и обработки видео с низким энергопотреблением A2 анонсировала компания NVIDIA 9 ноября на официальном сайте.
NVIDIA A2 — это ускоритель вычислений алгоритмов искусственного интеллекта (ИИ) и обработки видео с компактными размерами и низким энергопотреблением на базе микроархитектуры Ampere (на ней построены потребительские графические процессоры семейства GeForce RTX 3000 — прим. ИА Красная Весна). A2 является станет заменой для аналога прошлого поколения NVIDIA T4.
Новый ускоритель выполнен в форме карты расширения, подключаемой по интерфейсу PCI-E 4,0×8. Он занимает один слот и оборудован пассивной системой охлаждения. A2 может работать в настраиваемом диапазоне мощностей с тепловыделением (TDP) от 40 до 60 Вт в диапазоне температур от 0 до 50°C.
A2 получил графические ядра, тензорные и аппаратную трассировку лучей. Базовая частота графического ядра составляет 1,14 ГГц в режиме кратковременного разгона (boost) — 1,771 ГГц. Устройство оборудовано 16 Гб оперативной памяти GDDR6 с шиной 128 бит. Пропускная способность памяти составляет 200 Гб/с.
Производительность в вычислениях чисел с плавающей запятой одинарной точности (FP32) составляет 4,5 ТФЛОПС против 8,1 ТФЛОПС у T4. При этом производительность при использовании тензорных ядер достигает 9 ТФЛОПС. Производительность в вычислениях FP16 и BF16 — 18 ТФЛОПС.
Несмотря на большие показатели пиковой производительности, у T4 разница, как минимум, не всегда в его пользу. NVIDIA привела сравнение производительности на базе идентичного сервера по решению задачи анализа видео с использованием нейросетей. A2 оказался в 1,2 — 1,3 раза производительнее за счет тензорных ядер. При этом новы ускоритель будет в 1,6 раза дешевле и на 10% энергоэффективнее.