Компания NVIDIA объявила о начале производства на своих фабриках новых графических процессоров с архитектурой Ampere. Новинка будет использоваться в большом количестве устройств обработки графики, нейронных сетей, больших массивов данных и научной аналитики на ближайшие годы.
Графический процессор NVIDIA A100 выпускается по 7-нм технологии компанией TSMC и содержит более 54 млрд транзисторов на площади 826 кв. мм, что делает его крупнейшим в своём классе.
NVIDIA A100 располагает шестью стеками памяти типа HBM2 производства Samsung совокупным объёмом 40 Гбайт с пропускной способностью 1,6 Тбайт/с. Ядра CUDA разделились по специализации: для вычислений с плавающей запятой двойной точности (FP64) отведено 3456 штук, одинарной (FP32) — 6912 штук. Количество тензорных ядер достигло 432 штук, предусмотрены и потоковые мультипроцессоры в количестве 108 штук.
NVIDIA утверждает, что обучение нейронных систем с применением графических процессоров происходит в 20 раз быстрее по сравнению с предшественниками.
Сфера применения ускорителей с архитектурой Ampere — это не только системы искусственного интеллекта, но и анализ «больших данных», научные расчёты и облачная графика. Архитектура Ampere использует тензорные ядра третьего поколения с поддержкой вычислений TF32. Внедрена и поддержка вычислений с плавающей запятой двойной точности (FP64).
Пиковая производительность A100 в обучаемых системах при использовании вычислений с плавающей запятой одинарной точности (FP32) достигает 312 терафлопс, это в двадцать раз выше, чем у Volta. Целочисленные операции (INT8) в системах, способных делать логические выводы, Ampere выполняет со скоростью 1,248 трлн штук в секунду. В высокопроизводительных операциях с двойной точностью (FP64) новый NVIDIA A100 оказывается в 2,5 раза быстрее предшественника.
Новый графический процессор может использоваться и в серверном оборудовании. Для этого есть поддержка интерфейса NVLink третьего поколения, который позволяет обмениваться данными с аналогичными графическими процессорами со скоростью 600 Гбайт/с. Каждый графический процессор Ampere поддерживает двенадцать каналов NVLink 3.0. Также стоит отметить, что графический процессор A100 является первым продуктом NVIDIA с поддержкой PCI Express 4.0 в серверном сегменте. Кроме того, технология виртуализации MIG позволяет разделять ресурсы одного графического процессора на семь независимых сегментов.
NVIDIA подчёркивает, что серийное производство графического процессора A100 уже началось, ускорители на его основе поставляются клиентам. Им потребуется какое-то время, чтобы интегрировать эти ускорители в своих вычислительных системах. В суперкомпьютерах, например, Ampere можно будет использовать не ранее конца 2020 года.
Информации о сроках поступления игровых видеокарт с архитектурой Ampere пока нет.