Полупроводники имеют тенденцию со временем уменьшатся в размерах, но новое кремниевое изделие от Cerebras, компании, специализирующейся на искусственном интеллекте и глубоком обучении, оказалось самым большим чипом в мире.
Он носит название Wafer Scale Engine (сокращённо WSE, читается как «wise») и содержит в себе более триллиона (да, ТРИЛЛИОНА!) транзисторов (1,2 триллиона, если быть точными).
Для сравнения: новейший графический процессор на архитектуре Turing от Nvidia содержит 18,9 млрд. транзисторов, при этом 8-ядерный AMD Zen 2 имеет 7-нм чиплет с 3,9 млрд. транзисторов и 12-нм чиплет ввода-вывода с 2,09 млрд. транзисторов. Как необычно!
По данным Cerebras, их чип размером 46,225 мм2 в 56 раз больше, чем самый большой графический процессор в мире. Он также может похвастаться ошеломляющим количеством ядер в 400 000 и 18 ГБ встроенной памяти (SRAM) с пропускной способностью 100 петабит в секунду (Пб/с).
Для чего же нужна вся эта вычислительная мощь? WSE вряд ли когда-нибудь доберётся до десктопов рядовых пользователей: размер чипа 215 мм х 215 мм — больше, чем некоторые коврики для мышек. На самом деле главная цель, с которой Cerebras разработали WSE, — это глубинное обучение, в частности для ускорения задач, которые обычно занимают месяцы; теперь для их выполнения будет достаточно минут.
Мы считаем, что глубокое обучение — это самая важная область вычислений в наше время. Его требования уникальны, а спрос растет беспрецедентными темпами. Большие задачи по обучению часто требуют скорости вычислений в пета- или даже экза- масштабах, а с имеющимися на сегодня процессорами обучение крупных моделей обычно занимает дни или даже месяцы.
Глубокое обучение лежит в основе почти всего в наши дни, по крайней мере, так кажется. От Google Фото до цифрового ассистента на вашем смартфоне, глубокое обучение играет огромную роль в том, как эти сервисы учатся, развиваются и адаптируются. Или пример, который более понятен геймерам, технология Nvidia Deep Learning Super Sampling (DLSS).
Чип выполнен по 16-нм техпроцессу TSMC и для работы требует 15 кВт электроэнергии — ещё одна причина, почему он никогда не попадёт в настольные ПК.
Комментарии