NVIDIA выпустила следующее поколение суперкомпьютерных чипов искусственного интеллекта, которые, вероятно, сыграют большую роль в будущих прорывах в области глубокого обучения и больших языковых моделей (LLM), таких как GPT-4 от OpenAI, объявила компания. Эта технология представляет собой значительный скачок по сравнению с предыдущим поколением и может использоваться в центрах обработки данных и суперкомпьютерах для решения таких задач, как прогнозирование погоды и климата, открытие лекарств, квантовые вычисления и многое другое.
Ключевой продукт — графический процессор HGX H200 на базе процессора NVIDIA. "Хоппер" архитектура, замена популярного графического процессора H100. Это первый чип компании, использующий память HBM3e, которая быстрее и имеет большую емкость, что делает его более подходящим для больших языковых моделей. "Благодаря HBM3e NVIDIA H200 обеспечивает 141 ГБ памяти со скоростью 4,8 терабайт в секунду, что почти вдвое превышает емкость и в 2,4 раза большую пропускную способность по сравнению со своим предшественником NVIDIA A100." компания написала.
Что касается преимуществ для искусственного интеллекта, NVIDIA заявляет, что HGX H200 удваивает скорость вывода в Llama 2, LLM с 70 миллиардами параметров, по сравнению с H100. Он будет доступен в 4- и 8-канальных конфигурациях, совместимых как с программным, так и с аппаратным обеспечением систем H100. Он будет работать в центрах обработки данных любого типа (локальных, облачных, гибридных и периферийных) и будет развернут, среди прочего, с помощью Amazon Web Services, Google Cloud, Microsoft Azure и Oracle Cloud Infrastructure. Он должен прибыть во втором квартале 2024 года.
Другой ключевой продукт NVIDIA — GH200 Grace Hopper. "суперчип" который объединяет графический процессор HGX H200 и процессор NVIDIA Grace на базе Arm с использованием соединения NVLink-C2C компании. Он разработан для суперкомпьютеров, чтобы позволить "ученые и исследователи для решения самых сложных мировых проблем путем ускорения сложных приложений искусственного интеллекта и высокопроизводительных вычислений, обрабатывающих терабайты данных," NVIDIA написала.
GH200 будет использоваться в "Более 40 суперкомпьютеров искусственного интеллекта в глобальных исследовательских центрах, производителях систем и поставщиках облачных услуг," сообщила компания, в том числе от Dell, Eviden, Hewlett Packard Enterprise (HPE), Lenovo, QCT и Supermicro. Среди них следует отметить суперкомпьютеры HPE Cray EX2500, которые будут использовать четырехъядерные процессоры GH200 и масштабироваться до десятков тысяч узлов Grace Hopper Superchip.
Возможно, самым большим суперкомпьютером Грейс Хоппер станет JUPITER, расположенный на заводе в Юлихе в Германии. "самая мощная в мире система искусственного интеллекта" когда он будет установлен в 2024 году. Он использует архитектуру с жидкостным охлаждением, "с бустерным модулем, содержащим около 24 000 суперчипов NVIDIA GH200, соединенных с сетевой платформой NVIDIA Quantum-2 InfiniBand," по данным NVIDIA.
NVIDIA заявляет, что JUPITER будет способствовать научным прорывам в ряде областей, включая прогнозирование климата и погоды, создание моделирования климата и погоды в высоком разрешении с интерактивной визуализацией. Он также будет использоваться для открытия лекарств, квантовых вычислений и промышленного проектирования. Во многих из этих областей используются специальные программные решения NVIDIA, которые упрощают разработку, но также делают группы суперкомпьютеров зависимыми от оборудования NVIDIA.
Новые технологии будут ключевыми для NVIDIA, которая сейчас получает большую часть своих доходов от сегментов искусственного интеллекта и центров обработки данных. В прошлом квартале выручка компании только в этой области составила рекордные 10,32 миллиарда долларов (из общей выручки в 13,51 миллиарда долларов), что на 171 процент больше, чем год назад. Компания, без сомнения, надеется, что новый графический процессор и суперчип помогут продолжить эту тенденцию. Буквально на прошлой неделе NVIDIA побила свой собственный рекорд по обучению искусственного интеллекта, используя старую технологию H100, поэтому ее новая технология должна помочь ей увеличить преимущество над конкурентами в секторе, где она уже доминирует.
Эта статья первоначально появилась на Fanoftech по адресу Нажмите здесь, чтобы узнать больше новостей