Nvidia готовит новый чип для искусственного интеллекта — ставка на скорость ответов

Крупнейший производитель графических процессоров Nvidia готовится представить новый тип чипа, ориентированный на так называемый AI-инференс — выполнение и обработку запросов искусственного интеллекта в реальном времени. Ожидается, что устройство будет официально анонсировано на ежегодной конференции разработчиков GTC.

Почему компания меняет стратегию

До сих пор Nvidia в основном продвигала универсальные GPU, которые использовались как для обучения нейросетей, так и для их работы. Однако рынок меняется: всё больше компаний запускают готовые модели ИИ, которым требуется не обучение, а быстрая обработка запросов пользователей.

Новый чип должен быть оптимизирован именно для этой задачи. Он позволит ускорить ответы систем искусственного интеллекта и снизить энергопотребление дата-центров.

Технологии из стартапа Groq

В разработке нового процессора Nvidia использует технологии стартапа Groq, известного своими так называемыми Language Processing Units — специализированными чипами для обработки языковых моделей.

Компания фактически встроила эту архитектуру в свою экосистему после крупной сделки стоимостью около 20 миллиардов долларов, заключённой в конце прошлого года.

По данным аналитиков, такие решения могут значительно ускорить работу систем вроде чат-ботов, голосовых ассистентов и генеративных моделей.

Битва за рынок AI-инфраструктуры

Разработка нового чипа связана и с растущей конкуренцией. Крупные технологические компании, включая Google, Meta и Microsoft, активно создают собственные процессоры для искусственного интеллекта, чтобы снизить зависимость от Nvidia.

Например, Meta уже представила несколько поколений собственных AI-чипов, которые будут использоваться для алгоритмов рекомендаций и генеративных моделей внутри сервисов компании.

Почему это важно

Эксперты считают, что в ближайшие годы основная часть вычислений в сфере искусственного интеллекта будет связана именно с инференсом — то есть с обработкой запросов пользователей.

По прогнозам отрасли, к 2030 году этот сегмент может занять до 75% всего рынка AI-инфраструктуры дата-центров, который оценивается более чем в 1 триллион долларов.

Если новая архитектура Nvidia окажется успешной, компания сможет сохранить лидерство в одной из самых быстрорастущих технологических отраслей мира — инфраструктуре для искусственного интеллекта.