Крупнейший производитель графических процессоров Nvidia готовится представить новый тип чипа, ориентированный на так называемый AI-инференс — выполнение и обработку запросов искусственного интеллекта в реальном времени. Ожидается, что устройство будет официально анонсировано на ежегодной конференции разработчиков GTC.
Почему компания меняет стратегию
До сих пор Nvidia в основном продвигала универсальные GPU, которые использовались как для обучения нейросетей, так и для их работы. Однако рынок меняется: всё больше компаний запускают готовые модели ИИ, которым требуется не обучение, а быстрая обработка запросов пользователей.
Новый чип должен быть оптимизирован именно для этой задачи. Он позволит ускорить ответы систем искусственного интеллекта и снизить энергопотребление дата-центров.

Технологии из стартапа Groq
В разработке нового процессора Nvidia использует технологии стартапа Groq, известного своими так называемыми Language Processing Units — специализированными чипами для обработки языковых моделей.
Компания фактически встроила эту архитектуру в свою экосистему после крупной сделки стоимостью около 20 миллиардов долларов, заключённой в конце прошлого года.
По данным аналитиков, такие решения могут значительно ускорить работу систем вроде чат-ботов, голосовых ассистентов и генеративных моделей.
Битва за рынок AI-инфраструктуры
Разработка нового чипа связана и с растущей конкуренцией. Крупные технологические компании, включая Google, Meta и Microsoft, активно создают собственные процессоры для искусственного интеллекта, чтобы снизить зависимость от Nvidia.
Например, Meta уже представила несколько поколений собственных AI-чипов, которые будут использоваться для алгоритмов рекомендаций и генеративных моделей внутри сервисов компании.

Почему это важно
Эксперты считают, что в ближайшие годы основная часть вычислений в сфере искусственного интеллекта будет связана именно с инференсом — то есть с обработкой запросов пользователей.
По прогнозам отрасли, к 2030 году этот сегмент может занять до 75% всего рынка AI-инфраструктуры дата-центров, который оценивается более чем в 1 триллион долларов.
Если новая архитектура Nvidia окажется успешной, компания сможет сохранить лидерство в одной из самых быстрорастущих технологических отраслей мира — инфраструктуре для искусственного интеллекта.
