Лондон, Великобритания – Компания Google DeepMind анонсировала Gemini 1.5, последнее обновление своей флагманской модели искусственного интеллекта Gemini, которая обещает значительно расширить возможности AI благодаря беспрецедентному контекстному окну. Новая версия, как утверждают разработчики, способна обрабатывать огромные объемы информации, превосходя возможности большинства существующих моделей на порядок.
Ключевой особенностью Gemini 1.5 является экспериментальное контекстное окно, достигающее 1 миллиона токенов. Для сравнения, Gemini 1.0 Pro предлагает 32,000 токенов, а конкуренты, такие как Claude 2 от Anthropic, имеют контекстное окно в 200,000 токенов. Это означает, что Gemini 1.5 может анализировать примерно 1 час видео, 11 часов аудио, базы кода объемом более 30 000 строк или тексты объемом более 700 000 слов в рамках одного запроса.
“Такое огромное контекстное окно открывает совершенно новые возможности для AI”, – заявил представитель Google DeepMind на презентации. “Представьте себе, что вы можете загрузить весь сценарий фильма в AI и попросить его проанализировать мотивации персонажей или найти скрытые отсылки. Или вы можете дать ему огромную базу кода и попросить его найти баги или оптимизировать производительность.”
Gemini 1.5 достигает этого благодаря новой архитектуре под названием Mixture-of-Experts (MoE). Вместо того, чтобы использовать одну огромную нейронную сеть, MoE состоит из нескольких меньших “экспертных” сетей. Для каждого запроса система динамически выбирает наиболее подходящих экспертов, что позволяет значительно повысить эффективность и масштабируемость модели.

Внутренние тесты показали, что Gemini 1.5 превосходит Gemini 1.0 Pro в большинстве задач, включая обработку естественного языка, машинный перевод и генерацию кода. Кроме того, новая модель демонстрирует впечатляющие результаты в анализе сложных и длинных текстов, а также в понимании контекста в видео- и аудиоматериалах.
В настоящее время Gemini 1.5 доступна в ограниченном preview-режиме для избранных разработчиков и корпоративных клиентов. Google планирует постепенно расширять доступ к модели в течение ближайших месяцев. Компания также изучает различные способы монетизации Gemini 1.5, включая предоставление API-доступа и интеграцию в свои облачные сервисы.
Анонс Gemini 1.5 вызвал большой ажиотаж в AI-сообществе. Эксперты отмечают, что такое огромное контекстное окно может привести к значительным прорывам в различных областях, от автоматизации рутинных задач до создания более умных и полезных AI-ассистентов. Однако, некоторые также выражают опасения относительно потенциальных рисков, связанных с использованием таких мощных моделей, включая возможность злоупотребления и распространения дезинформации.

Несмотря на эти опасения, Gemini 1.5 представляет собой важный шаг вперед в развитии искусственного интеллекта и открывает новые горизонты для использования AI в самых разных сферах. Остается только наблюдать, как эта технология будет развиваться и какие возможности она принесет в будущем.