Корпорация Google запустила собственный нейросетевой инструмент генерации текстового и графического контента под названием Gemini. Разработчики заявляют, что новый алгоритм работает не хуже известного во всём мире ChatGPT от OpenAI, они рассчитывают на хорошие продажи своего сервиса со стороны бизнеса и сторонних разработчиков.
На презентации нового инструмента гендиректор Google Сундара Пичаи отметил, что запуск языковой модели Gemini является огромным шагом вперёд и в конечном счёте это окажет влияние практически на все продукты компании. Gemini представляет собой нечто большее, чем одна языковая модель. Новая ИИ-модель в конечном счёте будет интегрирована в поисковую систему Google, рекламные продукты компании, браузер Chrome и другие сервисы.
На данный момент Gemini может обрабатывать запросы на английском языке, но, очевидно, что в дальнейшем, появится поддержка других языков.
В рамках коммерциализации своего алгоритма Google выпустит три версии Gemini. Самая доступная версия ИИ-модели Gemini Nano предназначена для автономной работы на устройствах с Android. Она станет частью ОС и будет активно использоваться в смартфонах линейки Pixel.
Более производительная версия Gemini Pro в будущем станет основой многих сервисов Google и будет основой чат-бота Bard. Разработчики и корпоративные клиенты смогут получить доступ к Gemini Pro через Google Generative AI Studio или Vertex AI в Google Cloud, начиная с 13 декабря.
В дополнение к этому Google создала ИИ-модель Gemini Ultra, которая является самой мощной языковой моделью компании и в основном предназначена для использования в центрах обработки данных и интеграции с корпоративными приложениями. Возможность использования Gemini Ultra появится в следующем году.
На данный момент базовые версии Gemini поддерживают ввод и вывод текста, но более мощные версии алгоритма, такие как Gemini Ultra, могут работать с изображениями, видео и аудио. Конечно, эти модели всё ещё галлюцинируют, они не лишены предубеждений и других проблем, но со временем Google планирует улучшить их понимание окружающего мира.
В плане генерации кода алгоритм Google использует новую систему AlphaCode 2, которая, по словам представителей компании, работает лучше по сравнению с 85% аналогами конкурентов и на 50% лучше по сравнению с оригинальным алгоритмом AlphaCode.
Gemini обучалась с использованием тензорных процессоров Google, благодаря чему может работать быстрее и эффективнее, чем предыдущие алгоритмы компании, такие как PaLM. Наряду с новой языковой моделью Google представила ускорители TPU v5p, которые предназначены для использования в центрах обработки данных для обучения и запуска больших языковых моделей.