Корпорация Google объявила о запуске новейшей нейросети PaLM 2, которая способна решать самые сложные математические задачи, писать код, формировать диаграммы и работать по узкоспециализированным запросам. Новая нейросеть будет доступна в составе чат-бота Google Bard, а также станет базовой платформой для большинства новых ИИ-функций. PaLM 2 уже доступна разработчикам через Google PaLM API, Firebase и Colab.
Google говорит о PaLM как о единой платформе моделей, в которое входят множество моделей. Среди них и Med-PaLM 2 — модель, ориентированная на медицинские знания. Существует также Sec-PaLM, версия, ориентированная на решение вопросов безопасности, и уменьшенная версия PaLM 2, которая может работать на смартфонах и потенциально откроет PaLM для вариантов использования с упором на конфиденциальность, когда ИИ работает не выходя за пределы устройства пользователя.
Как отметили в Google, PaLM 2 была обучена на основе новейшей инфраструктуры Google JAX и TPU v4. Новая модель лучше подходит для философских рассуждений, математики и логики. По словам вице-президента Google DeepMind Зубина Гахрамани, команда разработчиков обучила модель большому количеству математических и научных текстов с поддержкой математических формул. Не секрет, что большие языковые модели с трудом справляются с математическими задачами, не прибегая к сторонним плагинам. Однако, Google утверждает, что PaLM 2 может легко решать математические задачи и даже создавать диаграммы.
PaLM 2 также имеет улучшенную поддержку написания и отладки кода. Модель была обучена на 20 языках программирования, в том числе на популярных, таких как JavaScript и Python, а также на узкоспециалзированных, как Prolog, Verilog и Fortran. PaLM 2 легла в основу Codey — специализированной ИИ-модели Google для написания кода и его отладки, которую Google также запускает сегодня в рамках своей службы автодополнения и генерации кода, среди прочего.
Google также подчеркнула, что PaLM 2 была обучена с помощью более 100 мировых языков, что делает её, по словам компании, «отличным решением для многоязычных задач», чем предыдущие модели.
Помимо этого, Google объявила о полноценном запуске своего чат-бота Bard на базе генеративных нейросетей нового поколения. С 11 мая ИИ-чат-бот Bard станет доступен в 180 странах всем желающим. Однако запуск всё равно обозначается как тестовый. Ранее Bard был доступен только на английском языке.
С 11 мая Bard доступен на английском, японском и корейском языках. В ближайшее время Google планирует добавить поддержку 40 языков, включая русский. Чат-бот будет не только понимать вопросы на разных языках, но и отвечать на них.
Стоит отметить, что Bard работает не только с естественными языками, но и знает 20 языков программирования. Он способен объяснять смысл конкретной строчки кода и находить в коде ошибки, объясняя их и исправляя.
Помимо этого, Google объявила, что в скором времени Bard получит новые функции. Так, ответы в чате станут более наглядными. Например, пользователь смоет спросить: «Какие достопримечательности обязательно нужно посетить в Новом Орлеане?». И в дополнение к тексту чат-бот предоставит изображения.
Более того, картинки можно будет включать в запросы к Bard, и чат-бот сможет редактировать их. Для реализации этой возможности Google добавила Lens прямо в Bard. Например, вы можете загрузить фото своих собак и попросить Bard «написать смешную надпись об этих двоих». Используя Google Lens, чат-бот проанализирует фотографию, определит породу собак и составит несколько креативных подписей.
Google анонсировала ряд других нововведений для Bard. Начиная со следующей недели цитирование источников станет более точным. Если Bard приводит блок программного кода или цитирует другой контент, можно будет просто нажать на аннотацию, и Bard подчеркнет заимствованные части ответа и даст ссылку на источник. Ещё сегодня у Bard появится тёмная тема — это еще одна функция, о которой просили разработчики, и которая, как считают в Google, поможет сделать взаимодействие с Bard намного комфортнее для глаз пользователей.
Кроме того, у чат-бота появится кнопка «Экспорт», с помощью которой появится возможность экспорта и запуска кода с помощью Replit, начиная с языка Python. Помимо этого, пользователи смогут легко переносить ответы Bard в электронную почту Gmail и «Документы». Таким образом, к примеру, можно будет поросить Bard написать приглашение по электронной почте на вечеринку, кратко описав пожелания по дресс-коду или предложения, что взять с собой. Составленное ИИ письмо окажется в «Черновиках» в Gmail, где пользователь сможет внести последние правки перед рассылкой.
Bard также сможет подключаться к всевозможным сервисам со всего интернета с помощью расширений от внешних партнеров. В ближайшие месяцы в Bard будет интегрирован Adobe Firefly — семейство творческих генеративных ИИ-моделей, что позволит легко и быстро превращать творческие идеи в изображения, которые затем можно будет редактировать или добавлять в свои проекты в Adobe Express. То есть Bard можно будет попросить нарисовать что угодно, и с помощью ИИ от Adobe он быстро сделает это.