Пользователи устройств на Android или iOS получили возможность протестировать работу генеративной нейросети «Яндекса» под названием «Шедеврум». Одноимённое мобильное приложение позволяет создавать детализированное изображение на основе текста. Программа доступна всем желающим в AppStore и Google Play.
Нейросеть «Яндекса» работает с текстовыми описаниями на русском и английском языках. Команда разработчиков при этом рекомендует писать пожелания максимально конкретно: нейросеть выполняет работы в разных художественных стилях, подражает известным живописцам и понимает инструкции вроде «фотореализма» и «высокой детализации». Получив текстовое описание, нейросетевой алгорим создаёт базовую версию картинки, после чего в несколько шагов увеличивает её разрешение и добавляет новые детали — такой метод называется каскадной диффузией.
На этапе бета-теста первую версию генеративной модели обучили на 240 млн изображений и соответствующих им текстовых описаний. Работа продолжается — новый объём данных включает 500 млн примеров, поэтому качество работы «Шедеврума» постепенно вырастет.
Как отмечает руководитель управления машинного интеллекта и исследований «Яндекса» Алексей Гусаков, к финальному релизу нейросеть будет генерировать «баннеры, иллюстрации, создавать изображения для интернет-витрин и не только», но пока это не более чем источник хорошего настроения для пользователей.
Сейчас в приложениях «Шедеврум» можно преимущественно лишь знакомиться с результатами работы нейросети, отмечая понравившиеся изображения в ленте. Собственное описание для генерации изображения пока можно предложить в формате заявки и дождаться её подтверждения. В перспективе это ограничение планируют снять, и отправлять свои описания смогут все зарегистрированные пользователи.
Установить «Шедеврум» можно из AppStore и Google Play.