Компания «Яндекс» представила новую версию своего переводчика. Среди ключевых особенностей обновления – более высокое качество перевода благодаря использованию большой языковой модели YandexGPT. «Яндекс Переводчик» стал лучше ориентироваться в контексте, фразеологизмах и профессиональной лексике.
Использование языковой модели YandexGP в рамках обновления «Яндекс Переводчика» помогло сервису более качественно устанавливать связь между предложениями. В итоге сервис гораздо лучше справляется с длинными текстами. Благодаря навыкам анализа контекста машинный переводчик определяет профессиональную направленность текста и оставляет необходимые термины без перевода.
На этапе предварительного обучения команда «Яндекса» заводила большой объём текстов на русском и английском языках, изучая лексику, морфологию и синтаксис. Далее была произведена тонкая настройка большой языковой модели под задачи перевода. На этапе Reinforcement Learning (RL) производилась оценка качества перевода YandexGPT, а результаты ранжировались от лучших к худшим.
По завершении дополнительного обучения нейросети «Яндекс Переводчика» её работу подвергли сравнительной оценке. Владеющие русским и английским языками специалисты сравнивали пары длинных и сложных текстов, переведённых двумя версиями нейросети — новая справилась со своей задачей лучше в 57% случаев. Обновлённая платформа уже подключена к «Яндекс Переводчику», поисковой системе и службе перевода видео в «Яндекс Браузере».
«Яндекс» начал использовать ИИ в «Переводчике» с 2018 года, обучив его на парах текстов — в оригинале и переводе на другой язык.