Наука и техника

Яндекс Переводчик получил крупное обновление на базе нейросетей

Большая языковая модель YandexGPT подготовила эталонные примеры текстов, на которых обучили нейросеть в Яндекс Переводчике. Это позволило сервису точнее понимать контекст, распознавать фразеологизмы и ориентироваться в профессиональной лексике.

Яндекс Переводчик получил крупное обновление на базе нейросетей

© Российская Газета

Как заверяет отечественный IT-гигант, Переводчик стал качественнее справляться с длинными и сложными текстами. Благодаря дообучению он лучше определяет взаимосвязи внутри предложений и между ними. Кроме того, выросло качество перевода статей узконаправленной тематики. Например, сервис теперь поймёт по контексту, что речь идёт о языке программирования или фондовом индексе, и оставит их названия без перевода.

Как рассказали "РГ" в пресс-службе компании, технологии машинного перевода на основе нейросетей используются с 2018 года. Нейросеть в Переводчике обучалась только на парах текстов — оригиналах и их переводе на другой язык. Так она училась видеть взаимосвязи между ними и подражать им. Нейросеть, работающая в сервисе, легковесная: это позволяет ей справляться с большим количеством пользовательских запросов в реальном времени.

В офисе российского поисковика отдельно отмечают, что языковая модель способна генерировать сложные, лексически и стилистически разнообразные тексты, в том числе со специфической терминологией. Поэтому компания использовала её потенциал для создания эталонных примеров, чтобы расширить датасет и повысить его качество. Так нейросеть не утратила скорость своей работы, но стала умнее.

Разработчики утверждают, что для генерации эталонных обучающих примеров создана специализированная модель семейства YandexGPT, адаптированная под задачи перевода. Сначала модель во время этапа pretraining проанализировала множество текстов на английском и русском языках и изучила правила лексики, морфологии и синтаксиса. Следующим этапом шла тонкая настройка языковой модели (supervised finetuning) под задачи перевода. Затем на этапе reinforcement learning AI-тренеры оценивали качество перевода и ранжировали ответы от лучших к худшим.

Работу дообученной оценивали методом Side by Side (SbS). Асессоры, владеющие русским и английским языком, сравнивали пары длинных и сложных текстов, переведённых с помощью двух версий технологии, и выбирали лучший вариант. В 57% случаев новая версия справлялась лучше.

Обновлённая технология используется для перевода текстов с английского на русский язык в Переводчике, Поиске, а также в переводе видео в Браузере.

Источник: news.rambler.ru

Похожие записи

Bloomberg: 2024 год может стать самым жарким в истории из-за Эль-Ниньо

К 2050 году плодородные почвы сдвинутся на север

Илон Маск запретит в своих компаниях технику Apple из-за ChatGPT

Открыт новый тип выбросов, связанный с вечной мерзлотой

Умер предсказавший «частицу бога» ученый Питер Хиггс

Япония отложила намеченный на 15 февраля запуск новой ракеты-носителя H3

Астронавт НАСА сравнил освоение Луны с покорением Антарктиды

В сети появились первые живые фото неанонсированного Realme GT6

Израиль первым в мире одобрил продажу «говядины из пробирки»

Ученых потрясло открытие огромной кольцевой космической структуры

Windows 11 начнет помечать компьютеры без поддержки ИИ специальным водяным знаком

Samsung и iPhone не вошли в ТОП-5: смартфоны с лучшими камерами по итогам слепого теста

Ваш комментарий

49 − = 42

* Используя эту форму, вы соглашаетесь с хранением и обработкой ваших данных этим веб-сайтом.

Новости от партнеров

Этот сайт использует файлы cookies и сервисы сбора технических данных посетителей. Ок Прочитать подробнее