Компьютерный перевод, какие проблемы у машин с переводом

7

Технологии ИИ, машинного обучения и нейросетей многое в нашей жизни перевернули. Тот же машинный перевод стал довольно умным, и делает последовательный перевод текстов с достаточно высоким качеством. Многие СМИ время от времени выбрасывают заголовки о том, что искусственный интеллект почти догнал человека в плане перевода текстов. А что происходит в этой области на самом деле?

Нейросети (ИИ-алгоритмы и модели), которые обучаются на больших объёмах данных, действительно существенно повысили качество для машинного перевода. Причём это стало заметно без всяких точных программ анализаторов. Если же поискать в сети старые курьёзы с переводами Google транслятора, то можно сравнить наглядно, что было тогда, и что выдаёт машина сегодня.

Как это работает

9

Итак, глубоко уходить в дебри алгоритмов не стоит, но основные принципы вспомним. С начала нулевых по 16 года в машинных переводчиках типа Google Translate разработчики использовали статистический автоматический перевод по отдельным фразам. То есть алгоритм делил текст на слова и фразы, которые у него были вбиты в словарях, далее применялась статистика переводов. Ухищрений разных тоже было много, но это не помогало от возникновения кучи ошибок. Подход был не слишком гибким.

8

Как только появились нейросети, ситуация изменилась, переводчики стали переходить на машинное обучение. Конечно, нейросети тоже учатся на готовых решениях, однако эти готовые переводы потом используются гораздо гибче. Уже нет необходимости выделять фразы, фиксировать цепочки, алгоритм ИИ самостоятельно запоминают найденные закономерности, учатся на больших объёмах данных. И это очень сильно повысило качество компьютерных\машинных переводчиков. Однако говорить о том, что нейросети приблизились к человеческому переводу, слишком рано, пока это день и ночь, машинные переводчики даже близко не тянут в соревновании с человеческим мозгом. Отсюда и ошибки, которые обычный переводчик не допустил вообще. В общем, пока это только нейросети и машинное обучение, все разговоры о появлении искусственного интеллекта просто попытка форсировать события.

В чём проблема нейросетей

10

Машинные переводчики имеют недостатки, совершенно отличные от проблем, которые возникают у человеческого перевода. В недостатки можно определить достоверность, туда же память, а также здравый смысл.

Что же с достоверностью? Машинный перевод может всегда оказаться полностью недостоверным, просто непонятным или ошибочным. Алгоритмы не могут гарантировать достоверность перевода, они многое пропускают, отрицания, частицы, иногда выпадают целые фразы.

6

С памятью тоже не всё хорошо, потеря оперативной (кратковременной памяти) характерна таким системам. Они заточены делать перевод лишь одного предложения. Всё, второе предложение начинается с чистого листа, без учёта предыдущего предложения, его смысла. То есть получается, как игра с продолжением фразы, на вечеринках была такая – когда каждый участник, не зная предыдущих слов, кроме последнего, добавляет в цепочку своё.

Со здравым смыслом ещё печальнее, ведь машина просто не может им обладать, во всяком случае тем, который мы понимает, то есть у машины нет внешнего контекста, нет знаний обо всём мире. В этом и есть разница, машина не умеет различать контексты, а они очень важны в переводах.

1 Звезда2 Звезды3 Звезды4 Звезды5 Звёзд (Пока оценок нет)
Загрузка...


Добавить комментарий

Ваш e-mail не будет опубликован.