В предыдущей части* статьи мы рассмотрели, как нейронные машинные переводы (NMT) изменили ландшафт машинного перевода, достигнув значительных успехов в понимании контекста. Однако, несмотря на впечатляющие достижения, перевод художественной литературы остается серьезным вызовом для ИИ. Во второй части нашей статьи мы обсудим текущие ограничения машинного перевода в работе с нюансами литературных произведений и исследуем, как сотрудничество человека и машины может стать ключом к будущему качественного литературного перевода.
Оригинал статьи: https://www.goethe.de/prj/k40/en/lan/lit.html
В адаптации материала на русский помогло бюро переводов ТранЭкспресс
* - Предыдущую часть данной статьи вы можете найти в интернете по заголовку "Искусственный интеллект в художественном переводе: от истоков до нейронных сетей"
Конечно, машинный перевод несовершенен. При обратном переводе на английский фраза превращается в «Be true to yourself», утрачивая нюансы и историчность звучания шекспировских строк, которые были написаны во времена тюдоровской Англии. Буквальный дословный перевод будет выглядеть как «Sei deinem eigenen Selbst treu», но в «человеческом» переводе шекспировские строки по-немецки обычно звучат как «Sei dir selbst treu». Когда переводит человек, эти связи становятся значительно сложнее по сравнению с машинным переводом. Это связано с более высоким уровнем понимания контекста.
Источник фото: Трансэкспресс
Здесь поражает, как Google Переводчику удалось понять важность слова «treu» в этом контексте. Использование этого слова в немецком подразумевает, что Google Переводчик различает слово «treu», которое переводится как «true» в значении «верный своей натуре», и другое немецкое слово, которым тоже можно перевести «true» — «wahr», которое означает, что что-то соответствует действительности. Глубокое обучение означает, что неправильно переведенная фраза с большой вероятностью будет хотя бы частично исправлена через несколько недель — может быть, когда эта статья будет опубликована Google Переводчик уже исправит свои ошибки.
Такое непрерывное совершенствование наряду с собственным языком машины означает, что NMT можно научить переводу по принципу zero-shot translation, т. е. он сможет переводить с одного языка на другой напрямую, без необходимости использовать перевод на английский в качестве промежуточного этапа. По-видимому, для машин, как и для людей, секрет мастерства заключается в практике.
Потери при переводе
Несмотря на то, что в последние годы машинный перевод прошел огромный путь, ему все еще не удается достичь приемлемого уровня в литературном переводе. Писатель Генри Джеймс подчеркивал важность понимания текста на языке оригинала, говоря, что литературный переводчик должен быть человеком, «от которого ничто не ускользнет». И, как минимум, когда речь идет о литературе, до идеала машинам пока далеко.
NMT все еще испытывает сложности с редкими словами, именами собственными и узкоспециализированной лексикой в литературном переводе — на выходе лишь 25–30% текста соответствуют стандартам приемлемого литературного качества. В одном из исследований, посвященных переводу романов с немецкого на английский язык, было обнаружено, что, несмотря на очень небольшое количество синтаксических ошибок, смысл многозначных слов по-прежнему теряется при переводе. Однако, несмотря на такие ошибки, исследователи пришли к выводу, что машинный перевод позволяет получить текст достаточно высокого качества, чтобы понять рассказ и даже получить удовольствие от чтения. Другое исследование, посвященное переводу романов с английского на каталанский язык показало столь же впечатляющие результаты — в среднем 25% носителей языка сочли качество аналогичным переводу, выполненному человеком.
Однако машинный перевод не обеспечивает одинаковое качество для всех языковых пар. Особенно сложно ему даются морфологически богатые языки с большим количеством окончаний, например, славянские. Это особенно заметно при переводе с менее сложного языка на более сложный — т. е пока NMT не может считаться универсальным инструментом перевода.
Источник фото: Трансэкспресс
Найти нужный тон
Самой большой проблемой по-прежнему остается выбор правильного тона и стиля. По мнению Питера Константина, директора программы литературного перевода в Университете Коннектикута, чтобы преуспеть в литературном переводе, машинам требуется найти «нужный тон».
«Чему будет подражать машина? — спрашивает Константин. — Выдаст ли она блестящую форенизацию или потрясающую локализацию? Заставит ли чеховские строки звучать, как будто они написаны 10 минут назад в Лондоне?»
Какой тон выберет машина? Возьмем работы нобелевского лауреата Томаса Манна. Его стиль менялся со временем — в ранних рассказах он намного легче, чем в куда более тяжеловесных поздних романах. Машины должны будут понять и передать эти изменения, чтобы их перевод отражал задуманное автором.
Необходимое взаимодействие
Ясно, что несмотря на все усилия машин, многозначность и гибкость человеческого языка, свойственная литературным произведениям, по-прежнему требует участия человека. Нейронный машинный перевод не в состоянии заменить переводчиков-людей, но может быть полезным вспомогательным инструментом при переводе художественной литературы.
Ключ к успеху — взаимодействие между человеком и системами машинного перевода. Одним из решений этой задачи вероятно будет машинный перевод с последующей редактурой. Профессиональные переводчики, знающие, какие проблемы возникают при машинном переводе, будут редактировать и корректировать черновой вариант, представленный машиной. Это будет похоже на то, как опытный, состоявшийся переводчик помогает начинающему коллеге, правя его работу. Легкая постредактура машинного перевода предполагает незначительные правки, например исправление орфографических и грамматических ошибок, а полноценная редактура поможет исправить текст на более глубоком уровне, включая структуру предложения и стиль. Конечно, чтобы добиться нужного стиля и тона при переводе художественной литературы, скорее всего, потребуется полноценная постредактура. Исследователи, переводившие научно-фантастический роман с гэльского на ирландский язык обнаружили, что этот метод оказался на 31% быстрее по сравнению с переводом с нуля. При выполнении постредактуры производительность переводчика возрастает на 36% по сравнению с переводом с нуля, что дает плюс 182 переведенных слова в час.
В ситуации, когда роль искусственного интеллекта разных сферах нашей жизни растет, использовать его в качестве переводческого инструмента необходимо, чтобы двигать отрасль вперед. Машинный перевод прошел большой путь и вполне может использоваться в качестве вспомогательного инструмента при переводе художественной литературы при условии последующей редактуры. Он может взять на себя скучную и утомительную работу, занимающую много времени, оставив человеку возможность добавить завершающие штрихи. NMT не только сокращает нагрузку на переводчиков, но и открывает множество окон возможностей, связанных с языками, — от перевода текстов, которые никогда раньше не переводились, до помощи при изучении языков. Взаимодействуя с NMT, мы можем использовать его как инструмент для обучения, способный сделать литературу и языки более доступными для всех. Эта статья впервые была опубликована в рамках проекта Гёте-Института в Великобритании, посвященного искусственному интеллекту и литературному переводу.
Машинный перевод продолжает развиваться, и его потенциал в сфере художественной литературы огромен, особенно при условии синергии с человеческим интеллектом. Совместная работа человека и машины открывает новые горизонты для перевода, делая мировое литературное наследие доступным для широкой аудитории.
Список литературы:
- Brownlee, J. 2017. A Gentle Introduction to Neural Machine Translation. [по состоянию на 9 июля 2020 г.].
- Constantine, P. 2019. Google Translate Gets Voltaire: Literary Translation and the Age of Artificial Intelligence. Contemporary French and Francophone Studies. 23(4), pp. 471–479.
- Goldhammer, A. 2016. The Perils of Machine Translation. The Wire. [по состоянию на 14th июля 2020 г.].
- Google Brain Team. 2016. A Neural Network for Machine Translation, at Production Scale. [по состоянию на 9 июля 2020 г.].
- Gu, J., Wang, Y., Chu, K., Li. V. O. K. 2019. Improved Zero-shot Neural Machine Translation via Ignoring Spurious Correlations.arXiv. [по состоянию на 10 июля 2020 г.].
- Iqram, S. 2020. Now you can transcribe speech with Google Translate. [по состоянию на 9 июля 2020 г.].
- Jones, B., Andreas, J., Bauer, D., Hermann, K. M., and Knight, K. 2012. Semantics- Based Machine Translation with Hyperedge Replacement Grammars. Anthology. 12(1083), pp. 1359- 1376.
- Kravariti, A. 2018. Machine Translation: NMT translates literature with 25% flawless rate. Translate Plus. [по состоянию на 14 июля 2020 г.].
- Matusov, E. 2019. The Challenges of Using Neural Machine Translation for Literature. European Association for Machine Translation: Dublin, Ireland.
- Maučec, M. S., and Donaj, G. 2019. Machine Translation and the Evaluation of Its Quality Recent Trends in Computational Intelligence. Intech Open.
- Shofner, K. 2017. Statistical vs. Neural Machine Translation. ULG’s Language Solutions Blog. [по состоянию на 10 июля 2020 г.].
- Systran. 2020. What is Machine Translation? Rule Based Translation vs. Statistical Machine Translation. [по состоянию на 9 июля 2020 г.].
- Toral, A., Wieling, M., and Way, A. 2018. Post-editing Effort of a Novel with Statistical and Neural Machine Translation. Frontiers in Digital Humanities. 5(9).
- Turovsky, B. 2016. Ten years of Google Translate. [по состоянию на 9 июля 2020 г.].
- Wong, S. 2016. Google Translate AI invents its own language to translate with. New Scientist. [по состоянию на 11 июля].
- Yamada, M. 2019. The impact of Google Neural Machine Translation on Post-editing by student translators. The Journal of Specialised Translation. 31, pp. 87- 95.
- Zameo, S. 2019. Neural Machine Translation: tips and advantages for your digital translations. Text Master Go Global. [по состоянию на 14 июля 2020 г.].
Автор: Алана Гуллен — студентка Имперского колледжа Лондона, обучающаяся по магистерской программе в сфере научной коммуникации, автор статей на тему науки и политики в области научных исследований. Защищено авторским правом: Текст: Гёте-Институт, Аллана Гуллен. Работа опубликована по лицензии Creative Commons Attribution 4.0 International (CC BY-SA 4.0).
Источник фото обложки: Трансэкспресс
Понравился материал? Подпишитесь на нас в VK, Яндекс.Дзен и Telegram.