Контекст – слабое место систем машинного перевода
Машинный перевод — в каких случаях можно его использовать? Как определить качество перевода при использовании автоматических систем? В нашей статье предлагаем вам познакомиться с понятием «Контекста», которое в большой степени определяет пригодность системы машинного перевода для конкретного текста.
Контекст – это относительно законченный по смыслу отрывок текста или устной речи, в пределах которого наиболее точно и конкретно выявляется смысл и значение отдельного входящего в него слова, фразы, совокупности фраз.
Как мы можем видеть из вышесказанного, контекст является неотъемлемой частью каждого текста. Без контекста точный смысл отдельных слов остаётся непонятным получателю информации. Если этим получателем выступает переводчик, то возрастает вероятность ошибок в переводе. Слова по своей природе многозначны и имеют множество синонимов. Иногда может показаться, что человек просто слишком ленив, чтобы изобрести оригинальную лексическую форму для каждого значения слова. Почему? Да ведь взяв любой словарь на любом языке можно воочию убедиться, какой широкий набор разнообразных значений имеют некоторые слова. И, как правило, именно такие слова наиболее употребимы в нашей повседневной жизни.
Для нас, людей, процесс вычленения контекста из текста естественны, ведь этот навык доступен нам с первых этапов овладения речью. Для искусственного разума же понять смысл любого высказывания слишком тяжело. Системы машинного перевода «знают», какие соответствия слова имеют в других языках, но они не в состоянии осмыслить и проанализировать полную картину, которую рисует контекст. Они испытывают трудности в понимании общего среди массы деталей.
Контекст может подсказать, какой выбор сделать, как правильно перевести ту или иную фразу. Однако, иногда даже предельно ясный контекст не даёт всей необходимой информации, и переводчик должен положиться на свои аналитические навыки, чтобы справиться с задачей. Вот оно – самое слабое место всех систем автоматического перевода. Они не могут анализировать контекст и принимать обоснованные решения в неоднозначных ситуациях. Их единственная приемлемая стратегия заключается в построении предположений о верности той или иной переведенной конструкции.
Существуют различные методы машинного перевода — прямой, основанный на правилах, статистический, гибридный – но все эти методы, в основном, направлены на перевод текстов с достаточно общим содержанием и поверхностным контекстом. Случись так, что «словарный запас» электронного переводчика окажется недостаточно богатым или в тексте встретятся крайне необычные и редкие слова, качественного перевода, как ни крути, не получить.
Так что мысль об идеальных системах машинного перевода практически нереальна, так как электронный мозг способен оперировать лишь теми алгоритмами, которые в него предварительно заботливо заложены человеком. Для того чтобы быть в силах перевести любой текст, да притом качественно, программа-переводчик должна иметь фоновые знания. И даже если (что очень маловероятно) кому-то удастся обучить её всем известным человеку техникам и методам перевода, то результат все равно будет далек от идеального, так как машина не имеет способностей к анализу контекста.
На основе всего вышесказанного, весьма преувеличенным кажется страх того, что системы машинного перевода заменят настоящих переводчиков. Профессиональные переводчики всегда будут иметь преимущество перед электронными системами благодаря умению понимать контекст. Естественные языки настолько нелогичны и обладают такими списками исключений, что машины даже с их логическими и математическими подходами и алгоритмами будут еще долго иметь неразрешимые проблемы с переводами.
Однако это не означает, что электронные переводчики совершенно бесполезны. Есть масса случаев, когда плохой перевод лучше, чем его отсутствие.
Иван Родин