Машинный перевод: не только Google Translate

Google Translate является одной из самых популярных систем мгновенного перевода в режиме онлайн. Многие уже смело ассоциируют её с понятием «машинный перевод», и это верно, но только отчасти. Хотя эта система действительно классифицируется как один из типов «машинного перевода», она – совершенно иной инструмент и разительно отличается от тех, которые используют профессиональные поставщики переводческих услуг (Language Service Providers).

Для генерации переводов Google Translate (GT) осуществляет поиск в специализированной базе данных. В этой базе содержатся миллионы различных предложений, которые уже были когда-то переведены специалистами. Программа проводит анализ, сопоставляя модели в языке оригинала и языке перевода, и делает «обоснованное» предположение о более подходящем варианте перевода. Весь вышеописанный процесс поиска сопоставимых моделей в больших массивах текстов называется «статистическим машинным переводом» (Statistical Machine Translation, SMT).

Нет такого активного пользователя интернета, который ещё не испытал бы на себе работу Google Translate. Процесс прост: вы вводите слова и получаете молниеносный перевод на любой из около 80 языков. Качество такого перевода варьируется от превосходного до не слишком удачного, в зависимости от соответствия тематики введенного текста загруженным в базу данных образцам. Именно так описывает процесс действия программы немецкий ученый Франц Джозеф Ох, исполнительный директор проекта Google Translate.Чем больше текста доступно для анализа в базе данных, тем «умнее» становится система. Однако, интересен тот факт, что творческая команда Google Translate состоит только из математиков и программистов, лингвистов в ней нет совсем.

Некоторые системы, такие как PROMT, Asia Online, SYSTRAN и Moses, также часто соотносятся с понятием машинного перевода. Они представляют собой довольно сложные переводческие машины, специально обученные для выполнения определенных проектов и обеспечения максимальной эффективности и точности перевода. Часто используемые для технических и клишированных текстов без художественных тонкостей, такие программы могут помочь крупным корпорациям в переводе некоторых материалов.

В прошлом машинный перевод осуществлялся «на основе правил» (Rules Based Machine Translation, RBMT). Это означает, что в основу подобных программ легла именно информация о языковых структурах, а не математические формулы. Теперь системы машинного перевода часто представляют собой гибридные системы, сочетающие принципы RBMT и SMT. Эти системы требуют чрезвычайно высокого уровня капиталовложений как в аппаратное, так и в программное обеспечение, а также в процесс их обучения.

Мгновенные средства перевода в режиме онлайн, такие как Google Translate, являются подарком эпохе расширения коммуникаций. Доходит порой до того, что скорость перевода текста становится более важным критерием, чем точность его перевода. Например, некоторые коммерческие компании жаждут получать быстрый перевод информации о результатах своей деятельности в другой стране.

Но, к счастью, практические навыки человеческого интеллекта по-прежнему имеют огромное значение для точных переводов текстов, содержащих неоднозначность или крайне важную информацию, которую необходимо передать как можно точнее. Даже сложные системы машинного перевода подходят лишь как производители «сырой» переводной продукции, которая проверяется, исправляется и отшлифовывается человеком — профессиональным переводчиком.

Часто  можно услышать — «Да что там переводить, есть же системы машинного перевода, я и сам все перевести могу». Можете, конечно, мы не станем с вами спорить.  Но не все и не всегда! Просмотреть приблизительно содержание сайта на иностранном языке, понять общий смысл неспециализированной статьи или стандартной инструкции — да, сможете. Но мы не рекомендуем использовать машинный перевод при создании текстов для целевой аудитории, текстов творческого характера или с определенной ярко выраженной стилистикой (например, маркетинговых и рекламных материалов), а также текстов, содержащих специфическую терминологию (перевод договоров, контрактов, руководств пользователя). Небольшие проекты также не позволяют воспользоваться преимуществами машинного перевода.

Машинный перевод хорош своей автоматизацией обработки больших массивов текстов, но перевести как следует и получить качественный текст поможет пока только профессионал.

Иван Родин aka @Dahaka_stranger