Немного об автоматизированном переводе


By Walerij Winnyk. Submitted on April 28, 2008

About the author: Walerij Winnyk is a Ukraine-based freelance translator. Diploma of Kharkov State University on geologic survey, search and exploration of minerals (1995). From the year 2000 on, his only business is translation.




– У вас «Традос» есть?
– А он вам нужен?
– Нужен!
– Раз нужен, то есть. 15 гривен.

(Из разговора с продавцом компакт-дисков)

В основе автоматизированного перевода лежит принцип «Не переводить одно и то же более одного раза». Для реализации этого принципа созданы компьютерные программы, «запоминающие» в своей базе данных оригинальный текстовый фрагмент и его перевод, чтобы в дальнейшем, когда такой же оригинальный фрагмент встретится снова, автоматически подставить вместо него его перевод, хранящийся в базе данных. По мере того, как переводчик работает, количество единиц перевода в базе данных увеличивается, и на выполнение дальнейших заказов у переводчика будет уходить меньше времени, так как часть работы по переводу фрагментов текста возьмёт на себя компьютерная программа. Таким образом, растёт производительность труда переводчика и соблюдается качество переводов за счёт ликвидации разнобоя в переводе терминов. Это по мнению разработчиков подобных программ. А на практике, с точки зрения фрилансера?

Начать с того, что для работы в такой программе оригинал должен быть в электронном виде. То есть, если вы получили «бумагу», текст нужно отсканировать, распознать и сохранить в том формате, который понимает ваша «кошка» – так эти программы называются на переводческом жаргоне, от английской аббревиатуры CAT (Computer Aided Translations, «перевод при помощи компьютера»), которая по-английски читается так же, как и название упомянутого животного. Естественно, что чем больше форматов воспринимает программа автоматизированного перевода, тем лучше. Дело осложняется тем, что некоторые «кошки» не работают с файлами определённых форматов без наличия на компьютере той программы, для которой данный формат и был разработан. Обычно это касается закрытых, проприетарных форматов, с которыми напрямую могут работать очень немного программ автоматизированного перевода. Если заказчик прислал оригинал как отсканированные «картинки», в большинстве случаев перед распознаванием их нужно выравнивать в графическом редакторе. А если таких «картинок» несколько десятков?

Но вот оригинал в электронном виде в нужном формате у нас есть. Для выполнения перевода «кошка» делит текст на отрывки, или сегменты, перевод каждого из которых она и «запоминает» вместе с оригиналом, чтобы занести пару «оригинальный фрагмент – его перевод» в базу данных как единицу перевода. Как правило, сегментирование текста происходит по предложениям или по параграфам (абзацам); правила сегментирования задаются в настройках программы автоматизированного перевода. Зная эти правила, следует внимательно просмотреть распознанный текст оригинала и подкорректировать те места, которые помешают программе правильно выполнить сегментирование. Иначе возможны случаи, когда, например, одно предложение программа разделит на несколько сегментов, а это очень нежелательно для перевода между языками, способ построения мысли в которых значительно отличается. А если текст на несколько сотен страниц?

Набирать перевод в программе работы с текстом сравнительно просто. А вот некоторые «кошки» могут потребовать значительных затрат времени на освоение управления ими. Да и само управление такими программами не всегда бывает удобным, требует выполнения множества служебных операций.

Работая в программе автоматизированного перевода, следует обращать внимание на тэги, т.е. служебные метки форматирования текста. Испортив по невнимательности какой-нибудь тэг, вы не получите файла с готовым переводом. Конечно, бывают такие «кошки», в которых тэги защищены от редактирования. Перед компиляцией готового перевода в файл нужного формата очень рекомендуется проверить тэги на отсутствие ошибок, вызвав соответствующую функцию «кошки», и если ошибки будут найдены, их необходимо исправить. Однако всегда возможна ситуация, когда программа не находит ошибок, создаёт файл перевода, а он не открывается в той программе, для которой был создан. Вообще, использование программы автоматизированного перевода есть лишнее, далеко не самое прочное звено, которое снижает надёжность всей технологической цепочки: зайдите, например, на любой специализированный форум в Интернете и посмотрите, сколько ненужных проблем доставляют любимые «кошки» владельцам. Причём чем престижнее, так сказать, порода животного, тем и проблем с ним больше. Пока переводчик думает над причинами и пытается их исправить, заказчик звонит и ненавязчиво так напоминает, что перевод должен был быть у него ещё час назад. Мои соболезнования коллеге.

Однако допустим, что файл перевода был создан программой успешно. Перед тем, как отправить его заказчику, его надо отформатировать. Можно бы было придать нужное форматирование сразу оригиналу, но это неэффективно: после перевода форматирование всё равно «поползёт», хотя бы из-за неодинаковой длины соответствующих друг другу фрагментов текста в оригинале и в переводе. Кроме того, нужно убрать лишние пробелы между словами и тому подобный мусор, придающий готовому документу непрофессионально-неряшливый вид. Не слишком ли много «обезьяньей» работы?

Применение «кошек» оправдано, когда переводчик «попал в струю» и прочно сидит на переводе однотипных документов, электронных таблиц или текстов с большим количеством повторений, а стилистика перевода не играет особой роли: хотя сам перевод выполняется быстро, полученный выигрыш съедается затратами времени на лишние операции по подготовке оригинала, вычитке, правке и форматированию перевода.

Recommend this article: stumbleupon|digg|del.icio.us|reddit|facebook


Back

© ANVICA Software Development 2002—2009. All rights reserved.