Инструменты переводчика: от CAT-программ до искусственного интеллекта
Переводчику недостаточно хорошо владеть иностранным языком — нужно также уметь быстро вникать в новые темы и находить точные формулировки. Это напряженный и высокоинтеллектуальный труд, поэтому были созданы различные вспомогательные средства, которые позволяют снизить нагрузку и повысить производительность. Со временем они становились все удобнее и функциональнее — как же такие средства выглядят сегодня?
В этой статье мы рассмотрим, чем в основном сейчас пользуются в отрасли переводов, и объясним, как именно разные инструменты помогают повысить эффективность.
CAT-программы
Перевод — это, прежде всего, работа с текстом. Это значит, что переводить можно прямо в текстовых редакторах и других программах, где есть возможность ввода текста (например, перевод видео можно выполнить в ПО для создания субтитров).
Но быстро становится очевидно, что это не самый оптимальный способ из-за особенностей материалов, которые обычно поступают на перевод. Например, в тексте могут быть повторяющиеся фрагменты, которые нужно перевести одинаково, — вроде названий глав книги: они повторяются в оглавлении, в самом тексте, а иногда и в колонтитуле. Без вспомогательных средств пришлось бы запоминать или записывать, какие фрагменты дублируются, из-за чего возникает опасность пропустить какой-либо из них.
К счастью, технологии берут рутинные задачи на себя. Уже почти три четверти века в той или иной форме существуют так называемые CAT-программы, где CAT — это сокращение от computer-aided translation, то есть «перевод с помощью компьютера» (но обычно используют более благозвучный термин «автоматизированный перевод»).
Самым популярным инструментом этой категории считается SDL Trados Studio, но у него много конкурентов: SmartCAT, Wordfast, MemoQ и десятки других.
Мы активно используем CAT-программы для оптимизации работы. Это не только удобно для нас — менеджеров, переводчиков и редакторов, — но и выгодно для наших клиентов. Именно эти программы позволяют находить повторяющиеся фрагменты текста в документе, на перевод которых мы делаем скидку до 60%.
Приведем пример из нашей практики. Клиент заказал перевод банковской выписки на английский. Объем документа составлял 9 629 слов. Поскольку мы уже работали с подобными текстами, знаем, что они содержат много повторяющихся строк: дат, валют, реквизитов и так далее. Мы прогнали выписку через CAT-программу, которая выявила, что из 9 629 слов полностью повторяются 4 250 слов. На их перевод была предоставлена скидка.
Итоговый расчет был таким:
- Стоимость выписки без учета повторов составила бы 30800 ₽;
- Стоимость этой же выписки с учетом скидки на перевод повторов составила по итогу для клиента 25300 ₽.
Наталья Анкудинова переводчик, менеджер проектов
В CAT-программах имеются разные функции, в том числе для управления проектами и задачами, но большей частью они направлены на обеспечение единообразия в переводе одинаковых кусков текста и терминологии, соответствия тегов, чисел, устранения ошибок в правописании и так далее. Две первые возможности воплощены в виде памяти переводов и терминологических баз. Они играют особенно важную роль, так что рассмотрим их подробнее.
Память переводов
Память переводов — это база данных, где хранятся ранее переведенные тексты в виде парных фрагментов «оригинальный текст — перевод».
Фрагмент может состоять из нескольких предложений, одного слова, html-тегов и так далее, в зависимости от структуры файла оригинала и характера текста.
При работе над новым проектом переводчики подключают в CAT-инструменте имеющиеся у них памяти переводов — созданные на основе предыдущих проектов, присланные заказчиком или даже скачанные из Интернета. ПО сравнивает фрагменты нового текста с фрагментами из памяти и при совпадении автоматически подставляет переводы. Совпадения могут быть как полными, так и частичными — этот параметр настраивает переводчик.
На скриншоте изображен фрагмент из памяти переводов, которую использовали для перевода банковской выписки. Программа проанализировала документ, сравнила фрагменты нового текста с фрагментами из памяти переводов и автоматически подставила перевод для знакомых ей слов. Переводчику остается только отметить, хочет он применить перевод этих слов или нет.

Глоссарий (терминологическая база)
Схожим щбразом работает и глоссарий, или терминологическая база, — электронный словарь в виде отдельного файла. Подключенный глоссарий находит в тексте термины и показывает варианты перевода, если это терминологическая база — то вместе с определениями, заметками или примерами употребления. Такой словарь, как и память переводов, можно создать самостоятельно с помощью специального ПО или получить из внешних источников.
Онлайн-словари
Многие тексты, требующие перевода, относятся к узкой тематике, например руководства по использованию оборудования, медицинские заключения, юридические документы и так далее. Выше мы упомянули подключаемые к CAT-инструментам глоссарии и терминологические базы — они создаются в том числе и на основе существующей специализированной литературы.
Лексические словари
До появления Всемирной сети переводчику для лучшего понимания незнакомых тем и подбора правильных терминов приходилось искать информацию в бумажных словарях и справочниках, причем найти их было не всегда просто — нужных книг могло вообще не существовать.
Благодаря оцифровке бумажных изданий и росту числа экспертных веб-ресурсов эта проблема большей частью решилась: стали доступны огромные массивы информации и множество сервисов с полезными функциями.
Например, популярный у русскоязычных лингвистов сайт Multitran содержит миллионы терминов из самых разных, даже очень узких тематик, а пользователи могут обсуждать их и предлагать свои варианты.
На скриншоте показано одно из обсуждений, в котором участники форума Multitran рассуждают на тему «Передача звука «ǝ:» в практической транскрипции.

Контекстные словари
Существует и категория сайтов, которые показывают примеры использования слова или выражения в разных контекстах, например Linguee, Glosbe и Reverso Context. Просмотр в контексте важен при работе с многозначными терминами, когда вариант перевода зависит от ситуации и тематики: например, слово oil может означать как «масло», так и «нефть», а примеры из реальных текстов помогут сделать правильный выбор.
На скриншоте изображен словарь Reverso, который иллюстрирует, как может быть переведено слово в зависимости от контекста. Для примера мы взяли слово «авиация».

Машинный перевод и искусственный интеллект
Поскольку мы говорим о современных переводчиках, нельзя обойти вниманием последние инновации отрасли. Машинный перевод и до распространения ИИ использовался довольно широко, но работал по-другому — на основе четко заданных правил и статистики. Теперь же на пике популярности нейронный машинный перевод: работу выполняет искусственная нейронная сеть, которую предварительно «обучили» переводу.
Поскольку ИИ по запросу выдает готовые тексты, может показаться, что человек-лингвист становится ненужным звеном. Однако на практике полной замены людей на машины не происходит. Переводчики и редакторы, рассуждая о том, сможет ли ИИ вытеснить переводчиков с рынка труда, приходят к выводу, что машины не гарантируют качественных переводов, а рынок приспосабливается к нововведениям, создавая отдельные специальности — например, редактор машинного перевода и промпт-инженер.
Для обычного переводчика развитие технологий тоже стало плюсом: ИИ-сервисы могут играть роль ассистента. К этой категории можно отнести Gemini от Google, Copilot от Microsoft и всем уже известный ChatGPT. Если переводчик натыкается на непонятную фразу или затрудняется подобрать слова, он может задать вопрос сервису и тут же получить ответ, не тратя время на просмотр результатов поисковой системы. Конечно, как показывает практика, искусственный интеллект иногда ошибается, но даже неправильные ответы могут навести на верную мысль.
Покажем, как это может быть, на наглядном примере
Помощь ChatGPT в расшифровке аббревиатуры в военном билете

Помощь ChatGPT в расшифровке аббревиатуры в медицинской справке
ChatGPT помогает расшифровывать аббревиатуры, которые часто встречаются в документах, особенно от государственных органов или медицинских учреждений.
Пример из недавней практики: в военном билете мужчины, проходившего службу в армии, в графе «воинская часть» и «воинская должность» значилось «СВ-СКВО». ChatGPT за пару секунд сэкономил 10–20 минут поиска, подсказав расшифровку: Сухопутные войска, Северо-Кавказский военный округ (Ground Forces, North Caucasus Military District).
Другой случай: поступил запрос на перевод справки о подтвержденной у пациента коронавирусной инфекции. В тексте значилась строка: «Ds: Осн.: U07.1 Новая коронавирусная инфекция COVID-19 (вирус идентифицирован), подтвержден лабораторно от РНК Coronavirus SARS-CoV-2 положительный. ДН0». Аббревиатура «ДН0» не может быть кодом заболевания, так как она отсутствует в перечне кодов Международной классификации болезней (МКБ). Однако оставлять аббревиатуру на русском языке или транслитом (DN0) – не наш подход. И снова помог искусственный интеллект.
Артем Шилинцев переводчик-редактор
Форумы и сообщества переводчиков и других специалистов
Несмотря на обилие справочных ресурсов и автоматизированных сервисов, при переводе сложных проектов все же встречаются случаи, когда своими силами ответ не находится (например, попалась двусмысленная фраза или несколько одинаково подходящих для контекста терминов). Тогда стоит прибегнуть к опыту коллег или экспертов в теме переводимого текста.
В Интернете есть множество форумов и других онлайн-сообществ для обмена опытом и решения самых разных профессиональных вопросов. Если говорить именно о переводе, то можно назвать такие крупные платформы, как международные ProZ и TranslatorsCafe, а также русскоязычный «Город переводчиков». Помимо поиска заказов, там можно получить помощь с переводом и обсудить другие рабочие моменты.
Не нужно забывать и о группах или каналах в соцсетях: несмотря на меньшие масштабы, скорость отклика там зачастую выше, а пользователи охотнее идут на контакт.
В группе социальной сети ВКонтакте Я — переводчик есть обсуждения, посвященные обсуждению перевода слов, терминов или даже целых текстов. Одни пользователи просят помощи или совет в переводе, а другие — отвечают

Вывод
Все вышеперечисленные ресурсы и сервисы значительно упрощают работу над переводами и повышают продуктивность. Однако, какие бы продвинутые технологии не появлялись в отрасли, самое важное в арсенале современного переводчика — это по-прежнему профессиональные навыки и творческий подход. Умение использовать возможности, которые предоставляет прогресс, помогает адаптироваться к меняющимся требованиям рынка, но развитие собственных компетенций остается фундаментом, и только на нем настоящие мастера своего дела могут построить устойчивую карьеру.
Переводим объемные документы со скидкой
Мы активно используем инструменты, которые помогают облегчить процесс перевода. Например, с помощью CAT-программ выявляем повторяющиеся фрагменты текста в объемных документах. Это позволяет не только ускорить процесс перевода, но и сделать вам скидку на услугу. Читайте подробнее на отдельных страницах.