Инструменты CAT[58] (Computer-Assisted Translation) – специализированное ПО для автоматизированного компьютерного перевода. Иными словами, это специальные программы, облегчающие жизнь переводчика. Несмотря на термин «автоматизация», не нужно путать их с программами для машинного перевода: там, где МП заменяет исполнителя, выполняя как минимум начальный этап работы, CAT оптимизирует его работу.
Самые популярные и распространенные системы на момент написания книги: Phrase, MemoQ, Trados Studio, Smartcat и другие. Основные принципы, на которых построены абсолютно все перечисленные программы, – использование памяти переводов, работа с глоссариями и встроенными инструментами контроля качества.
Я иллюстрирую свой рассказ скриншотами из Phrase[59], но, познакомившись с одним вариантом, вы без труда освоите любой CAT. Для начального знакомства рекомендую систему Smartcat[60] как бесплатную и открытую для всех желающих.
Первая особенность перевода в CAT – при загрузке в программу весь массив текстов разбивается на сегменты. Принцип работы с сегментами следующий: сначала переводчик вводит черновой текст на целевом языке, затем редактирует и подтверждает свой перевод нажатием специальной комбинации клавиш. Подтвержденные сегменты записываются в память перевода (о ней подробнее чуть позже).
Сегменты в CAT
Глоссарий в CAT – это справочник с терминами и их переводами, фактически индивидуальный словарь для данного конкретного проекта. Использование глоссариев помогает сохранить единство терминологии, что особенно важно в масштабных проектах, над которыми трудятся команды лингвистов. Единый глоссарий, который поддерживает команда по ходу работы, помогает избегать разночтений, когда одну и ту же сущность в части текстов называют «дворцом», в другой «замком», а в третьей части и вовсе «собором».
На скриншоте ниже показан пример добавления термина в глоссарий. Важный момент: прямой чертой отделяется изменяемая часть слова. Благодаря этому программа будет корректно распознавать наш термин в любом падеже и числе.
Добавление термина в глоссарий Phrase
Когда термин внесен в глоссарий, программа сама отреагирует на его наличие в очередном сегменте и напомнит о нем в боковой панели.
Память переводов – это база данных, сохраняющая переведенные сегменты текста. «Fuzzy match» относится к сегментам, которые не полностью совпадают с предыдущими переводами, но похожи на них. Программа запоминает ранние переводы и подбирает аналогичные фразы, позволяя использовать наработанную базу знаний по проекту. Это невероятно удобно, поскольку не нужно искать похожие строки и вспоминать, как они переводились раньше. Кроме того, память перевода доступна всей команде лингвистов на проекте. Не нужно спрашивать в командном чате: «Как вы переводили…» – программа сама покажет похожие фразы и подсветит нужные термины.
CAT предлагает варианты из памяти переводов
Перед сдачей работы можно запустить встроенную в CAT проверку качества. В дополнение к проверке орфографии и пунктуации программа выделит «сомнительные» переводы, в которых обнаружатся расхождения с глоссарием, подозрительные изменения в порядке переменных или их отсутствие, расхождения в капитализации и другие потенциальные проблемы.
Стоит заметить, что все студии локализации работают в CAT-системах: это позволяет вести точную статистику и тарификацию (сколько уникальных слов поступает на перевод, сколько «fuzzy matches» и сколько повторов), экономить время и обеспечивать качество на самых крупных проектах.
LQA
LQA (Linguistic Quality Assurance, лингвистическое тестирование) – это процесс проверки и улучшения качества перевода. В рамках LQA специалисты полностью тестируют перевод в пределах приложения. Проверяют наличие синтаксических и орфографических ошибок, соответствие локальным особенностям целевого языка, визуальное отображение локализации (вписывается ли текст в отведенное в интерфейсе место), уместен ли перевод в полном контексте. LQA помогает убедиться, что переведенный текст понятен, естественен и точно передает смысл оригинала. Иногда именно в полной локализованной версии всплывают ошибки и неточности (в основном допущенные из-за недостаточного контекста на этапе перевода).
В свое время в Duolingo я попала именно по результатам LQA. Это было давно, когда разработчики решили отказаться от перевода UI силами коммьюнити и сформировать собственный отдел локализации. На UpWork периодически появлялся небольшой заказ на проведение LQA приложения. Наняли около 100 человек, обработали полученный фидбэк и выбрали парочку толковых для дальнейшей работы. Так что участие даже в небольших LQA вполне может стать ступенькой к более плотному сотрудничеству в будущем.
Лингвистическое тестирование – заключительный этап в процессе локализации. LQA проводится, когда приложение полностью переведено, локализация интегрирована в проект и уже есть рабочая версия на целевом языке. Разработчики присылают эту полностью локализованную версию тестерам вместе с инструкцией, как пользоваться приложением и какие элементы проверять. Иногда некоторые ошибки просят игнорировать, потому что разработчик, например, еще не обновил конкретный раздел или что-то вообще в зачаточном состоянии (часто игры многократно обновляются уже после официального релиза).
Как может выглядеть инструкция для LQA-специалистов.
1. Установить приложение.
2. Заполнить профиль пользователя.
3. Пройти короткий обучающий уровень.
4. Перейти в раздел настроек, изменить пароль, включить и выключить уведомления.
5. Запустить новый уровень, пройти его.
6. Перейти на экран со списком доступных навыков.
7. Перейти на экран достижений.
8. Открыть раздел «Авторы».
Тестер двигается по пунктам инструкции и фиксирует проблемы: опечатки, показавшиеся странными фразы, контекстуальные ошибки (неверно выбран термин, не соответствует показанному на экране), ошибки визуализации (текст обрезан или, наоборот, выводится поверх других элементов интерфейса) и т. д. Описание ошибок со скриншотами вносятся в любую общую систему учета, это может быть онлайн-багтрекер (Jira, Asana, Bugzilla и другие). Если есть какие-то сомнительные моменты, вопрос обсуждается в кругу тестеров. Если нет единого мнения, направляется запрос заказчику.
К вопросу о том, зачем нужен LQA, даже если в приложении всего лишь пара кнопок и ноль диалогов. Платный VPN, немецкий интерфейс.
Кнопка CANCEL локализована как STORNIEREN. Формально это, конечно, отмена, но отмена заказа, брони, покупки. В компаниях, работающих с немцами, так и говорят: «Ой, а вы шторнировали гостиницу? Нужно обязательно шторнитовать, иначе будет штраф».
В контексте, когда нужно всего лишь отменить действие (прервать подключение), это выглядит странно и даже пугает: как будто я сейчас нажму и отменю подписку.
Правильный вариант перевода в данном случае: ABBRECHEN. И это очень легко увидеть и исправить, проведя базовый LQA.
Отмечу, что обычно LQA не проводятся силами команды, которая подготовила перевод, – для этого привлекаются специально обученные тестеры. Часто LQA-специалисты работают в штате студии локализации. Делается это, чтобы избежать эффекта «замыленного глаза», оценить локализацию свежим взглядом и непредвзято. Но даже в этом случае часть рекомендаций и замечаний будет вкусовщиной, поэтому полученный фидбэк тщательно анализируется и обсуждается с командой переводчиков. Затем корректируются самые приоритетные ошибки, которые действительно важно исправить.
Есть одна характерная мелкая улика в локализации, по которой можно четко сказать, проводился LQA или нет: «чашка» вместо стаканчика. Любой нормальный человек переведет «cup of coffee» как «чашка кофе». Вот только иногда кофе разливают в стаканчики (например, в полицейском участке), и никто не заподозрит подвоха, пока не увидит предмет в игре.
Расскажу об интересном кейсе локализации силами комьюнити: Yuppie Psycho[61] от франко-испанской студии Baroque Decay[62]. Вообще на этих разработчиков стоит обратить внимание: их предыдущий проект The Count Lucanor позиционируется как «смесь The Legend of Zelda и Silent Hill» (вот у кого можно поучиться продавать игру одной строкой).
Пара слов об игре Yuppie Psycho: это пиксель-артовый survival horror с совершенно анимешным сюжетом. Брайан Пастернак, простой паренек из провинции, получает оффер от Syntracorp – самой крутой корпорации в стране. Прибыв в офис компании, он узнает, что ему предлагают должность Охотника на ведьм. В офисе творится что-то ужасное, выхода из него нет.
Так вот, вернемся к локализации. Разработчики не тратят на перевод ни копейки: английский, испанский, французский делают своими силами. Все остальные языки отдаются на откуп фанатам. В свободном доступе публикуется табличка с текстами из игры, и все желающие могут над ними поработать, а после результат просто включается в очередную версию. Без редактуры, без проверки, и в целом это работает. Конечно, там есть ошибки (пример на скриншоте выше – женский персонаж говорит о себе в мужском роде), но их легко увидеть и исправить на этапе LQA.
Вывод следующий: при ограниченном бюджете и наличии преданного комьюнити это неплохой вариант. Формула успеха в данном случае такая: фанаты + редактор + LQA = Profit.
Ух какой UX
Я решила отдельно поговорить про UX-копирайтинг, т. е. написание красивых, понятных, завлекательных и во всех отношениях приятных текстов для сайтов, приложений и других цифровых продуктов и сервисов. Кто-то может возразить, что UX-копирайтер – это отдельная профессия, не связанная с локализацией. Но если мы локализуем интерфейс, стараясь сделать его максимально нативным и подстраивая под целевую аудиторию, руководствуясь принципами транскреации, то поневоле вступаем на территорию UX-копирайтинга. Фактически нам нужно написать новые строки на нужном языке, вложив в них определенный посыл.