Сучасні інформаційні технології в діяльності перекладача
Никула Денис <nykula@ukr.net>, 2 курс Київського міжнародного університету, 035 Філологія, заочна форма

Зміст

Переклад текстів за допомогою системи автоматизованого перекладу TRADOS / SMART CAT / Omega T

CAT (укр. «кішка») — так називають програми, які допомагають перекладачам бути більш ефективними. Термін є скороченням від «computer-assisted translation» — дослівно «переклад за допомогою комп'ютера», фактично «система автоматизованого перекладу».

Використання систем автоматизованого перекладу актуально при обробці великих обсягів тексту, таких як документи, веб-сторінки чи електронні листи.

Складність перекладу великих текстів полягає не стільки в їхньому обсязі, скільки в полісемії та контекстних розбіжностях. У різних контекстах багатозначні слова можуть мати різні значення. «Кішки» допомагають перекладачу бачити й розуміти контекст і добирати відповідний точний переклад.

При перекладі складних фраз, ідіом або фразеологізмів необхідна можливість редагувати й коригувати переклад, щоб забезпечити правильну граматику й стиль. «Кішки» дають змогу редактору й коректору бачити вихідний і перекладений текст поруч, а також можуть надавати перекладачеві засоби автоматизованих перевірок орфографії та граматики.1

Декілька поширених систем автоматизованого перекладу:

OmegaT — вільна, безкоштовна програма для перекладу з інтуїтивним інтерфейсом. Підходить для фрілансерів і спеціалізованих студій локалізації. Містить вбудований інструмент перевірки орфографії та інтеграцію з Google Translate.

Trados — професійна програма, що допомагає працювати з текстами в форматі документів, презентацій, HTML. Сервіс підходить для великих проєктів. Його використовують компанії, які спеціалізуються на перекладах.

SmartCAT — сучасна програма зі зрозумілим інтерфейсом для перекладу невеликих проєктів. Її використовують фрілансери й фахівці компаній, для яких переклад є одним із другорядних напрямів діяльності.

memoQ — інструмент для перекладу, популярний серед програмістів і фахівців з локалізації програмного забезпечення.2

Weblate — вільний, безкоштовний хмарний засіб безперервної локалізації програмного забезпечення з функцією контролю якості й системою контролю версій, автоматизованими сповіщення про нові рядки й інтеграцією зі сторонніми службами.3

Основні поняття автоматизованого перекладу: редагування, перекладацька пам’ять, термінобази, корпуси тексту, конкорданси, системи перевірки якості перекладу

Від програми до програми інтерфейс відрізняється, проте спільною рисою є надання перекладачу вікна, в якому поруч видно рядок мовою оригіналу й поле для рядка мовою перекладу.

CAT-системи можуть надавати засоби для контекстного редагування, які в режимі реального часу показують, який саме вигляд матиме перекладена фраза в фінальному виробі. Такими засобами можуть виступати інтеграції з програмами для дизайнерів, як-от Figma, або «живі» редактори, які надають змогу перекладати текст прямо посеред веб-сторінки.

Важливою характеристикою сучасних систем автоматизованого перекладу є засоби співпраці. Декільком командам доводиться працювати над проєктом водночас, тож важливо мати засоби онлайн-синхронізації перекладацької діяльності різних людей.4

«Кішки» запам'ятовують фрази, які перекладач уже використовував, і нагадують про них, коли необхідно перекласти подібні фрази. Ця функція називається пам'яттю перекладу, або перекладацькою пам'яттю. За наявності майже точних збігів, наприклад таких, де відрізняється лише одна цифра, деякі «кішки», як-от memoQ, автоматично підставляють у поле перекладу раніше перекладену фразу з уже підставленою новою цифрою.

Стовідсоткові збіги автоматично підставляються в поле перекладу — або не підставляються, залежно від налаштувань програми: часто однакові англійські фрази вживаються в різних контекстах із різним значенням, тому використання раніше введеної фрази в іншому контексті може виявитися хибним.

memoQ намагається здогадуватись, чи збігається контекст певної раніше вжитої фрази, залежно від того, чи фрази поруч із неї також збігаються з використаними раніше, й пропонує в такому разі повторно використати переклад із більшою певністю.

Термінобаза, також відома як глосарій, — це словник, який підказує, яким відповідником у мові перекладу зазвичай представляється певний термін, бренд чи персонаж мови оригіналу. Глосарій може містити примітки про граматичний рід, згадки того, де вперше було вжито термін, і варіанти перекладу, які вживати з певних причин недоречно.

Система перевірки якості в «кішці» перевіряє, чи вжито у фразі мовою перекладу відповідник терміна з глосарію, якщо вихідна фраза містить цей термін. Перевірка якості також вказує на пропущені теги (шаблони, на місце яких програма підставляє в перекладену фразу користувацький текст), зайві пробіли й хибно перекладені числа.5

Технологічна компетентність перекладача пов'язана з умінням ефективно застосовувати системи автоматизації перекладу, в основі функціонування яких лежать масивні двомовні чи багатомовні бази даних, які називають корпусами текстів. Пам'ять перекладів фактично є двомовною базою даних, або «корпусом домашнього виробництва». Кожна конкретна система пам'яті перекладів зберігає дані у власному форматі, однак існує міжнародний стандарт TMX (Translation Memory eXchange Format), заснований на XML, з яким можуть працювати всі поширені системи автоматизованого перекладу.6

Корпусні тексти досліджує галузь лінгвістики, відома як корпусна лінгвістика. Ця дисципліна використовує корпуси текстів для вивчення реальних моделей використання мови, еволюції мови в часі, а також варіацій між регіонами, діалектами й мовними регістрами. Корпуси текстів надають дослідникам великі обсяги мовних даних, які можна використовувати для статистичного аналізу, перевірки гіпотез і підтвердження лінгвістичних правил.7

Для дослідження оригінального тематичного тексту застосовують конкорданс — особливий тип словника, в якому кожне слово або поняття розташовано в алфавітному порядку з мінімальним контекстом і всіма випадками вживання в деякому корпусі текстів. Тобто так називають список слововживань з відсиланням до всіх контекстів.8 «Кішка» може мати функцію конкордансу в сенсі швидкого пошуку певного терміна у вихідному тексті чи тексті мовою перекладу. Ця функція допомагає не відриватися при перекладі від контексту, після чого було б необхідно знаходити початкове місце в документів заново.

Машинний переклад: види програм та їх функціональні особливості

Від систем автоматизованого перекладу слід відрізняти системи машинного перекладу. Машинним перекладом (МП) називають переклад тексту, виконаний за допомогою комп'ютера без участі людини.

Програми машинного перекладу доцільно використовувати при абсолютному незнанні іноземних мов, у разі необхідності одержати переклад у максимально стислі терміни, або для створення підрядкового перекладу — чернетки, яку згодом використає професійний перекладач.

Поруч із засобами машинного перекладу виділяють такий професійний інструмент, як електронні словники — засоби для перекладу окремих слів і виразів документа. Популярним електронним словником є ABBYY Lingvo.9

Системи машинного перекладу, засновані на правилах, використовують поєднання мовних і граматичних правил у поєднанні зі словниками загальновживаних слів. Такі системи забезпечують переклад із точною уніфікованою термінологією, однак переклад за цією технологією буквальний і стилістично недосконалий.

Статистичні системи машинного перекладу не знають точних правил, а натомість їх «навчають» перекладати сталі фрази, програмно аналізуючи великі обсяги даних для кожної мовної пари. Для якісного «навчання» статистичної системи підбирають корпус текстів із відповідної галузі чи дисципліни. Такий переклад звучить плавніше, ніж у систем, заснованих на правилах, однак його точність і узгодженість нижча.

Новим трендом є нейронний машинний переклад (НМП), у ході якого для програмного аналізу використовується централізована нейронна мережа з величезним корпусом текстів із багатьох різних джерел і галузей. Системи НМП демонструють ефективніший переклад порівняно зі статистичним підходом на основі фраз, однак отриманий за їхньою допомогою переклад може не відповідати оригіналу за змістом.

Машинний переклад застосовують на побутовому рівні, наприклад для ознайомлення з оглядом потрібного товару чи прочитання навчальної статті. МП став звичним явищем під час спілкування в інтернеті, коли важлива висока швидкість перекладу. Однак МП підходить лише для особистого використання чи застосування всередині організації, а також надає прийнятний результат лише при перекладі близькоспоріднених мов.

Для перекладу маркетингових матеріалів, творчих текстів, матеріалів для офіційних сторінок компаній, складних юридичних чи торговельних документів, а також для перекладу в галузях медицини й фармацевтики, коли йдеться про людські життя, машинний переклад застосовувати не варто. Як мінімум, необхідне редагування фахівцем. Крім того, онлайн-засоби машинного перекладу надають доступ до вихідних даних стороннім особам (розробникам, маркетологам), що порушує конфіденційність; використання машинного перекладу може заборонятися корпоративним договором про нерозголошення.10

Популярними станом на 2024 рік є такі засоби машинного перекладу:

Google Translate — веб-сервіс для перекладу тексту з однієї мови на іншу; зручно використовувати як словник синонімів або тлумачний словник.

Перекладач DeepL — сервіс нейронного машинного перекладу. Цікавою функцією є можливість переглядати альтернативні переклади й синоніми.

Microsoft Translator — хмарний сервіс машинного перекладу, котрий можна використовувати для тексту, мовлення та навіть багатомовної розмови.

Papago — програма веб-перекладу, орієнтована на азійські мови.11

LibreTranslate (Argos Translate) — вільний, безкоштовний засіб машинного перекладу, який можливо разом із корпусом текстів встановити локально й працювати без порушення конфіденційності, зокрема інтегрувати з системами автоматизованого перекладу.12

Примітки:

1

Програми автоматизованого перекладу текстів. — Матеріали з інформаційних технологій https://ua5.org/edocument/376-programi-avtomatizovanogo-perekladu.html

2

CAT-програми, які полегшать життя перекладачу. — Полтавський державний аграрний університет https://www.pdau.edu.ua/sites/default/files/node/10125/cat-programy.pdf

3

Функції Weblate https://weblate.org/uk/features/

4

Rachel Wolff. The 8 best CAT tools you should consider for your localization team https://lokalise.com/blog/best-cat-tools/

5

memoQ, SDL Trados, OmegaT: What is a CAT tool and do you need one? — Translation Geek https://translationgeek.de/blog/memoq-sdl-trados-omegat-what-is-a-cat-tool-and-do-you-need-one/

6

О. В. Стефурак. Корпуси текстів у контексті формування технологічної компетентності перекладача https://www.researchgate.net/publication/331847469_Text%27s_corpora_in_the_context_of_forming_the_translator%27s_technological_competence

7

Тетяна Данилюк, Михайло Мельник. Корпус текстів https://reporter.zp.ua/korpus-tekstiv-wnq.html

8

Пйонтик Л.Ю., Романишин Н.І. Конкорданс як інструмент для вивчення концептуальної структури політичних текстів https://molodyivchenyi.ua/index.php/journal/article/view/249/239

9

Аліна Гуменюк. Основи інформаційних технологій. Системи автоматизованого перекладу https://informatics6.webnode.com.ua/zanyattya-16/

10

Юрій Цвєркун. Використання машинного перекладу: особливості й застороги https://profpereklad.ua/vikoristannja-mashinnogo-perekladu-osoblivosti-j-zastorogi/

11

15 найкращих інструментів машинного (AI) перекладу, які можна використовувати у 2024 році. — Найкращі цифрові маркетингові та бізнес-ресурси для підприємців https://www.toptut.com/uk/the-15-best-machine-ai-translation-tools-to-use-in-2024/

Created: 2025-06-06 пт 16:28

Validate