Elektroniczny tłumacz w sieci

Chociaż Internet zlikwidował barierę fizycznej odległości, utrudnieniem w globalnej komunikacji wciąż są - i zapewne jeszcze długo będą - bariery językowe. W czasach, gdy sieć była jeszcze akademicka, powszechnym "językiem Internetu" był angielski: znali go właściwie wszyscy użytkownicy i do każdego można było napisać e-maila po angielsku; w tym języku były też pisane wszystkie publicznie udostępniane materiały - czy to przez FTP, czy przez WWW; głównie po angielsku dyskutowano też na listach dyskusyjnych (nawet polskich). Angielskiego jest w sieci nadal sporo; jednak wraz z upowszechnieniem Internetu, pojawiło się w niej wiele tekstów w innych językach, a także wielu użytkowników, którzy poza swoim językiem ojczystym - którym niekoniecznie musi być angielski... - żadnym innym nie władają.

Od pewnego czasu użytkownicy łączący się ze stronami popularnej wyszukiwarki AltaVista mogą korzystać z nowej, ciekawej usługi - AltaVista Translations. Po dokonaniu jakiegokolwiek wyszukiwania, wyświetlana przez wyszukiwarkę lista znalezionych stron zawiera specjalne odsyłacze, kliknięcie na które umożliwia obejrzenie dowolnej ze znalezionych stron w tłumaczeniu na inny język. Tłumaczyć można z angielskiego na francuski, niemiecki, włoski, portugalski i hiszpański, a także z któregokolwiek z tych języków na angielski. Jeżeli znamy adres konkretnej interesującej nas strony, możemy przetłumaczyć ją również bez korzystania z wyszukiwarki: pod adresem http://babel.altavista.com/ znajduje się formularz, w którym należy wpisać adres interesującej nas strony i podać, z jakiego języka na jaki należy ją przetłumaczyć. Możemy też zamiast adresu strony wprost wpisać w pole formularza (albo przenieść przy użyciu "cut & paste" z innego programu - np. z otrzymanego e-maila) dowolny tekst, który ma być przetłumaczony.

Najciekawszy w tym wszystkim jest fakt, że tłumaczenie (jak już chyba można się domyślić...) wykonywane jest automatycznie przez komputer! Możliwe jest to dzięki oprogramowaniu tłumaczącemu udostępnionemu przez firmę Systran (http://www.systransoft.com/), od lat zajmującą się zagadnieniami maszynowego tłumaczenia języków naturalnych. Firma rozpoczęła swoją działalność w 1968 r. od opracowania - na potrzeby lotnictwa amerykańskiego - systemu automatycznego tłumaczenia z rosyjskiego na angielski (jedna z późniejszych wersji tego systemu była m.in. stosowana podczas przygotowań do słynnego lotu Sojuz-Apollo w 1975 r.). Obecnie Systran jest w zakresie maszynowego tłumaczenia czołową firmą na świecie: w swojej ofercie ma oprogramowanie tłumaczące teksty w 14 językach, z jej oprogramowania korzystają m.in. takie instytucje jak Komisja Europejska, armia USA, czy też międzynarodowe korporacje takie jak Rank Xerox.

Jako się rzekło, jest to tłumaczenie automatyczne, zatem bardzo niedoskonałe; przetłumaczony tekst jest wprawdzie zrozumiały (co już należy uznać za duży sukces), ale z jego poprawnością gramatyczną bywa różnie, nie mówiąc już o kwestiach stylistycznych. Jakość tłumaczenia - co oczywiste - silnie zależy od złożoności oryginalnego tekstu: teksty typu np. wiadomości agencyjnych, czy ścisłych opisów technicznych tłumaczą się lepiej, niż teksty o formie bardziej swobodnej. Powszechnie znaną trudność dla wszelkich programów tłumaczących stanowią idiomy - zwroty nieprzetłumaczalne dosłownie, jak np. przysłowia; twórcy serwisu skądinąd nawet zachęcają na stronie WWW do "zabawy" z elektronicznym "tłumaczem", polegającej na próbach tłumaczenia takich właśnie tekstów (inną proponowaną "zabawą" jest przetłumaczenie tekstu np. z angielskiego na jakiś inny język, a potem otrzymanego rezultatu z powrotem na angielski - efekty bywają rzeczywiście komiczne). Innym problemem są słowa wieloznaczne (homonimy): np. podczas moich prób na jednej ze stron angielskie słowo "net" było tłumaczone na niemiecki raz jako "Netz", czyli sieć, innym zaś razem jako "netto" (w istocie cały czas chodziło o pierwsze znaczenie tego słowa).

Słowa nie rozpoznane przez program są pozostawiane w postaci niezmienionej, co jest raczej dobrym rozwiązaniem, zwłaszcza gdy chodzi o nazwy własne (np. imiona, nazwy miejscowości). Kłopoty sprawia natomiast dosłowne tłumaczenie nazw własnych, które składają się ze "zwykłych" słów danego języka (np. nazw firm). Przykładowo, na stronie InterNIC-u nazwa firmy Network Solutions została dosłownie przetłumaczona na niemiecki jako "Netzlösungen" (rozwiązania sieciowe); na innej stronie, poświęconej błędom w oprogramowaniu Microsoftu, program wprawdzie rozpoznał "Microsoft Windows" jako nazwę własną i nie usiłował tłumaczyć słowa "windows", ale już w nazwie "Microsoft Excel" słowo "excel" (wyróżniać się, przewyższać) zostało zamienione na jego niemiecki odpowiednik - "übertreffen".

Pomimo wymienionych problemów - nieuniknionych przy komputerowym tłumaczeniu - usługę należy uznać za bardzo cenną. Uzyskane za jej pomocą tłumaczenia nie nadają się rzecz jasna do publikacji, albo do wysłania w charakterze oficjalnego pisma, bez uprzedniego przeredagowania, są natomiast wystarczające do zrozumienia treści np. strony WWW, czy e-maila w nieznanym nam języku, np. po hiszpańsku (pod warunkiem, że znamy angielski - bo wersji programu tłumaczącej na polski nie ma...). Miałem okazję to sprawdzić korzystając z faktu, iż mój kolega prowadzi hiszpańskojęzyczny serwis WWW: mimo, że angielski przekład zaserwowany przez AltaVista Translations był językowo raczej kiepski (co mogło jednak wynikać z niedoskonałości hiszpańskiego oryginału, tworzonego w końcu przez Polaka), można było bez problemu zrozumieć, o co na tej stronie chodzi. Warto jednak przy czytaniu przetłumaczonych stron WWW posiłkować się równocześnie oryginałem otwartym w drugim okienku, aby unkinąć zastanawiania się nad zagadkami w rodzaju wspomnianych powyżej "Netzlösungen". Jako bardzo cenną cechę należy podkreślić fakt, że program dokładnie zachowuje układ oryginalnej strony WWW, ze wszelkimi znacznikami formatującymi, grafikami itd. (oczywiście tłumaczone są tylko elementy tekstowe strony - napisy przedstawione w postaci graficznej, co ostatnio jest na stronach WWW bardzo modne, nie mogą być przetłumaczone - bo i jak?). Natomiast mniej przyjemną cechą programu jest wprowadzone przez firmę Systran ograniczenie maksymalnej długości tłumaczonego tekstu: gdy tłumaczona strona jest dłuższa niż ok. 5-6 KB, jej dalsza część nie jest już tłumaczona i pozostaje w postaci oryginalnej, co jest sygnalizowane umieszczeniem w odpowiednim miejscu strony napisu "Translation ends here". Chcąc przetłumaczyć dłuższe strony, trzeba robić to "na raty", przenosząc kolejno ich fragmenty do wspomnianego wcześniej formularza, albo... skorzystać z odpłatnej wersji usługi, udostępnianej przez firmę Systran na własnym serwerze (http://www.systranet.com/). *

Jako się rzekło, usługa ta jest odpłatna, ale za to nie ma ograniczenia na długość tłumaczonego tekstu. Można z niej skorzystać na dwa sposoby. Pierwszy z nich przeznaczony jest raczej dla doraźnych, jednorazowych zastosowań - nie wymaga on rejestrowania się na serwerze firmy: za wykonane tłumaczenie płacimy na bieżąco, podając w odpowiednim formularzu, wraz z tekstem do przetłumaczenia, także numer naszej karty kredytowej. Koszt tłumaczenia wynosi 1 cent za słowo, z tym że minimalna opłata za każdy tekst przy tym sposobie korzystania z usługi wynosi 2 dolary (nieopłacalne jest zatem tłumaczenie tekstów krótszych niż 200 słów...). Drugi sposób, bardziej odpowiedni dla regularnych użytkowników serwisu, wymaga uprzedniego zarejestrowania się na serwerze i wstępnego wpłacenia (znowu przy użyciu karty kredytowej) pewnej sumy na swoje "konto" - należności za wykonywane tłumaczenia będą odpisywane od stanu tego "konta", aż do jego wyczerpania (oczywiście możemy wcześniej uzupełnić je kolejną wpłatą). Płacimy w tym przypadku tyle samo, tzn. 1 centa za słowo, ale nie ma żadnej minimalnej opłaty - jeżeli przetłumaczymy jedno słowo, będzie nas to kosztować tylko 1 centa. Dla zarejestrowanych użytkowników dostępna jest także wygodniejsza forma przekazywania tekstów do tłumaczenia niż wpisywanie ich do formularza na stronie WWW: można wysyłać je e-mailem pod odpowiedni adres (zależny od języka, z którego i na który chcemy tłumaczyć) - system automatycznie odeśle nam przetłumaczony tekst. Wreszcie istnieje także możliwość zarejestrowania się na bezpłatną usługę próbną, w ramach której możemy przetłumaczyć teksty o łącznej wartości do 20 $ (czyli do 2000 słów).

Poza brakiem ograniczenia na długość tekstu, zaletą omawianej usługi jest jeszcze możliwość wyboru przez użytkownika jednego z 22 specjalistycznych słowników z różnych dziedzin życia (np. elektronika, lotnictwo, biznes, polityka, język potoczny...), który - oprócz "głównego" słownika danego języka - będzie użyty do tłumaczenia tekstu, co pozwala na trafniejsze przetłumaczenie tekstów zawierających charakterystyczne słowa i zwroty z danej dziedziny. Niestety natomiast własna usługa firmy Systran nie umożliwia tłumaczenia stron WWW z zachowaniem ich formatu, tak jak usługa dostępna na serwerze AltaVisty.

Ze strony firmy Systran można także dowiedzieć się o możliwościach zakupu jej programów. Programy te, pierwotnie opracowywane dla dużych komputerów klasy mainframe, od 1992 roku dostępne są także w wersjach na PC. Najprostszą, o najskromniejszych możliwościach wersję programu (tylko jeden język, do 5 KB tekstu naraz) możemy nawet bezpośrednio "ściągnąć" sobie z serwera, oczywiście zapłaciwszy za nią uprzednio 29 dolarów (znowu niezbędna karta kredytowa).

Ciekawe tylko, czy - a jeżeli tak, to kiedy - doczekamy się kiedyś programu tłumaczącego na język polski...


* Obecnie usługa SYSTRANET jest darmowa (po uprzedniej rejestracji użytkownika) i umożliwia tłumaczenie dokumentów w formacie HTML, RTF lub czysto tekstowym.


Jarosław Rafa 1998. Tekst udostępniony na licencji Creative Commons (uznanie autorstwa - użycie niekomercyjne - bez utworów zależnych). Kliknij tutaj, aby dowiedzieć się, co to oznacza i co możesz z tym tekstem zrobić. W razie jakichkolwiek wątpliwości licencyjnych bądź w celu uzyskania zgody na rozpowszechnianie wykraczające poza warunki licencji proszę o kontakt e-mailem: raj@ap.krakow.pl.

Wersja HTML opracowana 23.04.98, uzupełnienie 3.09.2001.


Powrót do wykazu artykułów o Internecie Statystyka