Przejdź do głównej zawartości

Rozwój automatycznych tłumaczy

W Star Treku było to zasadniczo proste. Jest sobie urządzonko, czasem nawet dyskretnie schowane, które wystarczy że "posłucha" kilku zdań w jakimś języku i zaraz przedstawiciele różnych gatunków mogą ze sobą rozmawiać, i to tak swobodnie, jakby od urodzenia posługiwali się wspólnym językiem.


W życiu nie jest aż tak łatwo, i jeśli chodzi o moją opinię - jeszcze długo nie będzie. Niemniej ruch w interesie nie ustaje, o czym możemy poczytać tutaj:


Dodam, że o ile wiem, tłumacz Googla (translate.google.com) radzi sobie z tłumaczeniami na tej właśnie zasadzie, że karmi się dużą ilością tekstów z różnych stron internetowych (a Googiel odwiedza ich przecież sporo) i na tej między innymi bazie "uczy się" tłumaczyć. Nie zawsze mu to wychodzi najlepiej, o czym przekonał się niejeden student, pragnący pomóc sobie w przeszukiwaniu anglojęzycznych stron. Ze względu na (tak sądzę) bogate słownictwo i częstą wieloznaczność wyrazów, język angielski na polski tłumaczy się... różnie. Weźmy za przykład dwa akapity z tego samego artykułu angielskiej Wikipedii:

"Pączek (Polska wymowa [pɔnt ͡ʂki]) są do tradycyjnych wypieków kuchni polskiej (Pączek słowo jest czasami tłumaczone jako pączek). Pączek ma liczby mnogiej słowa Pączek polski [pɔnt ͡ʂɛk], choć wiele osób mówiących po angielsku, jak używać paczki w liczbie pojedynczej i mnogiej paczkis. W języku angielskim, wspólne wymowy PAWNCH-kee lub PONCH-kee [1] naśladować polską wymowę, ale niektóre głośniki wymawiać słowo jak POONCH-kee, PUNCH-kee lub Panch-kee. Polskie słowo "paczek" samo w sobie jest zdrobnienie PAK ("Pączek roślin").

Paczek jest wysmażony kawałek ciasta w kształcie spłaszczonej kuli wypełnionej Konfitura lub inne wypełnienie słodkie. Pączki są zazwyczaj z cukru pudru, pudru lub kawałki suszonych skórkę pomarańczową. Niewielka ilość alkoholu zbożowego (tradycyjnie, Spiritus) dodaje się do ciasta przed gotowaniem, ponieważ wyparowuje, zapobiega absorpcji oleju w głąb ciasta."

Oba akapity są niedoskonałe, choć ten drugi udał się na tyle ładnie, że bez trudu można go zrozumieć. W pierwszym akapicie trzeba się trochę nagłowić, a najlepiej - znać język i choćby "po łebkach" przejrzeć tekst oryginalny. Tak więc, prosty praktyczny test nie daje najwyższej oceny, ale wykazuje niewątpliwie, że narzędzie jest przydatne.

A co w drugą stronę? Weźmy ten tekst:

"The Star Trek was essentially simple. It is a device, sometimes discreetly concealed, which you just have to "listen to" a few sentences in some language, and immediately the representatives of different species can talk to each other, and so easily, as if from birth used a common language."

To już robi wrażenie, prawda? Gwoli uczciwości, zmieniłem słowo "urządzonko", które mi podkreślał słownik ortograficzny, na "urządzenie". Zdrobnienia mogą wszak przyprawić o ból głowy nawet i prawdziwego tłumacza, zwłaszcza z tych mniej sprawnych, cóż dopiero mówić o automacie!
Jesteśmy na etapie, na którym można powiedzieć, że posiadamy możliwość w miarę swobodnej komunikacji... Poprzez uprzednio napisany tekst. Z tym zastrzeżeniem, że nadawca komunikatu wyraża swoje myśli prostymi zdaniami, skonstruowanymi poprawnie gramatycznie, bez zaawansowanych konstrukcji językowych.

W podlinkowanym wyżej artykule z Rzepy mowa jest też, między innymi, o tłumaczeniu na żywo rozmów telefonicznych. Ciekawe, czy coś z tego wyjdzie. A raczej - kiedy.

Popularne posty z tego bloga

Sony ZAMIERZA zakończyć produkcję DYSKIETEK 3,5"

Sony podało arcyciekawą wiadomość. Otóż w tym oto roku  2010 A. D. zamierzają zaprzestać produkcji dyskietek, takich jak ta widoczna na obrazku. Tak, tak, właśnie takich co to mają 1,44MB pojemności i wymagają czytnika, którego na pewno nie spotkamy już w żadnym laptopie, a większość komputerów stacjonarnych ma w miejscu tegoż czytnika zaślepkę w kolorze reszty obudowy... A ostatni taki czytnik opuścił taśmę produkcyjną firmy Sony we wrześniu roku ubiegłego! I jeśli naprawdę Wam się wydaje, że pendrive'y opanowały świat, a zamówienie Zakładu Ubezpieczeń Społecznych na 130 tysięcy takowych dyskietek to ewenement w skali świata, to jesteście w błędzie. W roku 2008 jedna tylko firma Sony sprzedała takich dyskietek 8 milionów sztuk. I to jedynie w Japonii . A najlepiej sprzedającym się urządzeniem peryferyjnym okazał się czytnik dyskietek na USB. Co na to inne firmy? "We've been discussing the death of the floppy for 14 years, ever since CD technology first started comi...

Jak zainstalować OpenOffice 3.2? (DEB)

Jako, że nie wszyscy mają najnowsze OO w repo, a po drugie, nie każdy lubi badziewne brązowe okienko uruchamiania w ubuntu... To napiszę najkrótszy na świecie przewodnik jak to zrobić. Ku chwale gugiela! 1. Otwieramy konsolkę 2. Wywalamy starego śmiecia. Bez obaw - konfigi zostają na dysku. sudo apt-get remove openoffice*.* 3. Wypakujmy, zmieńmy nazwę folderu, dla przykładu teraz będzie /home/przemcio/office cd ~/office/ DEBS  4. Instalujemy... sudo dpkg -i *.deb  5. Na koniec zajrzyj człeku jeszcze do podkatalogu desktop-integration albowiem tam znajdziesz odpowiedź na pytanie czemu zniknęło officowe badziewie z menu i czemu pliki nie kojarzą tego pakietu... Hasta Luego!

Przełomowy Firefox 15 beta już dostępny!

Mozilla Firefox to przeglądarka której nikomu przedstawiać nie trzeba. Jednak od czasu jej wielkiego sukcesu jakim niewątpliwie było zdetronizowanie Internet Explorera upłynęło już sporo wody w Wiśle i czasy się zmieniły. Użytkownicy się zmienili, internet się zmienił, a problemy jakie stwarzał nasz lisek nie zostały rozwiązane przez te kilkanaście już przecież nowych wydań. Pojawiały się nowe wersje i w zasadzie prawie nic (z punktu widzenia użytkownika) się nie zmieniało. Przykład: przeglądarka potrafiła się zachowywać niczym Windows 98 zajmując kolejne megabajty pamięci RAM z każdą nową zakładką i wcale nie zawsze zwalniała pamięć po zamknięciu nawet wszystkich kart.