Strojno prevajanje 2.del

V prvem delu smo opisali kratko zgodovino strojnega prevajanja in njegove omejitve. V tem drugem delu, pa želimo podrobno prikazati, kako proces strojnega prevajanja sploh poteka in prikazati nekaj brezplačnih programov za strojno prevajanje.

Metode strojnega prevajanja

1.Pristop s pravili

Pristop s pravili temelji na neposredni in posredni metodi. Pri prvi gre za preprosto zamenjavo besed, pri drugi pa gre za bolj kompleksno metodo, ki s pomočjo začasnega (vmesnega) jezika prevede besedilo.

a) Zamenjava besed
To je najpreprostejša metoda prevajanja za kar potrebujemo le dober slovar in nekaj spretnosti. Lahko rečemo, da se gre pri tej metodi za dobesedno prevajanje izvirnega besedila v ciljni jezik. Ta pristop je sicer zadosten za razumevanje kratkih besedil vendar se hitro izkaže kot neprimernega pri daljših prevodih in strokovnih besedilih.

Slovar

Slovar

b) Vmesni jezik
Poleg neposrednega pristopa (zamenjava besed) je na voljo še posredni pristop s pravili, ki je v sodobni programski opremi bolj pogosta. Postopek poteka v dveh fazah: v prvi je treba poskrbeti za razumevanje izvornega besedila, v drugi pa enak pomen predstaviti s ciljnim jezikom. Pri tem je potrebno izvirno besedilo najprej pretvori v začasno besedilo, ki je zapisano v nekem vmesnem (abstraktnem) jeziku in ki je neodvisno od jezikovnega para.

Prevajanje s pomocjo vmesnega jezika

Prevajanje s pomocjo vmesnega jezika

Prehodni pristop uporablja SYSTRAN, eno izmed najstarejših podjetij, ki se ukvarjajo z razvojem programske opreme za strojno prevajanje. Njegovi začetki segajo v 60. leta, zato ne preseneča, da je njegova podpora več blizu 40. jezikovnim parom ena izmed najbolj pestrih med vsemi igralci na trgu. Rešitev je brezplačno na voljo za Windows, Linux, Solaris in tudi v spletu, najbolj razširjena izvedba programske opreme SYSTRAN pa sta AltaVistina in Yahoojeva riba Babel Fish.

2.Statistična osnova

Google je do nedavnega, tako kakor drugi pomembni igralci na tem področju, uporabljal sistem SYSTRAN, oktobra 2007 pa preskočil na lastnega, ki temelji na obdelavi dvojezičnih korpusov besedil ob pomoči statističnih metod. Poleg prevodov besedil in spletnih strani storitev Google Translate ponuja tudi slovar in prevajanje iskanja, ki mu v svojem jeziku podamo iskalni kriterij, išče pa po spletnih straneh in podpira kar 41 jezikov.

Sistem za statisticno prevajanje

Sistem za statisticno prevajanje

Za sistem stojnega prevajanja je Google uporabil dokumente Združenih narodov, ki so na voljo v vseh šestih uradnih jezikih organizacije (angleškem, arabskem, francoskem, kitajskem, ruskem in španskem). S tem so uspeli sestaviti šestjezični korpus z kar 20 milijardami besed, ki je sistem izučil do neverjetne stopnje natančnosti.

Nadaljnji razvoj v prevajalnih orodjih bo najverjetneje temeljil na podlagi statističnih metod in stojnega učenja, ki je tudi eno najširših področji umetne inteligence. Tako lahko v prihodnjih letih pričakujemo še večji napredek na tem področju, za enkrat, pa če nas kdo vpraša lahko mirne duše rečemo: “Pasivno obvladam vsaj 41 jezikov”.

Tags: , , ,

Leave a Reply

Your email address will not be published. Required fields are marked *