Prevajanje z Global Online Living Dictionary (GOLD)

Nahajate se tukaj :
Domov » Novica » Prevajanje z Global Online Living Dictionary (GOLD)
Prevajanje z Global Online Living Dictionary (GOLD)
April 28, 2013

Prevajanje GOLD

Global Online Living Dictionary – Kamusi prevajanje

Interaktivni večjezični slovar je že dolgo pobožna želja raziskovalcev umetne inteligence. Prevajanje je tako tako zelo poenostavljeno.

Algoritmični in avtomatizirani strojni prevajalniki, kot je denimo Google Translate, sicer z lahkoto pretvorijo bistvo nekega besedila iz enega v drug jezik, vendar se vse skupaj ustvari, ko je treba pojasniti, kaj besedilo pomeni.

Zdaj pa se neverjetno ambiciozen spletni slovar nadeja rešiti težavo in zbrati vse besede v vseh jezikih. Če bo prejel dovolj denarja, bi lahko spremenil strojno prevajanje med posameznimi jeziki.

Prevajanje GOLD Afrika

Samooklicani »Slovar prihodnosti« se imenuje the Kamusi Global Online Living Dictionary (GOLD) (Globalni spletni živi slovar Kamusi), na trg pa so ga dali ta teden po mednarodnem dnevu materinega jezika 21. februarja. Projekt Kamusi je luč sveta ugledal leta 1994 kot zbirni dvojezični slovar med svahilijem in angleščino, pobudnik zanj pa je bil antropolog in leksikograf Martin Benjamin, ko je bil podiplomski študent na Univerzi Yale. »Kamusi« se imenuje zato, ker je to svahilijski izraz za slovar. Model slovarja, obsežnega vodnika za svahili, ki so ga financirali ljudje, člani skupnosti pa so lahko dodajali en vnos za drugim, je Wikipedio prehitel za celo desetletje. Kamusi simbolizira prevajanje, kar je stik različnih govoric in ljudi.

S podporo Ameriškega ministrstva za izobraževanje in z zasebnimi donacijami je sčasoma zrasel v enega najbolj priljubljenih virov za svahili na svetu.

Benjaminovi cilji pa so že dolgo širši. Po štirih letih dela na projektu Kamusi je njegova ekipa zdaj dala na tržišče na novo zasnovano platformo, ki lahko podpira vire za katerikoli jezik.

Ob prihodu na tržišče je demo verzija Kamusi GOLD vsebovala 100 besed v 15 jezikih, tudi v angleščini, svahiliju, francoščini, gusiiju, heheju, japonščini, kinjarvandi,lugandi, mandarinski kitajščini, pulaarju, romunščini, secvani, songhaju, španščini in jejiju.

Projekt je najprej usmeril pozornost na afriške jezike in tako nadaljeval prvotno zanimanje za svahili ter še 2000 drugih jezikov, ki jih govorijo v Afriki. Na spletni strani AllAfrica piše, da so projekt Kamusi v celoti sprogramirali v Afriki. Zaradi toliko različnih govoric je prevajanje nujno potrebno opravilo v Afriki. Za razliko od drugih slovarjev pa GOLD temelji tako na konceptih kot na besedah, zato doda kontekst trdim orehom, s katerimi se spopada strojno prevajanje. Orehom, kot so denimo enakozvočnice.

Kamusi.org spletno prevajanje

Kot pojasnjuje revija New Scientist, »bi lahko ta struktura rešila enega glavnih izzivov, s katerimi se sooča strojno prevajanje. Če recimo Google poprosimo, da iz angleščine v francoščino prevede ‘spring in her step’ (ona hodi s prožnim korakom), se bo odločil za printemps – letni čas – pomlad oziroma spring v angleščini. Podobnih primerov je cel kup. Strojno prevajanje pogosto tako popači prevode tudi zato, ker se računalniki ne znajo spopasti z enakozvočnicami – z besedami, ki se enako napišejo, vendar imajo različne pomene. »Kamusi pa se tej težavi izogne tako, da prepozna, da je beseda »spring« povezana z več koncepti, zato ji mora uporabnik povedati, kateri je ustrezen. Beseda “spring” je torej povezana z več koncepti, tudi z letnim časom pred poletjem in nenadnim gibanjem navzgor ali naprej.« Kot vidimo Kamusi spreminja prevajanje iz težkega opravila v lažje opravilo.

Projekt je subvencioniral Ameriški zvezni sklad za humanistiko, temelji pa naprostovoljnem delu.

Benjamin upa, da bodo dvojezični govorci, še zlasti tisti, ki govorijo katerega od redkeje zastopanih manjšinskih jezikov, besede dodajali brezplačno, saj bodo tako pomagali prevajati v tiste jezike, ki jih govori več ljudi in ki so že v sistemu.

Pričakuje tudi, da bodo denimo ameriška in kitajska podjetja, ki poslujejo v Afriki, morda želela plačati za dodajanje večjega števila besed v lokalnem jeziku v Kamusi, ker toliko afriških jezikov v obstoječih slovarjih sploh ni zastopanih.

Huda slabost projekta pa je v tem, da morajo na večjezičnem slovarju Kamusi za razliko od samodejnega algoritmičnega pristopa Google Translate ves čas delati ljudje, kar pa je zelo zamudno in drago.

Po Benjaminovih ocenah naj bi bilo, če upoštevamo tudi plače in druge stroške, treba plačati približno 5 dolarjev za dodajanje in preverjanje vsakega novega koncepta. Pričakuje, da bo jezikovni slovar z 10.000 besedami zadostoval za splošno rabo, zato bi osnoven slovar stal 50.000 dolarjev na jezik.

Kakor je že opozorila revija New Scientist, bi za 10.000 konceptov v 100 jezikih potrebovali 5 milijonov dolarjev, kar je sicer visok znesek, ki pa ga je vendarle mogoče zbrati. Podjetju, kot je denimo Google, bi bilo gotovo do tega, da izboljša svoj avtomatizirani prevajalnik in bi lahko v hipu ponudil toliko denarja za Kamusi prevajanje.

Cilj projekta Kamusi pa je, da večjezični slovar ostane brezplačen in javno dostopen vir, zato bo treba počakati, kakšen bo odziv na zasebne interese.

Medtem pa ga lahko raziskujete in dodate kaj tudi sami na Kamusi

HTML5 Valid page