Traduceri în limba română pe Google
Recent, cei care caută pe www.google.ro (şi cine nu o face în România?) au putut observa apariţia linkurilor „Tradu această pagină” după unele rezultate. În principiu, ar fi o veste minunată: Google oferă facilitatea de traducere a paginilor şi în limba română, ceea ce ar face conţinutul webului mult mai accesibil unui număr mare de utilizatori, care nu cunosc limbi străine (în special limba engleză). Aceasta este însă teoretic, pentru că în practică facilitatea funcţionează prost (ca să nu zic penibil). De fapt, dacă ştii limba engleză, chiar te poţi distra copios comparând traducerea cu originalul. De exemplu, „Te simti bine atunci când implicate sapunuri” vrea să fie traducerea pentru „You feel involved when watching TV soaps”. Fără comentarii.
Din păcate, uneori lucrurile nu sunt deloc amuzante, pentru că pot fi observate traduceri care pot părea relativ corecte, dar spun ceva denaturat. Este drept că se poate compara foarte uşor traducerea cu originalul (aceasta funcţionează excelent), însă dacă nu înţelegi, ce folos? Este de mirare că facilitatea de traducere a fost activată în aceste condiţii.
Ca unul care lucrează de câţiva ani la realizarea unui program pentru traducerea automată a textelor, ştiu ce dificultăţi sunt implicate (de fapt, programul este realizat, dar nu este publicat, tocmai pentru că încă nu traduce suficient de bine). Pentru un cunoscător, este uşor de observat că algoritmul folosit de Google este unul relativ simplu, care nu prea ţine seama de context. De altfel, o astfel de analiză performantă poate fi consumatoare de resurse importante, mai ales în condiţiile unui sistem care este accesat simultan de un număr extraordinar de mare de utilizatori. Limba română este şi una în care acordurile joacă un rol foarte important, ceea ce necesită algoritmi mai elaboraţi.
Din declaraţii publice, Google încearcă să găsească o soluţie statistică la problema alegerii sensului potrivit (sensul cel mai întâlnit este cel tradus). Deşi este o idee interesantă, limba română ridică dificultăţi aparte, din cauza diacriticelor. De exemplu, cuvântul „ţânţar” este scris în diferite feluri: „tantar”, „tântar” ,”ţînţar”, „tintar” sau „tîntar”. Se pare că algoritmul folosit de Google amestecă grafii diferite, în funcţie de varianta pe care a întâlnit-o mai des, ceea ce nu lasă o impresie bună.
Sunt convins că algoritmul va fi îmbunătătit în timp, pentru că există cerere, răspunde unei nevoi reale, iar Google are resurse pentru a duce lucrurile la un nivel superior. Sunt doar surprins că facilitatea a fost făcută publică la un nivel atât de puţin satisfăcător pentru limba română şi puţin îngrijorat că unele persoane vor lua de bun ce găsesc prin aceste traduceri – că doar sunt de la marele Google…
Nimic nu este perfect.Totul incepe cu ceva ce poate fi perfectibil.
13 mai 2008 la 6:50„Inainte de a face un lucru perfect, realizeaza ceva perfectibil.” Bill Gates
13 mai 2008 la 13:17Desigur, altfel nici nu poţi începe. Însă dacă faci, să zicem, o maşină, ieşi cu ea pe stradă, ştiind că nu prea îi ţin frânele? Orice produs sau serviciu trebuie să depăşească un nivel minimal de calitate înainte de a deveni public.
13 mai 2008 la 14:09Încă un exemplu de belea: "a 2002 episode of the TV series Law & Order: Criminal Intent" zice că înseamnă "un episod de 2002 de serii de televiziune Drept & ordine: Intentii Penal"
29 mai 2008 la 11:54Alex Deva vine cu o descoperire de senzaţie
„Vaslui” cică se traduce „Wolverhampton”
„FC Vaslui” cică se traduce „FC Dallas”
http://alxx.blogpub.ro/users/46/articles/1260-google-translate-rulz
1 septembrie 2008 la 20:29…lingviştii se distrează.Noi însă, selectăm şi ne bucurăm pentru Google şi pentru lingvişti…
2 august 2009 la 9:09Mulţumesc frumos pentru precizările, date de domnul Lucian Velea. Am observat şi eu unele inavertenţe, dar n-am ştiut că stăm chiar aşa de rău. Cu aleasă preţuire Toma
15 februarie 2010 la 12:16