Harrabotsa sortu zuen atzo sare sozialetan zabaldu zen Google Translate itzultzaile adimendunaren inguruko mezu batek. Keir Finlow-Batez izenpean sinatzen duen Finlandiako pertsona batek zabaldu zuen eta hark egindako proba baten berri ematen zuen: "Finlandierak ez du generoa markatzen duen izenordainik. Ingelesezko he/she finlandieraz hän da, besterik gabe. Zerbaitegatik garrantzitsua bada emakumezko bati edo gizonezko bati buruz ari ote garen jakitea, testuingurua ulertu behar da", azaldu zuen.

Google Translatek itzulpenak estereotipoekin lotuta egiten dituela salatu zuen, hainbat adibide jarriz. Euskara ere generoa markatzen duen izenordainik gabeko hizkuntza denez, mezu hori irakurri ostean euskaldun asko saiatu ziren itzultzaile adimendunak erabiliz esaldi batzuk euskaratik gaztelaniara itzultzen.

"Googleko itzultzaileak edukiaren arabera jartzen die generoa esaldiei. Lana eta autoa gizonarentzat, haurrak eta edertasuna emakumearentzat", idatzi zuen erabiltzaile batek sare sozialetan. Mezu horrekin batera honako adibideak jarri zituen: Google Translatek berak kotxea gidatzen du esaldia gaztelaniara él mismo maneja el auto gisa itzultzen du; eta berak haurrak zaintzen ditu, ella se ocupa de los niños moduan itzultzen du. Bera lanera doa, él va a trabajar gisa ulertzen du itzultzaile neuronalak eta bera ederra da, aldiz, ella es hermosa moduan.

"Mezu horiek irakurriz badirudi Googlek egin duela hautua, esanez gauza batzuk emakumezkoek egiten dituzten gauzak direla eta beste gauza batzuk gizonezkoak egiten dituztenak. Baina hori ez du Googlek erabaki, sistema hauek sortzeko erabiltzen diren aurrez itzulitako testuek baizik", azaldu zion atzo egunkari honi Itziar Cortesek, Elhuyarreko Hizkuntza eta Teknologia Unitateko koordinatzaileak.

Itzultzaile neuronal gehienak aurretiaz itzulitako testu multzo handi batez elikatzen dira. "Hortik ikasten du sistemak eta aurretik itzulitako milaka milioi esaldi horietan agertzen bada autoa erosten duten guztiak gizonak direla, erizain guztiak emakumeak direla edo ile-apaindegira joaten diren guztiak emakumeak direla, berak ere horixe ikasten du", nabarmendu zuen.

Cortesen arabera, itzultzaile neuronalek "oso ondo" itzultzen dute, baina egia da aurrez eman dioten informazioaren arabera itzultzen dutela. "Adibidez, duela hamar urtetako testuetatik abiatzen bagara, horrelako gauzak agertuko dira. Baina uste dut gaur egun, generoaren kontuari dagokionez, kontzienteagoak garela idazten dugunean; gaztelaniaz, adibidez. Esaterako, normalean ez dugu jartzen la enfermera edo horrelako zerbait. Horren ordez, personal de enfermería, la ciudadanía, las personas usuarias eta horrelakoak erabiltzen ditugu", esan zuen Cortesek.

Gaur egun idazteko eta itzultzeko moldea aldatu egin da, eta hori hemendik urte batzuetara nabarituko omen da, itzultzaile neuronal berriak gaur egungo testuez elikatzen direnean hain zuzen ere.

GAUZAK ALDATZEKO LANEAN

Elhuyarreko lantaldeak aspalditik zuen generoaren ikuspegitik itzultzaile neuronalek egiten zituzten itzulpen sexisten berri eta hori aldatzeko, testuingurua lantzen ari omen dira beraien itzultzaile neuronalean. "Testuinguruari erreparatuta gauzak hobeto egiten ari gara. Oraingoz gure sistemek, eta sistema gehienek, esaldiz esaldi egiten dituzte itzulpenak eta konturatu gara horrela egiterakoan aurreko esaldiekin daukazun lotura galdu egiten dela", azaldu zuen Cortesek.

Hala ere, esaldiak behar bezala itzultzea pertsona bakoitzaren ardura ere badela uste du: "Nik ulertzen dut testuen kalitatearen erantzukizunaren zati bat teknologiarena dela, baina beste zati bat erabiltzailearena da. Hau da, erabiltzaileak kontuan izan behar du erabiltzen ari dena guztiz automatikoa dela, ez duela pertsona batek ikusi eta beraz, bera da testu hori ondo egotearen erantzulea".

Norberak ez badu itzultzaile neuronalak itzulitako testua errepasatzen, hizkuntzaren kalitatea "galdu" egiten dela nabarmendu zuen.Testuen kalitatearen erantzukizunaren zati bat teknologiarena bada ere, funtsezkoa da erabiltzaileek testuak errepasatzea