Euskal Herriko Unibertsitateko (EHU) HiTZ Hizkuntza Teknologiako Zentroak baliabide ireki berriak argitaratu ditu euskarazko ahots teknologiak garatzeko: hizkeraren ezagutza automatikorako bi eredu (ASR) –bat elebakarra, euskaraz eta bestea elebiduna, euskaraz eta gaztelaniaz– eta ahotsaren sintesirako bi ahots (TTS) –bata gizonezkoena eta bestea emakumezkoena–.
EHUko iturriek jakinarazi dutenez, baliabide teknologiko horiei esker, ikertzaileek, enpresek eta garatzaileek ahotsean oinarritutako aplikazioetan txertatu ahal izango dute euskara, eta, hala, adimen artifizialaren eta interfaze digital berrien eremuan duen presentzia indartzen lagunduko du.
Hizketa automatikoki ezagutzeko ereduek aukera ematen dute euskarazko eta gaztelaniazko hitz egindako ahotsa zehaztasun handiko testu bihurtzeko, eta horrek erraztu egiten du zenbait aplikazio garatzea, hala nola transkripzio automatikoko sistemak, denbora errealeko azpitituluak jartzeko prozesua, morroi birtualak edo elkarrizketarako interfazeak. Egindako ebaluazioek erakusten dute ereduen errendimendua gaur egun euskararen ezagutza automatikorako erabilgarri dauden onenen artean dagoela.
Bestalde, eredu neuronalak erabiltzen dituzten ahots sintesiko ahots berriek aukera ematen dute testutik abiatuta euskarazko hizkera naturala sortzeko, eta horrek, aldi berean, aukera ematen du irakurgailu automatikoetan, nabigazio sistemetan, irisgarritasun tresnetan edo multimediako edukietan erabiltzeko.
Ereduak HiTZ zentroko Aholab ikerkuntza taldeak garatu eta entrenatu ditu, Eusko Jaurlaritzak finantzatutako Iker-Gaitu proiektuaren esparruan. Espainiako Eraldaketa Digitalerako eta Funtzio Publikorako Ministerioak eta Suspertze, Eraldatze eta Erresilientzia Planak ere finantzatu dute, Ilenia proiektuarekin lankidetzan. Halaber, lanak Eusko Jaurlaritzako Informatika Elkartearen prestazio handiko konputazio azpiegituraren laguntza izan du, eta ereduak entrenatzeko behar diren GPUak eman ditu.
LIZENTZIA IREKIAK
Garatutako ereduak lizentzia irekien bidez argitaratu dira, eta horrek aukera ematen du ikerkuntza proiektuetan eta merkataritzarako aplikazioetan erabiltzeko, egokitzeko eta integratzeko. Horrela, eredu berriak eskuragarri daude sareko gordailu irekietan.
Ekimen honekin, HiTZ zentroak euskararako hizkuntza teknologia aurreratuak garatzeko konpromisoa indartu du, eta adimen artifizialaren alorrean berrikuntza erraztuko duten baliabide irekiak sortu.
Zentroaren arabera, ahotsa ezagutzeko eta sintetizatzeko eredu irekiak izatea "urrats garrantzitsua" da euskara teknologiarekiko interakzioko modu berrietan erabat integratu ahal izatea bermatzeko. Horrek, aldi berean, hizkuntza gero eta testuinguru gehiagotan erabiltzea ahalbidetzen duten aplikazio digitalak garatzen laguntzen du.