|
Ahots-teknologiak erabili eta aplikazioak eta zerbitzuak eskaintzen dituzten enpresek euren lanean euskara barneratzea. Horixe da, hain zuzen ere, Eusko Jaurlaritzak Belgikako enpresa batekin sinatutako hitzarmenaren fruitua den Aditu Programaren helburua.
Euskararen garapen teknologikoa bermatu
Euskararen garapen teknologikoa bermatu
Gaur egungo gizartean, komunikazioa gero eta elektronikoagoa eta orokorragoa da. Europa elektronikoaren barruan euskarak bere esparrua izan dezan, beharrezkoa da gobernuek zein administrazioek politikak abian jartzea gure hizkuntzak aurrera pausuak eman ditzan eta euskaldunak informazioaren eta komunikazioaren gizartean bete-betean integra daitezen.
Hori horrela, Eusko Jaurlaritzak 1999az geroztik, 2000Hiru Ekimenaren barruan, hainbat jarduera gauzatu du Teknologia Berriak eta Informazio Sistemak sustatzeko. Plan hauek euskararen garapen teknologikoa bermatzen dute, etengabe eta modu azkarrean aldatzen ari den arlo honetan. Hori dela eta, behar berriak sortzen dira eta, horren ondorioz, "hizkuntzen teknologiak" gero eta gehiago garatzen ari dira. Horien artean, ahotsaren teknologiak ditugu, hain zuzen ere:
- Ahotsaren ezagutza: ordenagailu batek pertsona baten ahotsa ulertzeko duen gaitasuna. Horrela, telefono edo kablerik gabeko gailuen bitartez, edozein tokitik eta edozein momentutan, naturaltasunez hitz eginez, informazioa lortu dezakegu.
- Ahotsaren sintesia: giza ahotsa erabili gabe giza diskurtsoa sortzeko gaitasuna. Sintetizadore batek gizakiaren ahotsa ordezkatzen du, hau da, testu idatzi bat oinarri izanda, testu hori ahots bihurtzen du automatikoki. Ahots artifizial hori erabat naturala eta ulergarria da. Honi TTS (Text To Speech) deritzo. Teknologia hori erabilita, gastuak murrizteaz gain, eragiketa komertzialak azkartu egiten dira.
- Hiztunaren egiaztapena: iruzurra saihesteko bidea da.
- Elkarrizketaren teknologia: ahots aplikazio orok datuen kudeaketa edota deien fluxuaren garapena eskatzen dute bai eta negozioaren logika ere; horri esker, elkarrizketarik sofistikatuenak izan ditzakegu.
Eskolan edo helduen euskalduntzearen eta alfabetatzearen ondorioz euskara berenganatu duten elebidun berrien kopuruak hazten jarrai dezan, ezinbestekoa da elebidun horiek euskara eguneroko bizitzan erabiltzea, etxean ez ezik, beste esparruetan ere, naturaltasun eta erraztasun osoz.
Ahotsaren teknologietan oinarritutako zerbitzuek helburu hori lortzea errazten dute. Izan ere, horren bidez, euskaraz balio erantsia eskaintzen duten zerbitzuen eskaintza eta eskari-aukera sortzen da, zalantzarik gabe aprobetxatu behar duguna.
Ahots-teknologien onurak
Teknologia hauek abiadura handia hartu dute eta Euskal Herriak horien barruan toki estrategikoa eta globala izan behar du. Hona arrazoiak:
- Enpresen beharra. Informazioaren teknologiak dira ekonomiaren eta berrikuntzaren aro honen motorea, jakintza aberastasun bihurtzen dutenak eta garapen iraunkorra sustatzen dutenak.
- Gizartearen eskaria. Teknologia berriek, ahotsa ezagutzearekin batera, herrien nortasuna eta kultura gordetzeko bai eta besteekiko aldeak baloratzeko ere tresna dira, Europa barruan kohesio handiagoa lortzeko.
- Esku artean ditugun aukerak. Hizkuntzaren ingeniaritza eta honi lotutako industria Informazioaren Gizartearen barruan lehentasunezko tokian daude ikerketari eta berrikuntzari dagokienez.
- Prospektiba. Hizkuntzaren erabilera garatzeko ahalmenean datza informazio eleanitzeko gizartearen, hau da, etorkizuneko gizartearen, muina. Testuinguru horretan, infoingeniaritza linguistikoak honako hauek ahalbidetuko ditu:
- Informazio-iturriak hizkuntza ezberdinetan eskuragarri izatea.
- Etxean, autoan edo edonon ordenagailuen bidez komunikatzea.
- Beste hizkuntzak ikasi edota geurea hobetzea.
- Telefono bidez ahotsa erabiltzen duten sistema informatikoak erabiltzea.
- Nazioartean, negozioetan, administrazioan edota politika-jardueretan, herritar eta kontsumitzaile bezala, eraginkortasun handiagoarekin funtzionatzea.
- Gero eta herritar eta bezero gehiagori zerbitzu-eskaintza zabalagoa eskaintzea.
Bestelako esperientziak
Euskal Herriaren antza izan dezaketen hainbat adibide aipatuko dugu:
- TCD (Tele Danmark) 1811 (Danimarka)
- 2002tik erabilgarri
- Datu-basea (3,5 milioi partikular eta 400.000 enpresa)
- Belgacom 1-2-3-4 (Belgika)
- Neurrira egindako ahotsa
- Elebiduna (frantsesa, nederlandera)
- Telenor (Norvegia)
- Akatsak antzematea
- 2001etik erabilgarri
- Deiak bideratzea
- Fonecta 02 02 00 (Finlandia)
- 2002tik erabilgarri
- Datu-basea (5 milioi eta zerrendak)
Euskarazko ahotsa ezagutzeko eta sintetizatzeko motoreen garapena
Eusko Jaurlaritza eta Nuance-ren arteko hitzarmena
Ahots teknologiak informazioaren gizartearen oinarrizko zutabea dira. Hori kontuan, Eusko Jaurlaritzaren Hizkuntza Politikarako Sailburuordetzak euskarazko ahotsa ezagutzeko eta sintetizatzeko motoreak garatzeko proposamena egin zuen. Proposamena Kultura Saileko ordezkariek, Informatika eta Telekomunikazio Zuzendaritzak (DIT), Administrazioa Modernizatzeko Bulegoaren Zuzendaritzak (DOMA) eta EJIE Informatika Elkarteak osatutako batzordeak onartu zuen.
Horren ondorioz, Eusko Jaurlaritzak 2003an Belgikako Nuance (lehen Scansoft Belgium) enpresarekin lankidetza-hitzarmena sinatu zuen euskaraz ahotsa sintetizatzeko (TTS) eta ezagutzeko (ASR) motoreak garatu zitzan.
Horretaz gain, proiektuaren barruan Eusko Jaurlaritzarentzako telefono-zerbitzua garatzea dago, hau da, erabiltzaileek ahots-sistema daukan makinarekin euskaraz hitz egin ondoren, telefono-zenbakien inguruko informazioa lortuko dute.
Motore horiek erabilita, hainbat aplikazio sor daitezke: arreta-telefonoak (call centers), merkataritza eta banketxe-eragiketak, herritarrekiko arreta-zerbitzuak, jostailuak, euskarazko irakaskuntza, telefono-aurkitegiak edota garraio publikoa.
Hizkuntza-baliabideak
Euskal Herriko agente teknologikoek (enpresek, unibertsitateak eta hizkuntza-baliabideen garatzaileek) landu zituzten motoreak garatzeko behar ziren baliabideak. Baliabideak Eusko Jaurlaritzarenak dira:
- 25 milioi hitzez osatutako testu-corpusa. Corpusa hizkuntza baten erabileraren lagin diren testuak dira. Adur Software Productions enpresak, hizkuntzalari eta informatikoez osatutako taldearen laguntzarekin, eratu zuen. Corpusa osatzeko iturri desberdinetako testuak erabili ziren: aldizkari ofizialak, aldizkariak, webak...
- Oinarrizko lexiko fonetikoa. 60.000 sarrera ditu. Hemen gehien erabilitako hitzak, laburdurak eta akronimoak agertzen dira, transkripzio fonetikoarekin. Eleka enpresak garatu zuen lexikoa.
- Telefoniarako datu-base fonetikoa. hizkuntza-ereduak garatzeko telefono bidez egindako grabazioak. Euskal Herriko Unibertsitatearen (EHU) Aholab taldeak egindako lana da.
- ASR3200-rako datu-base fonetikoa. bulego-giroan egindako grabazioak hizkuntza-ereduak biltzeko asmoz. EHUren Zientzia eta Teknologia Fakultateak burutu zuen.
Zer da ADITU?
Esan bezala, Eusko Jaurlaritzak, ahotsaren teknologiek Informazioaren Gizartearen garapenerako duten garrantziaz jabetuta, eta euskarak aurrerapausuak eman ditzan, Belgikako Nuance enpresarekin ahotsa ezagutzeko (ASR) eta sintetizatzeko (TTS) motoreak euskaraz ere garatzeko eta merkaturatzeko hitzarmena sinatu zuen.
Teknologia horren bitartez, funtsean, bi prozesu egin daitezke: ahotsa testu bihurtu, ezagutzaren motorraren bidez, eta testua ahots bihurtu, sintesi motorraren bidez. Horrela, erabiltzaileak, ohi duen bezala hitz eginda, informazioa lortu eta eragiketak egin ditzake bat-batean, telefono finkoen, kablerik gabekoen eta beste zenbait gailuren bidez. Teknologia hauei esker, Euskadiko enpresetan eta erakundeetan aplikazioak gara daitezke, euskarazko ahots-teknologiak erabilita, beren zerbitzuak eta produktuak eskain ditzaten.
Aditu Programak honako helburuak ditu: euskarazko ahots-teknologiako produktuak ezagutaraztea, berauen integrazio, garapen eta hedapen-aukera hoberenak zehaztea eta produktu hauen ezarpen praktikoak lortzea enpresa eta erakundeetan.
2005ean eta 2006an, Aditu Programaren barruan ahots-teknologien eta hauen aplikazioen hedapenerako ekintzak jarri dira abian, horretarako aurkezpen orokorrak, banakako aurkezpenak eta bideragarritasun-txostenak eginez.
Adituk ondorengo teknologi foroetan hartu du parte, Adituren demoa eta programaren gaineko informazioa zabalduz:
- IT4all
- eBGC 2005
- SIMO 2005
- Zientzia eta Teknologiaren IV. Astea
Horretaz gain, froga-plana egin da ahotsaren sintesiaren aukera guztiak aztertzeko.
Hona lan-taldea osatu dutenak:
Funtzionamendua
ADITUren bitartez, funtsean, bi prozesu egin daitezke: ahotsa testu bihurtu, sintesi motorraren bidez, eta testua ahots bihurtu, ezagutzaren motorraren bidez.
Ahotsa testu bihurtze prozesuari ASR (Automatic Speech Recognition) esaten zaio. Teknologia horren bitartez, erabiltzaileak, ohi duen bezala hitz eginda, informazioa lortu eta eragiketak egin ditzake bat-batean, telefono finkoen, kablerik gabekoen eta beste zenbait gailuren bidez.
Bigarren prozesuari testuak ahotsa bihurtzeko teknologiari TTS (Text-to-Speech) deitzen zaio. Teknologia horren bitartez, testua ahots natural bihurtzen da eta erabiltzaileari neurrira egindako informazio zehatza eta dinamikoa ematen dio, giza ahotsaren tankera duen ahots automatizatuaren bidez, denbora errealean. Ahots sintetiko horrek (Arantxa izena eman diote) naturaltasuna eta ulergarritasuna ditu ezaugarri, gizakiaren antza duelako eta oso erraz ulertzen delako.
Abantailak
Ahots-teknologiak erabili eta aplikazioak eta zerbitzuak eskaintzen dituzten enpresek euren lanean euskara barneratzea da helburua, eta horrela, hurrengo abantailak lor ditzaten:
- Bezeroaren asebetetzea areagotzea: sistema batetara telefonoz sartzen diren bezeroek, berehalakoa, kalitatezkoa, beraien beharretara bideratutako eta itxaro-uneak ekiditen dituen erantzun bat nahi izaten dute, informaziora sarrera arin bat izan eta etengabe erabili dezaketena.
- Kostuen murrizketa: zerbitzuak automatizatuz gero eta menu eraginkorren eta naturalen bidez deien iraupena murriztuz gero kostuak jaitsi egiten dira eta giza baliabideak balio erantsi handiagoko zereginetan aritu daitezke.
- Enpresa-onurak: bi dira nagusiki onurak; batetik, irudi korporatiboa hobetzea, eta bestetik zerbitzu gehigarriak (informazioa, salmentak...) eskaini ahal izatea, kanpoaldera begira, komunikazio kanal berriak zabalduz.
- Lehiakortasuna areagotzea: zerbitzua askoz arinago eskain liteke eta, gainera, egunean 24 orduz.
Bizkaiko Foru Aldundiaren adibidea
Bizkaiko Foru Aldundiak, LANTIKen bidez, herritarrentzako arreta-kanalak garatzeko eta zerbitzu publikoak hobetzeko egitasmoa zuen aurreikusia. Oinarrizko azpiegitura ezarri nahi zuen ahotsaren sintesia eta ezagutza erabilita foru-esparru guztiei zerbitzua emateko. Horretarako IVR (Interactive Voice Response) sistema jarri zuten.
Iaz, Ogasun eta Finantza Sailak zergen inguruko telefonozko zerbitzua bai eta bertan emandakoa ere eskaintzen zien herritarrei.
Garatutako direktorioa (auto-asistentea) Bizkaiko Foru Aldundiko beste foru-sailekin konektatu daiteke, hala nola:
- Bizkaiko Foru Aldundiko Sail guztien lotura interesgarriak.
- Sailetako direktorio zehatzagoak, hala nola:
- Gizarte-zerbitzuen Direktorioa – Foru Erregistroa.
- Kultur intereseko lekuak: Bilboko Orkestra Sinfonikoa, Euskalduna Jauregia, museoak (Guggenheim, Arte Ederren Museoa), Kirolak.
- Bizkaiko lan-guneak. Behargintza.
- Tokian-tokiko, Estatuko, Europako eta nazioarteko erakunde eta administrazioetako helbide interesgarriak.
- Udal telefonoen direktorioa. Udal.net.
- Larrialdietarako zerbitzuetara, adibidez, su-itzaltze eta itsas salbamendu foru-zerbitzura.
Rentanet Etxean sistema Errenta kanpainarako
Bizkaiko Foru Aldundiak burututako errenta-aitorpena jaso duten zergadunek, positiboa nahiz negatiboa izanda, berau baimendu ahal izango dute IVR sistemaren bidez. Besteak beste, honako hauek egin dira:
- Oinarrizko azpiegitura teknologikoa barneratzea IVR (Interactive Voice Response) aurretik zegoen sistema batean oinarrituz.
- IVR sistemari Nuance-ren euskarazko ahotsa sintetizatzeko programa erantsi, tonu bidezko sistemarekin osatuz.
- Bizkaiko Foru Aldundiak bidalitako aitorpena onartzea edo ukatzea ahalbidetuko duten elkarrizketen definizioa.
- Onarpenari balio juridikoa emateko modua aztertu, bai ordaintzeko bai eta kobratzeko aitorpenetan.
- Hitz egiten den hizkuntzaren ezagutza, "euskara" edo "erdara", berau aukeratu beharrik gabe.
- Errenta kanpainako informazio gehigarria erantsi, bere kasuan, aurre-hitzordua.
|