Sarrera | Mapa | Kontaktua | Guri buruz |   
Hemen zaude: Sarrera »  Sare-aldizkariak »  Berri berriak »  Amaraunean euskarak duen corpusik handiena

Amaraunean euskarak duen corpusik handiena

2005-02-08 / 07:00 / erabili.com   INTERNET

“Ereduzko Prosa Gaur” da amaraunean euskarak duen testu-corpusik handiena. Izan ere, zazpi milioi hitz ditu eta 152 liburu daude guztira.

Orain arte, XX. Mendeko corpus estatistikoa zen euskarazko corpusik handiena, ia 5 milioi hitzekin, baina oraindik orain liburu berriak sartu dira Ereduzko Prosa Gaur testu arakatzailean eta orain azken hau da amaraunean dagoen euskarazko testu-corpusik handiena: zazpi milioi hitz ditu Ereduzko Prosa Gaur testu aztertzaileak.

Hala ere, beste hizkuntzek dituzten testu-corpusetatik oso urrun dago. Izan ere, ingelesezko British National Corpus delakoak, 100 milioi hitz ditu eta Bank of English delakoak, berriz, 300 milioi hitz. Frantsesezko FRANTEXT izenekoak 150 milioi hitz ditu , Gaztelaniazko CREA izenekoak 139 milioi hitz eta CORDE izenekoak 136 milioi hitz.

CorpusaHitz kopuruaHizkuntza
British National Corpus100 milioi hitzIngelesa
Bank of English (COBUILD)300 milioi hitzIngelesa
FRANTEXT150 milioi hitzFrantsesa
CRAE130 milioi hitzGaztelania
CORDE136 milioi hitzGaztelania
Ereduzko Prosa Gaur7 milioi hitzEuskara
XX. mendeko corpus estatistikoa5 milioi hitzEuskara

Zer da "ereduzko Prosa Gaur"

Batetik, Ereduzko Prosa Gaur azken urteotako testuak biltzen dituen corpusa da. Corpus hau digitalizatuta dago.

Bestetik, euskarazko testu eredugarriak hiztegi eta gramatika aldetik aztertu eta kontsultatzeko tresna da Ereduzko Prosa Gaur testu-aztertzailea. Idazle eredugarriek hitz jakin bat, edo esapide bat, edo beste zer edo zer nola erabili duten ikusteko balio du. Bilaketa era askotara egin daiteke: hitz bat sartu eta idazle batek nola erabili duen ikus daiteke, edo liburu batean nola erabilita dagoen, edo corpuseko testu guztietan nola erabilita dagoen. Alegia, bilaketa egiteko modu asko daude, eta era batera edo bestera bilatu beharko dugu topatu nahi dugunaren arabera.

Honela, euskal autore eredugarriek guztioi sortzen zaizkigun duda-mudei eman dizkieten irtenbideak ezagutu ahal izango ditugu.

Nola erabiltzen den zehatz-mehatz ikusteko klikatu HEMEN

Ereduzko Prosa Gaur EHUko Euskara Zerbitzuaren proiektuen ildoan kokatu behar da. Arduraduna Zerbitzuko kide den Ibon Sarasola hizkuntzalaria eta euskaltzaina da, proiektuaren antolatze-, garatze- eta zuzentze-lanei dagokienez. Laguntzaileak orobat Zerbitzukoak diren Xabier Alberdi, Jesus Mari Makazaga, Iñaki Ugarteburu eta Juan Garzia dira. Proiektuaren babesle Donostiako Udala da, Euskararen Udal Patronatuaren bidez.

Liburu berriak

Sortu zenean 87 liburu sartu zituzten eta orain labealdi berria sartu dute. Izan ere, azken urte hauetako 65 liburu sartu dituzte eta guztira 152 liburutako hitzak agertzen dira corpusean. Oraingoz, hitz lauzko liburuak sartu dituzte, hau da, nobelak, saiakerak eta itzulpenak. Bigarren labealdi honetan liburu hauek sartu dira:

IzenburuaEgileaArgitaletxea/Urtea
Euskal Herria krisianJoxe Azurmendi Elkar, 1999
Esku bakarrarekin irakurtzeko kontuakPilar Cristobal / Juan Martin ElexpuruTxalaparta, 1999
Egonean doazen geziakJoxerra GarziaAlberdania, 2000
Arkitekturaz hamar liburuak Vitruvio / Santiago IruretagoienaKlasikoak, 2000
Ai, ama Arantxa IturbeAlberdania, 1999
Mistika liburuakEckhart-Tauler / X. Mendiguren BereziartuKlasikoak, 1997
Nerabearen biluziaXabier Mendiguren ElizegiElkar, 1999
Harry Potter eta sorgin harria J.K. Rowling / Iñaki Mendiguren Elkar, 2000
Naturaren mintzoa Pello ZabalaAlberdania, 2000
Euskararen sendabelarrakKoldo Zuazo Alberdania, 2000
Gelatxo, soinuaren bidaia luzeaPako AristiSoinuaren liburutegia, 2001
Sade-Filosofia apaingelan Juan Martin Elexpuru Txalaparta, 2001
Elgeta, sasiaren sustraiakKoldo IzagirreSoinuaren liburutegia, 2001
Edale santuaren kondaira Joseph Roth / Matías MujikaIgela, 2001
Oilandoiko ermitaMichel OronozElkarlanean, 2001
Luzaiden gaindiAngel Aintziburu / Jean Baptiste EtxarrenElkarlanean, 2002
Rufino Arrola, Vulkanoren atzamarrakXabier AmurizaSoinuaren liburutegia, 2002
Zakurra, zeure lagunaGotzon GarateElkar, 2002
Egurra PinotxoriAritz GorrotxategiAlberdania, 2002
Ipuin batean bezalaJoan Mari IrigoienElkar, 2002
Itzarri nahi ez zuen printzesaFelipe JuaristiAlberdania, 2002
Agindutako lurraren bila IJose Antonio MujikaErein, 2002
Agindutako lurraren bila IIJose Antonio MujikaErein, 2002
Errua eta maitasunaMarkos ZapiainElkar, 2002
Romain zen bere izenaJoxean AgirreElkar, 2003
Sakabi, soinu txikiaren handitasunaIñigo AranbarriSoinuaren liburutegia, 2003
Ekialdeko mamuakJon ArretxeElkar, 2003
Jakitearen arkeologiaMichel Foucault / Xabier ArregiKlasikoak, 2003
Soinujolearen semeaBernardo AtxagaPamiela, 2003
HirukoItxaro BordaAlberdania, 2003
Durduzaz eta dardarazAmélie Nothomb / Joxan ElosegiIgela, 2003
Van’t Hoffen ileaUnai ElorriagaElkar, 2003
Patri maiteaHasier EtxeberriaAlberdania, 2003
GoragaleaJean Paul Sartre / Monika EtxebarriaAlberdania-Elkar, 2003
Alemaniara deportatuaGrégoire Joannateguy / Marzel EtxehandiElkarlanean, 2003
Ezezaguna helbide honetanKressman Taylor / Ramon EtxezarretaErein, 2003
Itsasoan euriJoxerra GarziaAlberdania, 2003
Bederatzietatik bederatzietaraLeo Perutz / Anton Garikano Alberdania-Elkar, 2003
Txanponaren bi aldeakIñaki HerasAlberdania, 2003
Eszterren ondareaSandor Marai / Ander IrizarIgela, 2003
Oilarraren promesaJoan Mari IrigoienElkar, 2003
Behi eroakPatxi IturritegiElkar, 2003
Hemingway eta euskaldunak zerbitzu sekretuetanEdorta JimenezSusa, 2003
Kilkerren hotsakEdorta JimenezSusa, 2003
Esan gabe neukanaAgurtzane JuanenaElkar, 2003
Airezko emakumeakFelipe JauristiErein, 2003
Uda betiko balitzXabier Mendiguren ElizegiElkar, 2003
Ortzadarra sutanFernando MorilloElkar, 2003
Zertaz ari garen maitasunaz ari gareneanRaymond Carver / Koro NavarroAlberdania-Elkar, 2003
Hamasei kontakizunIsaac B. Singer / Koro NavarroAlberdania-Elkar, 2003
Antropologo bat MartenOliver Sacks / Xabier OlarraEHU, 2003
Unibertsitatea eta euskal gizartea gaurJuan Ignacio Pérez / Pello SalaburuPamiela, 2003
Ararat mendiaren suminaYasar Kemal / Fernando ReyAlberdania-Elkar, 2003
Kutsidazu bidea IxabelJoxean SagaztizabalAlberdania, 2003
EguzkipekoakPablo SastreAlberdania, 2003
Zoririk ezImre Kertész / Urtzi UrrutikoetxeaElkar, 2003
LekuaAnnie Ernaux / Joseba UrteagaIgela, 2003
GertakizunaAnnie Ernaux / Joseba UrteagaIgela, 2003
Hainbat idazlanSan Agustin / Imanol UnzurrunzagaKlasikoak, 2003
De re publica edo politikazPiarres XarritonElkar, 2003
110. Street-eko geltokiaIñaki ZabaletaElkar, 2003
Lorategi beldurgarriakMichel Quint / Josu ZabaletaErein, 2003
Gerrako pilotuAntoine Saint-Exupéry / Josu Zabaleta Alberdania-Elkar, 2003
Sei pertsonaia autore bilaLuigi Pirandello / Josu ZabaletaAlberdania, 2003
Buda zoriontsuen etxeaJoao Ubaldo Ribeiro / Karlos ZabalaTxalaparta, 2003

Liburuak aukeratzeko irizpideak

Motzean esanda, arloren batean zer edo zer aportatzen duten idazleak dira ereduzkoak:

  • Hitz edo esapide berriak sortzen dituztenak.
  • Euskal literaturan ibilbide errekonozitua dutenak.
  • Literatura oso ona egiten dutenak.
  • Salmenten arabera behintzat arrakasta nabarmena izan dutenak
  • Prestigio nabarmeneko sariak jaso dituztenak
  • ...

Orain arteko erabilera

Ereduzko Prosa Gaur testu aztertzailea 2003ko azaroan jarri zen amaraunean, eta gaur egun 1.000tik gora bisita izaten ditu hilean batez beste. Dena den, abenduan 1.700 bisita izan zituen eta 2005eko urtarrilean 1600. Guztira, 15.000 bisita izan ditu azken 12 hilabetetan.


Ildo bereko artikuluak (irakurtzeko gainean sakatu)


Inprimatu


Erantzun

 
Klasikoak bildumaren corpusak 7.228.862 hitz ditu
2005-02-21 / 17:20 / Pello Salaburu

Orain dela aste batzuk hedatu zenuten berri hau. Uste dut, egiaz, gauza handia dela, eta aski ona, euskaltzale guztiok kontsultatzeko gure eskura jarri den tresna hau. I. Sarasolak biziki ongi egiten du lan, duda gabe. Eta EHU tartean dagoelarik, poztasun handiagoa ematen dit horrek.

Baina ez dakit, bada, berriak dioena, bere horretan, egia den. Han esaten da hau dela sarean dagoen corpusik handiena, bere zazpi milioi hitzekin, eta orain arte "XX. mendeko corpus estatistikoa" zela handiena, 5 milioi hitzekin. Inori deusik ere kendu gabe, baina gauzak bere tokian utziz, esan behar dut KLASIKOAK izeneko bildumak aspaldi jarri zituela bere liburu guztiak sarean, soso osorik kontsultatzeko, PDFn edo Worden, eta denetara 7.228.862 hitz dituela corpus honek. Gainera testua bere osotasunean kontsulta daiteke, edo kopiatu ordenagailuan, edo inprimatu.

Egia da ez duela besteek sarreraka kontsultatzeko duten programa, baina hau da toki bakarra non, oker ez banaiz, 7 milioi luze hitz horiek denak batera (liburu osoak, ez pasarteak) har daitezkeen. Eta alde horretatik behaturik, hau da, gainerako datuak egiazkoak badira, eta besteei deus ere kendu gabe, eskura dugun corpusik handiena.

Uste dut nori berea eman behar zaion. Ez da esan beharrik, KLASIKOAK bilduman EHU ere hor dagoela administrazio kontseiluan.


(PELLO SALABURU hizkuntzalaria eta euskaltzaina da)

 
OEHren corpusa noizko amaraunean?
2005-02-22 / 16:33 / Ricardo Gómez

Euskarak duen corpusik handiena ez bada ere (tamaina ez baita beti garrantzitsuena), noiz izango dugu Interneten eskuragarri Orotariko Euskal Hiztegia idazteko erabiltzen den corpusa?
(RICARDO GÓMEZ Euskal Herriko Unibertsitateko irakasle eta FiloBlogia weblog-aren egilea da)

 

Erantzun

Euskara Patronatua
Tel.:943-814518
Faxa: 943-811947
erabili@erabili.com