PROIEKTURAKO KORPUSAK

-garri eta –go atzizkien proiektua egiteko hiru korpus desberdinetan oinarritu gara. Korpus hauek idazleen idatziak jasotzen dituzte eta batzuetan ohartu gabe edo ez dakizkielako nola erabiltzen diren ondo atzizkiak gerta liteke eurek ere zenbait akats egin izatea. Horretarako, korpusean begiratu aurretik, -garri eta –go atzizkiak nola erabili beharko liratekeen aztertu ditugu hainbat iturri desberdin erabiliz gure proiektuan.

Behin hau ondo aztertuta, korpus hauek erabili ditugu:

Elhuyarren Zientzia eta Teknologien Korpusa: bi atalez osatua da:

  • Zientzia eta teknologiaren alorreko euskarazko testugintzaren adierazgarria izateko asmoz diseinatu den gune orekatua.
  • Eskuragarritasunaren arabera korpuseratzen diren obrez edo obra-zatiez osatutako atal irekia.

Klasikoen Gordailua: hemen irakurtzeko, erabiltzeko eta ezagutzeko testuak bildu dira eta ez gordeak bakarrik izateko. Euskal Testuen Gordailuan hainbat testu zeuden sarean, Josu Lavinek egindako digitalizaio lanak abiapuntu izanik. Literatura alorreko testuak dira gehienak, baina ez bakarrak.

Ereduzko Prosa Gaur: Hemen aurkezten den lexiko honen xedea hitz zerrendan bildutako sarrera bakoitzaren erabilera aztertzea da. Erabilera historian zehar, eta erabilera gaur egun. Hortaz, konparazio bat egiten da lexiko honetan, ikusteko, azken batean, zein den hitz edo sarrera bakoitzaren joera.

-go atzizkiari dagokionez, hiru hitzetan oinarritu gara okerreko erabilera aztertzeko eta testu idatzietan zenbaterainoko presentzia duten ikusteko: entzulego, biztanlego eta ikuslego. Hiru hitz hauek lehenago aipatutako korpusetan bilatu ditugu jakiteko zein esaldietan oker erabili diren. Klasikoen Gordailuan ez da egon hitz horien agerraldirik, baina beste bietan bai Zientzia eta Teknologien korpusean agerraldi gehien agertu direlarik.  –garri atzizkiarekin ezin izan dugu horrelako bilaketarik egin korpusetan, izan ere, testuinguruaren araberakoa baita honen erabilera, baina horrek ez du esan nahi ez denik gaizki erabiltzen.

Advertisements

ATSOTITZEN KORPUSA

Gotzon Garatek 30 urtetan zehar egindako lan eskerga honetan hainbat atsotitz desberdin aurki ditzakegu hizkuntza desberdinetan: euskaraz, gazteleraz, ingelesez eta latinez hain zuzen ere. Lan honek 14.458 atsotitz biltzen ditu euskaraz, gainerako hizkuntzetan bere parekoa zein den adieraziz. Euskarazko atsotitz gehienak zazpi probintzietako 23 baserritan daude bilduta gutxi gorabehera.

Normala den moduan, hemen agertzen diren esaera asko orain hilda daudenei jasotakoak dira eta aski garbi ikus dezakegu gaur egungo baserrietako jendeak lehen erabiltzen zuten baino askoz atsotitz gutxiago erabiltzen dutela. Atsotitzak hizkuntzaren aberastasunaren erakusle direla ikus dezakegu.

Korpus honetan hitz bat sartzea nahikoa da jakiteko ea zenbat atsotitz desberdin dauden hizkuntza horretan hitz hori barne hartzen dutenak eta zein den/diren esaera horren baliokideak gainerako hizkuntzetan.

Esan beharra dago ere atsotitzek herria ezagutzeko aukera ematen digutela, hots, zeintzuk ziren herrietako jokamolde, uste eta tradizioak, baita folklorea ere. Mitologiaren aztarnak eta erlijio kontuak zein iritziak naturarekin erlazionatuta ere aurki ditzakegu, eta nola ez, gure arbasoek belaunaldiz belaunaldi transmititu dizkiguten ipuin edota pasarteak.

Informazio iturriak:

· Garate, G: Atsotitzak, BBK, 1999-03-02an eguneratua, http://www.ametza.com/bbk/htdocs/hasiera.htm -tik hartua 2009-06-20an.

EDAK proiektua

Duela urtebete baino zertxobait gutxiago aurkeztu zuen EUDIA ikerketa taldeak EDAK (Euskara Dialektalaren Ahozko Korpusa) proiektua. EUDIAk euskararen bariazioari ematen dio garrantzia eta horretarako bere zentzu zabalenean ikertuko ditu desberdintasunak hizkuntzaren diakronia kontuan harturik: bariazio soziolinguistikoa, geolinguistikoa, lexikoa, morfologia…

Euskarak urtez urte eta belaunaldiz belaunaldi zer motatako aldaketak hartzen dituen ikustea da EDAK proiektu honen helburu nagusietarikoa.  Baita esan beharra dago, horrekin batera eta horretan oinarrituz, euskara dialektalaren ahozko korpusa sortzea ere helburu duela. Euskara hizkuntza ikertzerako orduan, korpus honek datutegi bezala jokatuko du, korpusean oinarrizko datuak bildurik.


Euskaraz hainbat korpus daude baina ahozko korpusa ere beharrezkoa da, izan ere, euskarari buruzko ikerketa bat egin behar denean ahozko euskararen korpus dialektal ezak atzeratu eta zaildu egiten baitu ikerketa hori.

Korpusean bildutako datuek ondoko bi ezaugarri hauek izango dituzte:

  • Euskalki eta hizkera garrantzitsuenak bilduko ditu.
  • Belaunaldietako datuak 45-50 urte ingurukoenak eta 20-25 urte ingurukoenak izango dira, batez ere, nagusien hizkera kontuan hartuz.

Horretarako aurretiazko galdera sorta bat prestatuta egongo da informatzaileari egiteko gorago aipatutako ezaugarri horietan ahalik eta informazio eta etekin handiena ateratzeko hartzaileari. Ondoren, informatzailearen soinuak eta transkribaketak erabiliko dira korpusa osatzeko Euskal Herriko ahozko ondarea eta herri hizkerak bildu, katalogatu eta hedatuz.

Informazio iturriak:

· Badihardugu Euskara Elkartea. Euskal Herriko hizkera eta ahozko ondarea. 2009ko ekainean eguneratua http://www.ahotsak.com/ -tik hartua 2009-06-19an.

LABAYRU HIZTEGIA: Bizkaiera, batuera, elebiduna.

Labayru hiztegia hiztegi elebiduna da eta bi hizkuntza uztartzen ditu euskara eta gaztelera erabiliz.  Euskaraz azken hogei urteotan garatu diren hiztegi gehienak elebakarrak izan dira, hots, hizkuntza bakar bat erabili izan da hiztegi osoan. Baina momentu honetan merkatuan hiztegi elebidunen premia handiagoa ikusten da gizartea garatuz doan heinean.

Hiztegi honetan ahozko eta idatzizko tradizioa bateratu egin dira eta monografia dialektalen eragina ere ikus daiteke. Batuerarako araututako formekin batera, bizkaieraren berbak ere sartu dira hauen erabilera bereziekin batera. Horrela, hiztegi honen helburu nagusietariko bat bete da batuerako hitz formen ugaltzea ekarriz. Korpusa hautatu, sailkatu, jorratu eta hornitzerakoan gainontzeko hiztegi elebidunak baino irizpide maila altuagoak erabili dira.


Esan beharra dago ere, lan taldeak gaur egungo errealitateari begiratu nahi izan diola hitzen adiera eta ezaugarri guztiak ahalik eta zehaztasun handienaz bilduz. Honekin loturik, berbak ez ezik, egitura konplexuagoak ere sartzen dituzte eguneroko hizkera biziak ekarriak direnak, eta gainontzeko hiztegi gehienak ez dira horrelako gauzetan oinarritu.

Nire ustez, gaur egun  filologo batek bizkaieraz defenditzeko gaitasuna izan beharko luke edo bakoitzak berea duen dialektoa gutxienez. Gaur ez zaio garrantzia handirik ematen ikastetxe askotan dialektoen ikasketari eta erabilerari, bakarrik forma estandarrean oinarritzen direlarik, hau da, batuera. Hau ikasten ari garen bitartean ez da horrenbeste nabaritzen, baina behin filologoak garenean, bakoitzak berea duen dialektoa zergatik ez genuen ikasi galdetzen diogu geure buruari.

Informazio iturriak:

· Labayru Hiztegia: “Bizkaiera ardatz duten hiztegia eta jarraibide liburuak” Berri Berriak, Azpeitiko Udala, 2006-06-02an eguneratua, http://www.erabili.com/zer_berri/berriak/1148996185-tik hartua 2009-06-14an.

-garri ATZIZKIA

Balio aktiboa zein pasiboa duen garri atzizkiak antz handia dutela ikusten da nahiz eta berdinak ez izan. Baina zein arrazoi dago garri biek bakarra izan behar dutela pentsatzeko? Xabier Artiagoitiak honen gainean uste du hiru arrazoi eman daitezkeela gutxienez. Arrazoiak ondoko hauek dira:

  • Balio bikoiztasuna aipatu arren, tradizio gramatikalak ez ditu inoiz ere garri morfema bi bereizten izan.
  • Garri-ren bidez adjektiboak sortzen dituen eragiketa morfologikoaren emankortasuna bi balioekin ikusten da, eta ezin da esan bata bestea baino emankorragoa denik.
  • Bokal aldaketaren arau fonologikoak garri bakarrari eragiten dio, eta ez dago beraz bereizketa susmarazten digun arrazoirik.

Hortaz, garri bakarra dugula onartzen du Xabier Artiagoitiak, ez baitago morfologi prozedura biren aurrean gaudela pentsatzeko inolako argudiorik. Garbi uzten du garri morfemaren balio biak bakar baten bil daitezkeela, beraren bidez sortzen den adjektiboari dagokion subjektua oinarrizko aditzaren lehen osagarria litzatekeen determinatzaile sintagma delako kasu bietan.

Informazio iturriak:

· “Garri atzizkiaren izaera bikoitzaz: zergatik den maitagarria bezain mingarria”. X Artiagoitia ASJU XXIX-2 (1995) 355-405.  2009-06-19an hartua.

ERATORPENA: -go eta -garri atzizkiak

Eratorpena esanahia duen hitz bati esanahirik gabeko elementu bat erantsiz hitzak sortzeari esaten zaio. Esanahirik gabeko elementu horiek aurrizkiak, artizkiak edo atzizkiak izan daitezke. Elementu hauek hitzaren kategoria aldatzeko gaitasuna daukate. Euskaraz gehienak atzizkiak dira; artizki eta aurrizki gutxi ditugu.

Lehenago aipatu dudan bezala, atzizkiek kategoria mota desberdinetako hitzak sortzen dituzte: izenak, izenondoak, aditzondoak eta aditzak. Guk geure proiektua -garri eta -go atzizkien gainean egingo dugu, taldeko partaideak ni, Ainhoa eta Aizpea garelarik. –garri atzizkiak izenak eta izenondoak sortzeko balio duela ikus dezakegu lan honetan eta –go atzizkiak aldiz, izenak bakarrik.

Lan honen helburu nagusia honako hau da: atzizkien ezaugarrien eta euren erabilera egokiaren, bai tradizioz eta bai gaur egun nagusitzen denaren berri ematea. Bi atzizkietan metodologia bera erabili dugu aztertzerako orduan: lema, azpikategorizazioa eta adiera, hots aldaketak eta paradigmak aztertu ditugu hurrenez hurren.

Bi atzizki hauek ohikoak dira, egunero erabiltzen ditugun bi atzizki dira ohartu ere egin gabe eta hauek ematen dituzten arazoak azaltzea da lan honen helburuetako bat sareak eskaintzen dituen tresnak eta baliabideak erabiliz. Horretarako eta baita korpusa osatzeko bibliografia desberdina erabili dugu hainbat iturritatik: sare (nola ez), liburu eta artikuluetatik, alegia.

Errekurtso linguistikoak

Errekurtso linguistikoek honako hauei egiten die erreferentzia: lengoaiako edota hizketa/hizkuntzako datu linguistiko eta makinaren bitartez irakurgarriak diren deskribapen multzoei. Adibidez: lengoaia naturalaren eta algoritmo edo sistemen diskurtsoaren eraikuntzan, hobekuntzan edota ebaluazioan jarduteko erabilia izaten da. Baita software aurkikuntzarako eta hizkuntza zerbitzuen industrien errekurtso printzipal gisa, hizkuntzen ikasketarako, industria editorial elektronikorako, nazioarteko transakziorako, esparruko aditu eta azken erabiltzaileentzako ere.


Errekurtso linguistikoen adibideak idatzizko eta ahozko Korpusak dira, lexiko konputazionalak, terminologiaren datu baseak, tratamendu eta diskurtso bilduma etab. Oinarrizko softwarearen tresnak ere garrantzitsuak dira eskuraketarako, preparaziorako, kolekziorako, direkziorako, pertsonalizaziorako; baita errekurtso linguistiko hauen erabilera eta beste batzuena ere.

Errekutso linguistikoak bi modutara erabiliko dira: sistemen elaborazioan eta bere ebaluazioan.

  • Sistemen elaborazioa: Korpusaren erabileran daude oinarrituta ahozko edo idatzizko lengoaia prozesu sistemak.
  • Sistemen ebaluazioa: errekurtso linguistikoak garatuak izan diren sistemak bata bestearekin konparatzeko eta ebaluatzeko erabiliak dira.

Informazio iturriak:

· ELRA European Language Resource Association. Definition, use. 2008an eguneratua http://www.elra.info/Definition.html -tik hartua 2009-05-18an.

·

EGUTEGIA

2017(e)ko azaroa
A A A A O I I
« Eka    
 12345
6789101112
13141516171819
20212223242526
27282930  

KATEGORIAK

del.icio.us (Baliabide barriak)

RSS Library tag feed from delicious

  • An error has occurred; the feed is probably down. Try again later.

RSS http://planet.littera.deusto.es/feed

  • An error has occurred; the feed is probably down. Try again later.