Fuentes web
Entradas
Comentarios

Hau da Opentrad itzultzaile automatikoaren SlideShare aurkezpena:

Egileak: Irati Garaioa, Idoia Ibarlucea eta Amaia Navarro

Sarrera

Opentrad itzulpen automatikoko sistema da eta 2006ko maiatzean aurkeztu zen Kataluniako Unibertsitate Politeknikoan. 20 hizkuntza-bikote baino gehiagoren arteko itzulpenak egiten ditu. Gero eta erabilera zabalagoa dauka Opentrad itzultzaile automatikoak, eta  erabiltzaile, enpresa eta erakunde publikoek zeregin hauetarako erabiltzen dute: testuak eta dokumentuak itzultzeko, Interneten hizkuntza desberdinetan nabigatzeko, eta abar. Itzultzaile automatiko honek beste aukera batzuk ere eskaintzen dizkie zenbait erabiltzaileri, hala nola, beren web-orri pertsonalak, enpresako web-orriak, blogak, eta abar ingelesez, gaztelaniaz, galegoz, portugesez, katalanez, eta abarrez jartzea.

 

Helburua

Opentrad proiektuaren helburu nagusia itzulpen automatikoko bi gailu edo motor garatzea izan da. Horietako bat hizkuntza ahaideko bikoteentzat da, transferentzia sintaktiko partziala egiteko; bestea berriz, transferentzia sintaktiko osokoa, elkarrengandik urrutiago dauden hizkuntz bikoteentzat. Beraz, proiektuaren azken helburua eskaintzen dituen hizkuntza-bikoteen arteko itzulpenak egiteko gai den sistema-prototipoa sortzea da.

 

Babeslea eta bultzatzailea

2004.urtean hasi zituzten sistema honen sortze-lanak. Garai honetan proiektu honek zazpi partaide zituen: Eleka Ingeniaritza Linguistikoa, Vigoko Unibertsitateko Informatika Hizkuntzalaritzako Mintegia, Alakanteko Unibertsitateko Transducens taldea, Kataluniako Unibertsitate Politeknikoa (TALP), Euskal Herriko Unibertsitateko Ixa taldea, Imaxin Software eta Elhuyar Fundazioa.

Gaur egun, Opentrad Partzuergoa imaxin software eta Eleka Ingeniaritza Linguistikoa enpresek osatzen dute. Imaxin Software software eta multimediako I+G+b arloko soluzio eta zerbitzu aurreratuak eskaintzen dituen enpresa da eta ingeniaritza linguistikoan, lokalizazioan eta hezkuntzarako multimedia produktuetan aditua da. Eleka Ingeniaritza Linguistikoa ingeniaritza linguistikoaren arloan I+G+b proiektuak lantzen dituen enpresa da, batez ere garapen eta berrikuntza arloetan.

 

Hizkuntzak

Aipatu bezala, Opentrad sistemak 20 hizkuntza-bikote baino gehiago itzultzen ditu. Opentrad Partzuergoari, unibertsitateei edota komunitateei esker lortu da  hizkuntza desberdin hauetara itzuli ahal izatea. Hona hemen horietako batzuk:

  • Gaztelania-Errumaniera
  • Gaztelania-Ingelesa
  • Gaztelania-Frantsesa
  • Gaztelania-Katalana
  • Gaztelania-Galegoa
  • Gaztelania-Portugesa
  • Gaztelania-Euskara
  • Frantsesa-Katalana
  • Okzitanoa-Katalana
  • Okzitanoa-Gaztelania
  • Ingelesa-Katalana
  • Ingelesa-Esperantoa
  • Ingelesa-Galegoa
  • Galesa-Ingelesa
  • Esperantoa-Gaztelania
  • Esperantoa-Katalana
  • Bretoia-Frantsesa
  • Portugesa-Katalana
  • Portugesa-Galegoa
  • Norvegiera Nynorsk- Norvegiera Bokmal

 

Abantailak

 Ugariak dira Opentrad itzultzaile automatikoak eskaintzen dizkigun abantailak. Hauexek dira aipagarrienak:

  • Opentrad, integratzen erraza: edozein sistemarekin integratzeko aukera ematen du, eta itzultzaile hau darabilen bezero bakoitzaren beharretara egokitzen da. Dokumentu asko, hainbat hizkuntzatakoak, erabiltzen dituzten erakundeei zuzendua dago.
  • Opentrad, kalitatea eta pertsonalizazioa: Opentrad, bezero bakoitzaren terminologia-beharretara pertsonalizatu eta egokitu daiteke. Eskaintzen duen hizkuntza-kalitatea dela eta, enpresa eta erakunde publiko gehiagok darabilte sistema hau.
  • Opentrad, azkartasuna itzulpenetan: itzultzaile automatiko honek berehala itzultzen ditu testuak, dokumentuak, web-orriak eta abar.
  • Opentrad, lizentziarik gabe: teknologia-inbertsioak optimizatzeko aukera ematen du. Kostuak aholkularitzatik eta bezero bakoitzaren beharretara pertsonalizatu eta egokitzetik eratorritakoak dira.

 

Erabilera gomendioak

Opentrad itzultzaile automatikoaren Web orrialdean ondorengo gomendio hauek aurki ditzakegu sistema hau ahalik eta hoberen erabiltzeko:

  1. Itzulpena egin aurretik testu originala zuzendu, testu originalean dauden akatsek itzulpenaren kalitatean eragina izan dezaketelako.
  2. Esaldi laburrak eta sinpleak erabiltzea komeni da hauek itzulpenak zuzenak izaten laguntzen dutelako, horrela esaldi anbiguoak ere saihestuz.
  3. Puntuazioa eta sintaxia zaindu egin behar dira, azken batez, adierazi nahi dena ongi ulertzeko eta transmititzeko ezinbesteko elementuak dira
  4. Itzultzaile automatikoak testua ongi ulertu dezan lagunarteko esamoldeak eta esaera idiomatikoak saihestu behar dira, nahasmena sor dezaketelako.
  5. Funtsezkoa da itzulpena berrikustea prozesu automatizatuek hizkuntza soildu egin dezaketelako.

 

Adibideak

Opentrad itzultzaile automatikoaren funtzionamenduan sortzen diren akatsak frogatzeko zenbait artikulu hartuko ditugu. Lehenengo eta behin, bi artikulurekin egingo dugu froga, lehenengoa gaztelaniatik euskarara eta bigarrena euskaratik gaztelaniara itzuliz.  Azkenik, gaztelaniazko abesti bat euskaratu egin dugu.

 

 

1. Lehenengo testua Gara egunkaritik (2011-04-13) hartu dugu, eta hau da:

“El seísmo ha tenido lugar a las 10:08 hora local (02:08 GMT) con su epicentro localizado a diez kilómetros de profundidad en el sur de Fukushima, donde ha alcanzado una intensidad de grado 4 en la escala japonesa de siete puntos, que se centra más en las zonas afectadas. El terremoto no ha obligado a evacuar la planta nuclear de Fukushima Daiichi ni ha detenido las labores de enfriamiento de sus reactores, según ha informado la televisión pública NHK. Parte de los operarios de Fukushima se concentran hoy en drenar el agua contaminada que inunda varias zonas de las instalaciones del reactor 2, según NHK”.

“Seismoa gertatu da 10:08 ordu lokal (02:08 GMT) sakontasunaren 10km-ri Fukushimaren hegoaldean haren epizentro aurkituarekin, intentsitate bat lortu duen leku gogoz lau zazpi puntutako japoniar eskalan, gehiago erdiratzen den inguru eragin. Lurrikarak Fukushima Daiichiren planta nuklearra ebakuatzera ez du behartu ere haren erreaktoreen hoztearen lanak gelditu ditu, NHK telebista publikoa informatu du. Fukushimaren langileetako batzuk gaur kontzentratzen dira erreaktorearen instalazioen bi zenbait inguru urpetzen duen ura, drainatu kutsatuta NHK-ren arabera”.

 

Egin diren akatsak aztertzeko maila morfosintaktikoa eta maila lexikoa hartuko ditugu kontuan.

Maila morfosintaktikoa:

  • Euskarazko itzulpenak gaztelaniazko artikuluaren orden bera jarraitzen du, lehenengo esaldi honetan argi ikus daitekeenez: el seísmo ha tenido lugar a las 10:08 hora local (S-V-O) eta seismoa gertatu da 10:08 ordu lokal (S-V-O). Baina euskarazko ordenak S-O-V izan beharko luke. 
  • Ezagutzen ez dituen hitzak bere horretan itzuli ditu, hitza deklinatu barik, adibidez: a las 10:08 hora local eta 10:08 ordu lokal.
  • Deklinabide kasuak ez ditu bereizten:

                          -Adlatibo eta datiboaren arteko bereizketarik ez du egiten adibide honetan: a diez kilómetros eta 10km-ri.  Adlatiboak egon beharko lukeen tokian, 10km-ra, datiboa erabiltzen du.

                          -Ondorengo adibide honetan ere itzultzaile honek akats bat egin du hitz bat deklinatzerako orduan: con su epicentro localizado epizentro aurkituarekin itzuli du, hau da, soziatibo kasua aditzari gehitu dio.

                          -Genitiboa eta leku-genitiboa nahastu dira adibide honetan: Fukushimaren langileetako erabili du Fukushimako langileetako erabili ordez.

                          -Kasu batzuetan ergatibo kasua ez da agertzen. Esaterako, NHK telebista publikoa informatu du.

  • Labores de enfriamiento, hoztearen lanak gisa itzuli du. Euskaraz hitz elkartu baten bidez adieraziko genukeena (hozte-lanak)itzultzeko, egitura sintaktiko batez baliatu da sistema hau.
  • Ezezko esaldiak sortzeko egitura sintaktikoan egokia ez den partikula bat erabili du: ere partikula ezta partikularen ordez: ez du behartu ere haren erreaktoreen hoztearen lanak.
  • Egitura aldetik, erreaktorearen instalazioen bi zenbait inguru urpetzen duen ura, drainatu kutsatuta esaldia guztiz okerra da eta ezinezkoa da esaldiaren zentzua ulertzea.

Maila lexikoa

  • Zenbait hitz itzultzerakoan aukeraketa okerra egin da; izan ere testuinguru batzuetan sinonimoak diren hitzak erabili dira baina testu honetarako egokiak ez direnak. Adibidez: erdiratu eta centrar (areagotu izango lizateke aukerarik egokiena); afectadas eta eragin (kaltetuak) ; evacuar eta ebakuatu (hustu).
  • Euskarazko itzulpenean leku gogoz  hitzak erabiltzen dira baina ez dakigu zeri egiten dioten erreferentzia gaztelaniazko testuan.

 

2. Bigarren testua Berria egunkaritik (2011-04-17) hartu dugu:

“Donostiako Bulebarrean amaituko da gaur Korrika, auzo guztiak igaro ondoren. Milaka euskaltzalek espero duten unea iritsiko da: Korrika osoan zehar lekukoaren barruan joan den leloa irakurtzekoa. Aldi guztietan bezala, festari amaiera emateko, egun osoko jaia izango da ondoren”.

“Donostiako el próximo día bulebarrean hoy ha después de pasar, corriendo todos los barrios. Miles de euskaltzalek se espera año: el momento por todo el corriendo dentro del testigo el lema que se ir irakurtzekoa. , como en todos tiempo el final festari para dar fiesta de todo el día después de será”.

 

Aurreko adibidean bezalaxe, akatsak aztertzeko maila morfosintaktikoa eta maila lexikoa erabiliko ditugu:

Maila morfosintaktikoa

  • Deklinatuta dauden hitzak ez ditu gaztelaniara itzultzen, ez dituelako ezagutzen. Esaterako: Donostiako, bulebarrean, euskaltzalek, irakurtzekoa, festari.
  • Amaituko da eta iritsiko da aditzak ez dira gaztelaniazko testuan itzulita agertzen.
  • Badira ere zenbait elementu euskarazko testuan agertzen ez direnak eta gaztelaniazko itzulpenean badaudenak: hoy ha después de pasar eta se espera año.
  • Gaztelaniazko itzulpenean ir aditza ez dago jokatua. Erlatibozko esaldia zuzena da, baina aditz nagusia ez: joan den leloa -> el lema que se ir.
  • Esaldiak ez daude ondo egituratua eta horrek ulermena zailtzen du. Esate baterako: para dar fiesta de todo el día después de será.

Maila lexikoa

  • Korrika hitza ondo itzulita dago, itzultzaileak aditzondo gisa antzeman eta horrela itzuli duelako (corriendo) baina itzultzaile automatikoa ez da gai izan lexikalizatutako eta izen berezi bihurtutako aditzondoa dela antzemateko. Ezin du jakin Korrika zer den eta horregatik itzuli du aditzondo gisa.
  • Aldi itzultzerakoan aukeraketa okerra egin du, tiemporen ordez beste hitz bat aukeratu beharko zuelako testuinguru horretarako egokiagoa izango litzatekeena.

 

3. Hirugarren testua Los Ronaldos taldearen “No puedo vivir sin ti” abestitik atera dugun zati bat da:

 ”Llevas años enredada en mis manos,
en mi pelo, en mi cabeza,
y no puedo más, no puedo más.
Debería estar cansado de tus manos,
de tu pelo, de tus rarezas,
pero quiero más, yo quiero más.

No puedo vivir sin ti,
no hay manera,
no puedo estar sin ti,
no hay manera”.

 

“Urteetan daramazu nire eskuetan korapilatua,
nire ilean, nire buruan,
eta gehiago ez ahal dut, gehiago ez ahal dut.
Zure eskuetatik nekatu,
zure ilearen, zure arrarotasun,
baina nahiago naiz, nik nahiago naiz.

Zu gabe ez dut bizi izan ahal,
era ez dago,
zu gabe ez naiz egon ahal,
era ez dago”.

 

Oraingo honetan akatsak maila morfosintaktikoan baino ez dira ematen.

Maila morfosintaktikoa

  • Lehenengo akatsa (urteetan daramazu) gramatikalki zuzena da baina ulermen eta erabilera aldetik egokiagoa izango litzateke ondorengo hau: urteak daramatzazu.
  • Bigarren akatsa guztiz gramatikala da : no puedo más itzultzeko ezin dut gehiago beharrean ez ahal dut itzuli du.
  • Hirugarrena deklinabide-akatsa da:  cansado de tus manos itzultzeko zure eskuez nekatuta izango litzateke egokiena, baina zure eskuetatik nekatuta itzuli du. Hau da, ablatiboa erabili du kasu hau erabili behar ez zuenean.
  • Gaztelaniazko testuan deberia estar azaltzen da, ez, ordea, euskarazkoan. Hots, ezabatu egin dute.
  • Bosgarren akatsa aditzean ematen da: alde batetik, aditza dago gaizki itzulita testuinguru honetan ez baitu eman nahi izan dioten zentzua: quiero más esateko gehiago nahi dut izango litzateke egokia eta ez nahiago naiz. Bestalde, aditz-laguntzailea ere gaizki erabilita dago: nahiago dut izan beharko litzateke eta ez nahiago naiz. Azkenik, aditzarekiko komunztadura ere hautsi egiten da: ergatibo kasua erabili da beharrezkoa ez denean: nik nahiago naiz.
  • Seigarren akatsean gramatika aldetik daude arazoak: no puedo vivir itzultzeko ez dut bizi ahal erabili dute eta ezin dut bizi litzateke forma egokia.
  • Azken akats honetan arazoa ordenarekin eta deklinabidearekin dago, partitiboarekin zehazki. No hay manera esateko ez dago erarik izango litzateke itzulpen egokiena baina era ez dago itzuli da.

 

Bibliografia

 Egileak: Irati Garaioa, Idoia Ibarluzea eta Amaia Navarro

Sarrera

Gotzon Garatek (1934-2008) egindako bilketa-lan honetan 27.000tik gora atsotitz aurki ditzakegu lau hizkuntza desberdinetan: euskara, gaztelania, ingelesa eta latina. Atsotitz-bilduma hau egiteko Gotzon Garate 30 urtez Euskal Herriko hainbat baserritan bildutako informazioaz baliatu da, eta Bilbao Bizkaia Kutxa Fundazioaren laguntzari esker argitara eman zuen 1998. urtean. Corpus hau Interneten eskuragarri daukagu orrialde honetan: http://www.ametza.com/bbk/htdocs/hasiera.htm 

  

Euskarari eta euskal kulturari egindako ekarpena

Atsotitzen corpus hau aurki dezakegun atsotitz bildumarik onenetarikoa eta osoena da era ukaezin batean aberasten baitu euskera eta honen ezagutza. Gotzon Garateren hitzetan: “Atsotitzak oso onak dira gure hizkuntza eta kultura ezagutzeko”. Azken batez, lexikoa ez ezik, esaldi osoak ere badaudelako, bizitza osoan euskaraz hitz egin izan dutenek esandakoak. Lehen esan dugun bezala, Gotzon Garate 30 urtez ibili zen baserriz baserri corpus hau osatzeko atsotitzak biltzen. Horregatik diogu bildumarik oneneratikoa eta errepikaezina dela, gaur egun gero eta gazte gutxiago bizi direlako baserrietan eta beraz, gero eta atsotitz gutxiago dakitelako.

  

Atsotitzen sailkapena

Esan bezala, lau hizkuntzatan agertzen zaizkigu corpus honetako atsotitzak. Euskarazko atsotitzak 14.458 dira, eta gehienak zazpi probintzietako 23 baserritan bildu dira. Euskal atsotitz hauen gaztelaniazko, ingelesezko eta latinezko ordainak agertzen zaizkigu. Gauza bera gertatzen da beste hizkuntzetako atsotitzekin: gaztelaniaz 5.208 esaera zahar daude eta hauek beste hizkuntzetan zelan esaten diren aurki dezakegu; eta sail hau osatuena eta garrantzitsuena da euskal atsotitzekin batera. Ingelesez, 4.045 atsotitz eta latinez 3.462 atsotitz daude, eta hauen baliokideak ere agertzen dira beste hiru hizkuntzetan. Hau guztia era argiago batean ikusiko dugu esaera zahar batzuen adibideak ematean.

Hala ere, ez dira agertzen frantsesezko atsotitzak, eta liburuaren sarreran honen azalpena ematen zaigu: “Frantsesez ez. Zergatik? Gure Iparraldeko haurrideek lan hori hobeki egingo dutelako, nire aldean frantsesez hobeki baitakite“.

 

Atsotitzek biltzen dituzten eremuak

Atsotitzen corpus honetan hauexek dira lantzen diren eremu esanguratsuenak:

  • Animalien eremu semantikoak leku handia hartzen du corpus honetan. Zakurren, ardien, zerrien, astoen, azerien gainean esandako atsotitzak aurki ditzakegu. Esaterako: “Edonon dauz txakurrek agiñek zabalik”.
  • Euskal Herriko ohiturei buruzko atsotitzak: zerri-hiltzea, euskal ezkontzak, etab. Hau da, “San Antonio, jentia ezkontzeko beti pronto”.
  • Euskal Herriaren filosofia eta morala. Adibidez: “Filosofia baiño, oillozopia obe”
  • Euskal gizarteari buruzko informazioa ere ematen digute atsotitzek; hala nola, familia, lana, erlijioa. Hala nola, “Familia, erriaren mintegia” eta “Ama Birjiñia martxoko, ni mendian gaillurrerako”.
  • Mitologia eta naturarekin lotutako siniskerak ditugu. Esate baterako, “Sustraiak barrenago, zuhaitzak gorago”.
  • Otoitzak, sorginkeriaren gaineko atsotitzak, Euskal Herriko jaiak eta arbasoengandik jaso ditugun ipuinak. Hots, “Zelako gizona, alako otoitza” eta “Sorginak sasien gainetik eta odeien azpitik”.
  • Folklorea eta etnologiari buruzkoak ere badira, herriaren antzinateko uste, jokamolde eta tradizioak azaltzen dituztenak.

 

Corpusaren funtzionamendua

Corpus hau nola funtzionatzen duen azalduko dizuegu orain eman beharreko pausu guztiak banan-banan azalduz.

1. Behin orrialde honetan gaudela (http://www.ametza.com/bbk/htdocs/hasiera.htm) goiko aldean agertzen den kontsulta botoia klikatu behar da.

 

2. Ondoren, bilatu nahi dugun hitza jartzeko aukera daukagu. Gainera, hitz bat baino gehiago kontsulta dezakegu. Kontuan hartu beharrekoa da hitzak mugagabean idatzi behar direla; hau da, zuhaitz eta ez zuhaitza, eta ireki eta ez irekitzeko.

3. Hurrengo pausua hitzaren kontsulta egitea da. Gure kasuan, eguzki hitza daramaten atsotitzak zeintzuk diren ikusi nahi dugu. 74 atsotitz agertzen dira zerrendatuta, eta irudi honetan lehenengo hamarrak ikus daitezke.

 

4. Atsotitz bakoitzaren baliokidea beste hiru hizkuntzetan ikusi ahal izateko, nahikoa da atsotitz bakoitzaren ezkerretara dagoen gezia klikatzea. Hau egitean, eskuineko aldean agertuko zaizkigu baliokideak euskaraz, gaztelaniaz eta latinez. Hala ere, gerta daiteke atsotitz batek baliokiderik ez izatea. Guk aukeratu dugun atsotitza hau da: “han ere ogia ez da eguzkitan erretzen”.

Ikus daitekeen bezala, aukeratu dugun atsotitz honek ez dauka baliokiderik. Gaztelaniaren kasuan, berriz, hiru; ingelesaren kasuan, bost eta latinez bakarra.

Prozesu hau berriro egingo dugu baina gaztelaniazko bilatzailearekin. Oraingo honetan vergüenza hitza jarri dugu bilatzailean eta hamahiru atsotitz agertu zaizkigu, eta baliokideak ikusteko guk atsotitz hau aukeratu dugu: “Quien tiene vergüenza, ni come ni almuerza”.

 

Ikus dezakegunez, atsotitz honek euskarazko bederatzi baliokide ditu eta gaztelaniazko beste hiru. Latinaren eta ingelesaren kasuan, aldiz, ez du kidekorik.

Bibliografia

Sarrera

Orotariko Euskal Hiztegia (OEH siglez ere ezaguna) Euskaltzaindiak egin duen lanik handienetako bat da,  lexikografian ari direnentzako ezinbesteko baliabidea izanik. Hiztegi historiko honetan euskararen aro eta euskalki guztietako idazkietako lexikoa jaso eta antolatzen da. Orotariko Euskal Hiztegia hamasei liburukitan argitaratuta dago: lehena 1987an argitaratu zen paperean eta  16.a 2005ean. Ikertzaile eta erabiltzaile orok erraztasunez kontsulta dezan Euskaltzaindiak Internetez eskaintzen du hiztegiaren oinarrizko bertsio elektronikoa, orrialde honetan eskuragarri dagoena: http://www.euskaltzaindia.net/oeh

 

Babeslea eta bultzatzailea

Aztertzen ari garen hiztegi hau Euskaltzaindiak bultzatua da. Koldo Mitxelenak, Euskaltzaindiaren enkarguari jarraituz, eman zion hasiera ekimen honi 1984. urtean euskararen ondare lexikografiko zabala biltzeko helburuz. Hasiera batean, lan hau burutzeko 50 urte lehenago (1955ean) Azkuek argitaratu zuen Diccionario Vasco-Español-Francés obra eguneratu, zuzendu eta osatzen hasi zen. Dena den, lehen saiakera honek ez zuen atarramendurik  eman, alde batetik lana oso astiro zihoalako eta, bestetik, La Gran Enciclopedia Vasca argitaletxeak Azkueren hiztegia berrargitaratu zuelako. Beraz, ekimen hau aurrera ateratzeko beste irtenbide bat aurkitu beharrean zeuden eta Mitxelena ohartu zen hiztegia osatzeko lan-talde zabala beharrezkoa zela, lan mardulagoa egitea ezinbestekoa baitzen. Mitxelenaren  heriotzaren ondoren (1987an) Ibon Sarasolak hartu zuen ekimen honekin jarraitzeko ardura.

Gainera, web orrialdean agertzen diren dokumentu, zerrenda eta datu-baseak  Creative Commons Aitortu-EzKomertziala-PartekatuBerdin baimen baten mende daude. Creative Commons  sormenezko lanak partekatzeko traba legalak murriztea helburu duen erakundea da, 2001ean sortua.


Irudi horien bidez adierazten dena zera da: dokumentu hauekin egin daitekeena edo ezin egin daitekeena. Hauek dira esanahiak:

Aintzat hartzea: material hauek banatu, kopiatu eta erakus daitezke.

Ez-komertziala: material hauek banatu, kopiatu eta erakus daitezke erabilera komertziala ez den bitartean.

Share alike: guk sortutako materiala alda eta bana daiteke baina beti ere material originalaren lizentzia pean.

 

Corpusa

Hiztegiaren corpusa osatzeko 1970eko hamarkada arterainoko 310 obra oso aukeratu zituzten. Hortik, 5.800.000 hitz atera zituzten. Idazki horietatik kanpo dagoen lexikoa ez da Orotarikoan azaltzen.

Erabilitako hizkuntzak

Esan bezala, euskarazko hiztegi bat da; hitz-sarrerak eta adibideak euskaraz azaltzen dira, baina azalpenak gaztelaniaz edo frantsesez ematen dira, eta kasu askotan bi hizkuntzetan. Hala ere, ezin dezakegu esan hiztegi hau guztiz elebiduna denik, euskal hitzen gaztelaniazko eta batzuetan frantsesezko ordainak ematen badira ere, ez baitira alderantziz ematen.

Hitz-sarreren egitura

Orotariko Euskal Hiztegiak 125.987 sarrera biltzen ditu eta honela egituratzen dira:

  1. Hitza.
  2. Hitzaren aldaerak eta aurreko hiztegigileek hitzari buruz esandakoa.
  3. Aldaera bakoitzaren euskalkiak.
  4. Aldaeraren idatzizko lehen erabileraren urtea (gehienetan).
  5. Hitzaren esanahia.
  6. Literatur tradizioko adibideren batzuk.

Adibide hauekin argiago ikusiko dugu OEHaren hitz-sarreren egitura: Eguzki izena:

 

Adibidean ikus dezakegunez, lehenengo eta behin hitz hau zein euskalkitan erabiltzen den azaltzen da: bizkaiera (V), gipuzkera (G), goi-nafarrera (AN), lapurtera (L), Donamartiriko behe-nafarrera (BN-arb) eta erronkariera (R). Ondoren hitz hau zein autorek erabili duten azaltzen da: LANDUCHIUS (Lcc), ECHAVE (Ech), MICOLETA (Mic), DEEN (Deen), URTE (Urt), LARRAMENDI (Lar), AÑIBARRO (Añ), DUVOISIN (Dv) eta HARRIET (H). Autoreen ostean eguzki hitzaren aldaerak agertzen dira, besteak beste: egoski, egozki, eguski, eguzku, euski, euzki, iduzki, iguski, iguzki, iluzki, iruzki, iuzki. Azkenik zenbait erreferentzia bibliografiko daude.

Azalpen hauen ondoren hitzaren esanahia azaltzen da eta hiztegi honetan, gorago esan dugun bezala, gaztelaniazko ordainaren bidez egiten da. OEHn eguzki izenak hiru esangura ditu. Hainbat adibide ematen dira  (hauetako batzuk frantsesez daude) eta zein liburutan agertzen diren ere aipatuta dago.

Orotariko Euskal Hiztegiak azpi-sarrerak (bai eguzki hitzarekin konposatuak bai eratorriak) ere eskaintzen ditu eta  kasu honetan anitzak dira. Hitz-sarrera nagusiaren azpian agertzen dira zerrenda batean eta hauetariko batean klikatuz hitz horren sarrerara joan gaitezke. Esaterako, eguzki-lili, eguzki-ospel, eguzki-sortze; eguzkialdi, eguzkipeko, eguzkiratu, eta abar.

Lotsati izenondoa:

 

Adibidean ikus dezakegunez, lehenengo eta behin izenondo hau zein euskalkitan erabiltzen den azaltzen da: bizkaiera (V) eta gipuzkera (G). Gero, zein autoreek erabili duten: LARRAMENDI (Lar) eta AÑIBARRO (Añ). Ondoren, berriro agertzen dira lehenago aipatutako euskalkiak; eta honen ostean, autoreak agertzen dira berriz: IZTUETA (Izt), MOGUEL (Mg) eta DUVOISIN (Dv). Autoreen aipamena egin ostean, berriro aipatzen dira aurreko bi euskalkiak (V, G); hots; bizkaiera eta gipuzkera. Amaitzeko, azken autore bat aipatzen da: HARRIET(H).

Autoreen ostean lotsati izenondoaren aldaera bakarra agertzen da: Lotzati. Aldaera hau zein euskalkitan agertu den azaltzen da jarraian: Bergara eta Salinas-eko aldaeretan (V-gip). Honen ostean, aldaera hau erabili duten autoreak aipatzen dira: AZKUE (A), IZAGUIRRE (Iz), ETXEBARRIA (Etxba) eta ELEXPURU (Elexp).

Azalpen hauen ondoren hitzaren esanahia azaltzen da . Aztergai dugun hiztegi honetan lotsati izenondoak hiru esangura ditu. Hainbat adibide ematen dira adiera bakoitzean, eta zein liburutan agertzen diren aipatzen da ere.

Orotariko Euskal Hiztegiak izenondo honekiko lotura duen azpi-sarrera bakarra eskaintzen digu: lotsatiro.

Ikusi aditza:

 

Lehenengo eta behin ikusi forma orokorra (gral) zein autorek erabili duten azaltzen da: VOLTOIRE (Volt), POUVREAU (SP), LARRAMENDI (Lar), AÑIBARRO (Añ), DUVOISIN (Dv), HARRIET (H), DEEN (Deen), URTE (Urt), HARRIET, Martin (Ht) eta ARCHU (Arch). Ondoren, ikusi aditzaren aldaerak agertzen dira eta honekin batera, zein euskalkitan erabiltzen diren eta zein autorek erabili dituzten: ekusi Orozkoko bizkaiera (V-oroz), gipuzkera (G), Gipuzkoako, Larrauneko eta Arakilgo goi-nafarrera (AN-gip-larr-araq); ekosi Orozkoko bizkaiera (V-oroz); kusi Ulzamako, Erroko eta Gulinako goi-nafarrera (AN-ulz-erro-gulina), baztanera (B), Cizeko eta Baigorriko baztanera (BN-ciz-baig) eta ukusi Gernikako eta Bermeoko bizkaiera (V-ger) eta Burunda eta Etxarri-Aranazko gipuzkera aldaera (G-nav). Azkenik, beste bi adibideetan bezala, zenbait erreferentzia bibliografiko daude.

Azalpen hauen ondoren hitzaren esanahia da agertzen dena. Lehenengo eta behin, tradizio literarioa (tr) azaltzen da eta jarrian Ikusi hitzak dituen sarrerak: lau sarrera ditu aditz moduan, eta beste lau izentzat hartzen badugu.

Azkeneko adibide honetan ere azpi-sarrerak azaltzen zaizkigu. Hala nola, ikusiarena egin, ikusi arte, ikustera utzi, ikusiezin, ikusmin, ikusizale, ikusi-makusi, eta abar.

Laburdurak bi ataletan banatzen dira: lehenengoan, orokorrak ditugu. Adibidez:

 

Ikus daitekeenez, mota guztietako laburdurak biltzen dira atal honetan. Alde batetik, hitz-kategoriei dagozkienak dauzkagu, hala nola adj (izenondoa), sust (sustantiboa), vb (aditza) eta abar. Beste alde batetik, hizkuntza desberdinen laburdurak dauzkagu, esaterako: esp (espainiera), fr (frantsesa), cat (katalana), gal (galesa), vasc (euskara), irl (irlandesa) port (portugesa), eta abar. Gainera, morfosintaxiarekin zerikusia duten zenbait hitzen laburdurak ere badaude: art (artikuloa), decl (deklinabidea), erg (ergatiboa), gen (genitiboa), conj (konjunzioa), intrans (intrantsitiboa), eta abar. Azkenik, bestelako laburdura batzuk ere azaltzen dira atal honetan, besteak beste, ant (antzinakoa), arc (arkaikoa), euf (eufemismoa),  gral (orokorra), litm (literalki), princ (hasiera), tit (izenburua), eta abar.

Bigarrenean, euskalki, azpieuskalki eta aldaerak agertzen dira. Esaterako:

Multzo desberdinak egin daitezke bigarren atal honetan ere: alde batetik, euskalkiak azaltzen dira: V (bizkaiera), G (gipuzkera), AN (goi-nafarrera), L (lapurtera), B (baztanera), BN (behe-nafarrera), S (zuberera) eta R (erronakariera). Bestetik, euskalki bakoitzaren azpieuskalki eta aldaerak ere agertzen dira. Bizkaieraren kasuan: V-ger (Gernika eta Bermeo aldeko aldaera), V-gip (Bergara aldekoa), V-al (Araba aldekoa), eta abar. Gipuzkeraren kasuan: G-azp (Azpeitia aldeko aldaera), G-bet (Beterrikoa), G-nav (Nafarroa aldekoa), eta abar. Goi-nafarrerari dagokionez: AN-gip (Gipuzkoa aldeko aldaera), AN-larr (Larraunekoa), AN-ulz (Ultzamakoa), eta abar. Lapurteraren kasuan: L-côte (Donibane Lohizuneko aldaera), L-sar (Sarakoa), L-ain (Ainhoakoa), eta abar. Behe-nafarrerari dagokionez: BN-or (ekialdeko aldaera), BN-baig (Baigorrikoa), BN-lab (Lapurdikoa), eta abar. Zubereraren kasuan bi azpieuskalki azaltzen dira: S-no (ipar-ekialdekoa) eta S-bas (Basaburukoa). Azkenik, erronkarierari dagokionez: R-is (Isabako aldaera), R-uzt (Uztarrozekoa), R-urz (Urzainkikoa), eta abar. Baztaneraren kasuan ez da azpieuskalki edo aldaerarik azaltzen.

 

Bibliografia

Hauek dira Interneten Orotariko Euskal Hiztegiari buruz idatzitako zenbait artikulu eta lan:

 

Egileak: Irati Garaioa, Idoia Ibarluzea eta Amaia Navarro

Aurrerapen teknologikoak berarekin iraultza ikaragarria ekarri du liburutegien lanean, eta beraz, liburutegi elektronikoak, digitalak eta birtualak garatu dira.

Liburutegi elektronikoak automatizazio sistemak ditu eta hauek babesten dituen materialen administrazio bizkorra eta zuzena edukitzea ahalbidetuko du. Telekomunikazio sistemak ere baditu, bere informaziora sartzera utziko dio bertako edo urruneko moduan, formatu elektronikoan. Fisikoki eraikin batean dauden bildumen katalogoak eta zerrendak ematen ditu. Adibidez, Deustuko Unibertsitateko liburutegia liburutegia elektronikoa da.

Liburutegi digitalak eduki digitalak gordetzen dituen tokia da, (textuak, aldizkariak, egunkariak, bideoak, eta abar) bertan informazioa formato elektroniko desberdinetan gordeta dago. Originala, paperean idatzitakoa, existitzekotan lehentasuna galdu egiten du. Orokorrean liburutegi txikiak eta espezializatuak dira, bilduma mugatuak dituztenak. Liburute digitalaren kontzeptuan informatikaren integrazioa bertan dagoela gogoan hartu beharrekoa da; baita komunikazioak ere, funtsezko adierazlea Internet dena. Liburutegi digital batetaz hitz egiteko beharrezkoa da modu batean informazio iturriak libre egotea eta beraien sarrera nonahikoa izatea, hau da, berdin dio nor arduratu den prozesamentuaz eta biltegiratzeaz. Liburutegi digitalaren adibidea Biblioteca Digital Mundial delakoa izan daiteke.

Liburutegi birtuala interfaze bat erakusteko errealitate birtualaren erabilera egiten duena da eta erabiltzailea liburutegi tradizional batean egongo balitz bezalako giroa sortzen du. Hala ere, liburuak ez dira paperean egoten, soporteetan, textu digitalizatuetan eta programa batzuetan baizik. Teknologia multimediarik onena erabiltzen du eta erabiltzailea sistema desberdinen barrena gidatu dezake bildumak leku desberdinetan aurkitzeko, kontaketa eta telekomunikazio sistemen bidez konektatuak daudenak.  Eduki digitalez gain zerbitzu birtualak ditu, kontsultak, maileguak eta deskargak. Liburutegi virtualaren adibide gisa Biblioteca virtual Miguel de Cervantes dugu.

ITURRIAK:

Delicious

Delicious (antzina del.icio.us) gaztelaniaz delicioso esan nahi du. Web-ean den markatzaile sozialen kudeaketa zerbitzu bat da. Markatzaileak gehitzea baimentzen du, lehen nabigatzaileetan gordetzen zirenak eta folcsonomia (tags) etiketen sistema batekin kategorizatu. Web tokiak almazenatzen ditu eta baita del.icio.us-eko beste erabiltzaile batzuekin partekatu ditzake. Era berean, zeintzuk duten lotura zehatz bat beraien markatzaileetan gorderik.

Bere arrakastaren sekretu bat interfazaren erraztasuna izan daiteke. Interfaz-a bi ordenagailu edo edozein motatako makinen arteko lotura da, maila desberdinen arteak emandako komunikazioa. Gainera, RSSren bitartez web sindikazio malgua dauka eta API bat dauka, del.icio.us-rekin lan egiten duten aplikazio batzuk egitean baimentzen duena.

Deliciousen aitzindaria Muxway izan zen. 2003ko irailean Schachter-ek Deliciousen lehenengo bertsioa atera zuen. Zerbitzua  urte horretatik aurrera, hain zuzen ere, dabil martxan, Joshua Schachterrengandik mantendua da batez ere, eta Memepool-en euskarriarekin. 2005eko abenduaren 9an Yahoo!k hartu zuen. Enpresak bananduta mantentzea erabakitzen du eta horregatik yahoo markatzaileak ateratzen ditu, API erabiliz delicious-etik loturak inportatzeko.

ITURRIAK:

Los jeroglíficos fueron un sistema de escritura inventado y utilizado por los antiguos egipcios para comunicarse desde la época predinástica hasta el siglo IV. El sistema de escritura egipcio comprende tres tipos básicos: jeroglífica, hierática y demótica, esta última corresponde al periodo tardío de Egipto. Se caracteriza por el uso de signos, cuyo significado se conoce gracias al descifrado de los textos contenidos en la Piedra de Rosetta.

La palabra jeroglífico proviene de las raíces griegas (hierós, “sagrado”) y (glýfein, “grabar”). La expresión egipcia significa palabras divinas. En la escritura egipcia existen los ideogramas, símbolos que representan ideas y no expresiones ortográficas. Su función no es otra que la de transmitir una idea relacionada con el contexto en el que aparezcan estos símbolos.

Los jeroglíficos “miran” hacia la izquierda, por lo tanto su escritura es horizontal, se lee de izquierda a derecha y de arriba hacia abajo; su escritura en vertical se lee de arriba hacia abajo y de izquerda a derecha. Los jeroglíficos eran todos, o casi todos figurativos: representaban elementos reales o imaginarios, a veces estilizados y simplificados, pero perfectamente reconocibles la mayor parte de las veces.

Los primeros jeroglíficos se encontraron en el 3500 a.c, mientras que en la época arcaica egipcia existían unos 700 jeroglíficos, no había menos de 5000 en la etapa más tardía (periodo greco-romano). Esta escritura se utilizó durante más de 3000 años. Champollion fue quien descifró por primera vez los jeroglíficos egipcios y es considerado como padre de la egiptología. A partir de 1821, pudo estudiar con detenimiento las inscripciones en jeroglífico, demótico y griego de la piedra de Rosetta.

 

 

 

FUENTES:

reCAPTCHA

CAPTCHA es el acrónimo de Completely Automated Puplic Turing test to tell Compurtes and Humans Apart, es decir, Prueba de Turing pública y automática para diferencia máquinas y humanos.  Se trata de una prueba desafío-respuesta utilizada en computación para determinar cúando el usuario es o no humano. Al día se resuelven 200 millones de CAPTCHA y la mitad corresponden con el servicio reCAPTCHA. Lo utilizan los principales servicios de Internet, medios de comunicación o blogs entre otros muchos.

reCAPTCHA se utiliza para digitalizar automáticamente infinidad de documentos y libros. El proceso es el siguiente: se “escanean” los documentos y a las imágenes se les aplica un sofware  de reconocimiento óptico de caracteres (OCR), de este modo identifican las palabras incluidas y las pasan a un formato textual. Pero el sofware de OCR no es del todo seguro y por ello cada imagen digitalizada se somete a veredicto de dos algoritmos diferentes.

Cuando entramos en una página protegida con reCAPTCHA nos aparecen dos palabras deformadas y debemos escribirlas en el cuadro de debajo. Una de las dos palabras es conocida por el sistema y la otra, en cambio, no. La conocida debemos introducirla correctamente ya que se usa como palabra de control. La otra palabra es la que utiliza para averiguar qué pone en la imagen original. Este sistema es muy efectivo a la hora de digitalizar documentos.

FUENTE:

Open Access

Open Access berehalako sarbidea da, erregistro eskaerarik, harpidetzarik edo ordainketarik gabea, hau da, murrizkerarik gabea. Hezkuntzako, akademiko, zientifikoedo beste edozein motako material digitaletan da sarbidea. Open Accessek hauxe esan nahi du: edozein erabiltzailek artikulu zientifikoen testu osoak irakurri, jaitsi, copiatu, inprimitu, bilatu edo lotu ditzakeela eta era berean, bere eduki digitalaren data mining egiteko erabili. Literatura zientifikora sartzeko edo iristeko dohainiko era da. Beste eduki digital batzuetara ere zabaltzen da, hauen egileek erabiltzaileentzat sarbide librea egin nahi dutenek. Open Acces-a Interneten etorreragatik da lehen mailako beharra.

Joera honek traba ekonomikoak, legalak eta teknologikoak deuseztatzera sustatzen du, eta trukean, onura bezala, dokumentuen sarbidea eta autoreen ikuspena handitzea lortu nahi du. Libre dauden dokumentuak kontsultatuak izateko eta zitatuak izateko aukera gehiago dituzte. Ideia desberdinak proposatu egin dira Open Accessen material zientifikorako, desberdintasun txiki batzuekin, informazio zientifikoaren erabilgarritasunaren sarbideari Interneten eutsi egiten diote, gizateria guztiarentzako, murrizketarik gabe. Dokumentu desberdin bateragarritasuna Interneten erabileraren difusio sistematik eta kosturik gabeko erabilgarritasunetik abiatzen da.

OA bi modutan eman daiteke:

  • Green OA: autoreen argitaletxe industriatik eman da eta ondoren beraien kopiak artxibatu egiten dituzte biltegi instituzinalean edo beste OA gune batean.
  • Gold OA: autoreen argitaletxe industriatik eman da sarbide irekian eta OP berehalakoa gertatzen dan bere artikulu guztietan editorearen web gunean.

World Wide Weberako sarbide publikoa 1990. amaieran eta 2000. urteen hasieran zabaldu zen. Distribuzio ekonomikoaren teknologiak OP mugimendua erregaiz bete du. Open Access emateko edo hornitzeko moduak, ekonomiaren eta fidagarritasunaren  eztabaidak ekarri ditu ikertzaileen, akademikoen, liburuzainen, unibertsitateko administratzaileen eta editore komertzialen artean.

ITURRIAK:

 

Liburuaren historia berrikuntza teknologiko batzuei zor zaie; mendeen igarotzearekin batera, testuen mantentze kalitatea hobetzea, informaziora iristea eta erabilpena eta produkzioaren gastua hobetzea baimendu dute. Artikulu honetan, euskarri desberdinei buruz, beraien erabilpenari buruz eta material hauetal baliatu ziren herrialdeez hitz egingo dugu.

Idazketa euskarrik zaharrena harria izan zen, Babilonian eta beste herri askotan erabilera arrunta izan zuena. Hala ere, egurra izango zen liburuen benetako euskarria; biblos eta liber hitzak, lehenengo definizio moduan, zuhaitz baten kanpoko azala esan nahi dutelako. Argizari oholtxoak greziarrek eta erromatarrek erabili zituzten Erdi Aroa arte. Beste materia batzuk baino iraupen handiagoa zuen. Egurra ezpel, izei edo astigar zuhaitzetakoa zen. Errektangeluarrak eta tolesgarriak ziren eta liburu forma zuten. Argizari ilunez estaltzen ziren eta bertan idatzi egiten zen.

Erdi Aroan erabili izan zen liburuaren aurrekari moduan papiroa dugu. Papiroa Nilo ibaian biltzen den landare batetik hartutako orri edo xafla bat da. Mamitik tirak ateratzen dira, behin hartuta lehenengo busti eta gero lehortu egin behar zirenak. Forma eta lodiera desberdinetakoak ziren baina guztiak kiribildu egiten ziren. Papiroa Egipton, Grezian, Erroman eta beste hainbeste herrialdeetan erabili izan zen. Papirozko zatirik zaharrena Hemaka hilobian aurkitu zen, Saqqara nekropolian. Hala ere, bertan idatzitako hieroglifikoek ez duten iraun. Europako bibliotekarik handienek papirozko eskuizkribuak dituzte.

Pergaminoak denborarekin papiroa ordezkatu zuen. Bere ekoizpena k. a. III. mendean hasi zen. Animalien (behia, astoa, arkumea eta abar) azaletik ateratzen zenez denbora luzez mantendu zitekeen egoera hobeagoan. Gogorragoa zenez testuaren ezabaketa egin ahal zen. Oso euskarri garestia zen erabilitako materialengatik eta prestaketa denboragatik. Papera artxiboetan kontserbatutako dokumentu guztietatik euskarririk orokorrena da. Txinan du jatorria (k. a. 2000. urtean), arabiarrek Europatik hedatu zuten VII. mendean, Espainian bereziki. Paperak pergaminoa ordezkatu zuen merkeagoa zelako era erabilera errazagoa zuelako.

Azkenik, XV. mendean, 1440. urte inguruan Johannes Gutenberg-ek inprenta asmatu zuen, nahiz eta lehendik ere Txinan eta Korean erabilia izan. Metodo hau azkarragoa eta fidagarriagoa zen testuak transkribatzeko eta kopiatzeko. Izugarrizko arrakasta izan zuen eta Europa osoan zehar zabaldu zen.

ITURRIAK:

Entradas antiguas »

Seguir

Get every new post delivered to your Inbox.