Fuentes web
Entradas
Comentarios

Markaketa lengoaia

Markaketa lengoaiak testuen egitura, edo formatua adierazteko markak erabiltzen dituzten lengoaiak dira eta programa informatikoek modu egokian azaltzea eta agertzea ahalbidetzen dute.

Hiru markaketa lengoaia mota bereizten dira, nahiz eta beraien erabileran, klase ezberdinetakoak konbina daitezkeen dokumentu batean.

Aurkezpen markaketa:

Formatua eta testua adierazten dituena da. Bere irakurketarako dokumentuen aurkezpenak maketatzeko baliagarria da, baina informazioaren prozedura automatikoareko gutxiegia da. Aurkezpen markaketa prestatzeko errazagoa da, informazio txikietarako batez ere. Hala ere, modifikatzea edo mantentzea zaila da eta horren ondorioz bere erabilera proiektu handietara mugatu egin da.

Prozedura markaketa:

Testuaren aurkezpenera zuzenduta dago. Hala ere, testua editatzen duten erabiltzaileentzat ere ikusgai da. Dokumentua aurkezten duen programak kodigoa azaltzen den orden berean interpretatu behar du.

Deskripzio markaketa:

Testuen atalak deskribatzeko etiketak erabiltzen dituzte, baina nola irudikatu behar diren zehaztu gabe. SGML eta XML dira deskripzio markaketa sortarazteko lengoaiak. Deskripzio markaketak ere, berriro formateatu behar den testuaren  zeregina sinplifikatzen du.

ITURRIAK:

Estilo orriak

Estilo orriak (CSS deituak). CSS lengoaia HTML edo XML formatuan dauden aurkezpenak definitzeko erabiltzen da. W3C (World Wide Web Consortium) estilo orrien zehazketa formulatzearen arduraduna da eta estadarrak izango dira nabigatzaile eta erabiltzaileentzat.

CSS garapenaren atzetik aurkitzen den ideia hauxe da: dokumentu baten egitura bere aurkezpenetik banatzea da.

Hiru estilo orri mota daude:

  1. Kanpoko orria: estilo orri bat da, Web orriaren HTML kodigoa gordetzen den artxibo desberdin batean bildurik dagoena.
  2. Barneko orria: HTML dokumentu baten barruan itsatita dagoen estilo orri bat da. Modu honetan estilo orriaren informazioa banatzen da HTML kodigotik.
  3. Estiloa linean: estilo orrien lengoia zuzenean ezartzeko metodo bat da HTML etiketan batean.

Estilo orriak erabiltzearen zenbait abantaila:

  1. Web gune oso baten aurkezpenaren kontrola, zentralizatuta dagoena. Era honetan bizkortu egiten da bere aktualizazioa.
  2. Nabigatzaileek erabiltzaileei beraien estilo orria zehazten uzten diete, ondoren web gune batean aplikatuko dena.
  3. Orrialde batek estilo orri desberdinak izan ditzake; orria erakusten duen dispositiboaren arabaera edo erabiltzaileak aukeratutakoaren arabera.
  4. HTML dokumentua berez, ulertzeko errazagoa da eta bere tamaina murriztea lortzen da.

ITURRIAK:

Anotazioa

Liburu, dokumentu, software kodigoa edo beste informazio baten laburpena da. Normalean, dokumentu  batzuetan erabiltzen da non beste irakurle batek dokumentu horren kalitateari buruz notak idazten dituen. Anotazioak, software programa baten datuak ematen ditu. Ez dute efektu zuzenik anotatzen duten kodigoaren funtzionamenduan.  Anotazioak erabilera desberdinak ditu: informazio bilketarako, akatsak aurkitzeko edo oharrak ezabatzeko; anotazioaren informazioa prozesatu ditzaketen software tresnak eta ejekuzio denbora.

Markaketa Lengoaiak

Markaketa lengoia testuen itxura, egitura edota formatua adierazteko markak erabiltzen dituzten lengoaia informatikoak dira. Testuaren jatorrizko edukiari funtzio jakin batzuk duten testu-etiketak gehituz, programa informatikoek modu egokian interpretatu eta agertzea ahalbidetzen dute. Markaketa lengoiaren adibide bat HyperText Markup Language (HTML) dugu, World Wide Web-en formatu dokumentu bat.

Semantikaren aurkezpena:

Informatikan, semantikaren aurkezpenak  zehaztu egiten du lengoaia formal baten atal konkretu bat era printzipal batean adierazita dagoela, gizakien zentzuetarako eskuraerraza dena. Markaketa lengoia askok HTML, CSS, DSSSL edo XSL-FO esate baterako semantika aurkezpenak dituzte, baina era bereab, XML, XLink and XPath ez dituzte.

Estilo orrien funtzioak:

CCS estilo orriak HTML edo XML lengoaian egituratutako dokumentu baten aurkezpena definitzeko balio duen lengoaia da. Bere helburu nagusia dokumentu baten edukia eta aurkezpena bereiztea da. Estilo orri hauek hainbat abantaila dituzte adibidez: webgune oso baten aurkezpena bateratzeko aukera, eguneraketak egiteko denbora aurreztea ahalbidetzen duelarik edota letra-tamaina handitzeko edo kolore ikusgarriagoak erabiltzeko aukera.

ITURRIAK:

Liburutegi Digitalak

Liburutegi digitalak eduki digitalak gordetzen dituen tokia da, bertan informazioa formato elektroniko desberdinetan gordeta dago. Originala, paperean idatzitakoa, existitzekotan lehentasuna galdu egiten du. Orokorrean liburutegi txikiak eta espezializatuak dira, bilduma mugatuak dituztenak.

Euskomedia Eusko irakaskuntzaren fundazioa da, 2002ko otsailaren 18an sortua. Bere helburu nagusia eduki kultural eta zientifikoak zabaltzea da baliabide telematikoen bitartez. Gizarte eta euskal kulturan interesatuak dauden pertsonentzat erabilgarri izateko ere sortu zen.

Hedatuz euskal zientzia eta kulturaren liburutegi digitala dugu eta Euskomedia fundazioak sortu zuen. Artikulu, monografia eta lan espezializatuak (eusko irakaskuntzan editatuak 1918. urtetik aurrera) eta RIEV-en sortutakoak 1907tik aurrera.

5ooo artikulu baino gehiago dira Hedatuzen daudenak eta hainbat gairi buruzkoak gainera. Historiarekin, antropologiarekin, artearekin, zientzia politikekin, soziologiarekin eta linguistikarekin lotuak direnak nabarmentzen dira. Erabiltzaileek beraien interesa sustatzen duten edukietan harpidetu ahal izango dira eduki sindikazio formatoen bidez: ATOM eta RSS.

Era berean, bere kontsultak formatu hauetara esportatu ahal izango ditu: ASCII Citation, BibTeX, Dublin Core, EP3 XML, EndNote, METS, MODS, OpenURL ContextObject, Refer eta Reference Manager.

ITURRIAK:

Ebook

Liburu elektronikoa (e-book), liburu baten bertsio elektronikoa edo digitala da. Izen bera du liburu hauek irakurtzeko erabiltzen den gailua.

Aparatu asko erabil daitezke liburu elektroniko bat bezala, PC, PCA, portatila eta orokorrean pantaila eta memoria bat duten edozein gailu. Hala ere, XXI. mendearen lehenengo hamarkadaren amaieran, dispositibo batzuk agertu ziren, haien funtzioa liburu elektroniko bezala funtzionatzea zena. Aparatu hauek karakterizatu egiten dira diseinu betangatik, non paperezko liburu tradizionalaren itzulkortasuna imitatzen duen. Modu honetan, mugikortasuna eta autonomia bilatu zen; dispositibo mugikorrak kontsumo baxuko energia dutenak, irakurketa luzeak egiteko errekargatu behar gabe. Tamaina oneko pantailak, tradiziozko dokumentuak aurkezteko eta kontraste maila handia.

Beraz, ebook-arekin asko aurreratu dugu baina honek ez du esan nahi betiko liburuak desagertuko direnik.

ITURRIAK:

Tim Berners-Lee

Tim Berners-Lee londresen jaio zen 1995ko ekainaren 8an. fisika ikasi zuen eta Oxford Unibertsitatean lizentziatu zen. Web-aren aitatzat hartzen dute Berners-Lee.

Tim eta honen taldekideek HTML lengoaia, HTTP protokoloa eta URL web-ean objektuen aurkitze sistema sortu zituzten.

Berners-Lee CERNen egin zuen lan eta hipertestuan oinarritutako proiektu bat egin zuen ikerlarien artean, informazioa trukatu eta gaurkotzeko. ENQUIRE izeneko programa bat ere sortu zuen, argitara eraman ez zuena.

CERN Europako Internet nodorik handiena zen 1989.urtean eta Berners-Leek Internet eta hipertestua (HTTP ETA HTML) elkartzeko aukera bikaina ikusi zuen; ondoren elkartze horretatik World Wide Web sortuko zena. Enquire sisteman erabilitako antzerako ideiak erabili zituen World Wide Web-a sortzeko.

Tim Berners-Leek azaldu egiten du nolako hazkundean izan duen sareak azkenengo hamar urte hauetan. Hasiera batean, sarea Internetduen azpiegiturari esker zabaldu zen. Timek sarearen idea izan zuenean, 80. hamarkadan, inbestigazio unibertsitate eta institutuetako ordenagailuak haien artean konektaturik zeuden informazioa trukatzeko. Berners-Leek dioen moduan, sarea oso azkar hedatu zen eta edonork sortu dezake zerbitzari bat baimenik eskatu gabe.

Azkenik, Berners-Leek hainbat sari irabazi ditu urte hauetan zehar. 

 

ITURRIAK:

Itzulpengintza automatikoa iturburu-hizkuntzako testu batetik abiatuta helburu-hizkuntzako testu baliokide bat lortzea da, makina bat erabilita. Itzulpengintza automatikoa hizkuntza teknologiaren garapenean nabarmen lagundu duen diziplina da. Zeregin nagusia hori duten elkarte zientifikoak, aldizkari bereziak, unibertsitate departamentuak eta enpresak daude.

Hiru pausu jarraitu behar dira:

  1. Itzuli nahi duzun hizkuntza aukeratu behar da, jatorrizko hizkuntzatik hasita.
    Aukeratu hizkuntza eta itzuli.
  2. Zerrendako produkturen bat aukeratu eta textu bat idatzi edo kopiatu. Ondoren, “joan” klikeatu.
  3. Itzulpena prest dagoenean eskuineko aldean azalduko da.

Erabileraren aldetik bi atal nagusi bereizten dira, asimilazioa (assimilation) eta zabalkundea (dissemination).

  • Asimilazioa: sistema azkarrak dira baina itzulpenak kalitate txarrekoak. Testuaren ideia nagusiak harrapatzeko balio dute.
  • Zabalkundea: emaitzak kalitate onekoak dira, baina ez argitaratzeko modukoak. Askotan eremu zehatz batera mugatutako sistemak dira, horrela sarrerako hizkuntzaren nolakotasuna mugatzen baita eta anbiguotasunak neurri batean saihesten baitira.

ITURRIAK:

Hizkuntza naturala interakzio modalitate bat da, non ordenagailu baten eta giza erabiltzaile baten arteko elkarrizketan erabilzen dena. Indar baliabide garrantzitsu bat existitzen da makina bati aurre egiteko eta haren ekintzak zuzendu, giza interakziorako bizitzan erabiltzen dugun hizkuntza bere erabiliz.

Hizkuntza naturalaren inferfazeak ulerkotasunerako diseinaturik izan da, testu irakurria nahiz ahozkoa izan. Ikuspuntu bereziek  komando lerroak edo database kontsultak ordezkatzen saiatu dira.

Arazorik arruntena anbiguetatea da. Egia esan, hiztunek gehienetan nahiago dute hizkuntzen iraupena eta  argitasuna aurretik ezin jakin daitekeen hinkuntza naturalaren komando bateko (interpretazio asko izan ditzakeena ) erantzunak baino. 

Beste funtsezko arazoa hitzkuntza naturalaren erabateko ulermena lortzeko hizkuntzaren ez ulertzearekin du zerikusia. Askotan gizaki batek bezala arrazoitzeko gauza izatea da. Baita gizaki baten ezagutza betea ere. Eta arazo hau gaurko teknologiaren aplikaziotik harago doan zailtasun maila batean kokatzen da.

ITURRIAK:

Lexiko- funtzional Gramatika, Michael Halliday liguista ingeles honen bitartez garatu zen gramatika eredua da. Orientazio funtzional bat da; hizkuntza naturalaren forma, azkenengo ekinaldian emanda dago komunikazio tresna izateagatik.

Teoria honen helburua aukera baliagarrien sistema berreraikitzea da, hizkuntza hori hitz egiten duten pertsonen enuntziatu emitituengatik aterata.Sisteme ahozko eta idatziko testuen bidez eguneratzen da. Texto bakoitzak koherentea izan beharko luke aurkezten den testuinguru komunikatiboarekin. Honek erregistro izen hartzen du eta hiru aspektu bereizten dira:

  1. Eremua: testua sortzen den testuinguru sozialarengatik zehaztua.
  2. Eredua: formalitate komunikatiboaren elkartruke eta beraren partaideek duten harremanengatik zehaztua.
  3. Era: transmisio informatiborako eskatutako baliabideengatik zehaztua. 

Testuen produkzioa eremu, eredu eta era aspektuetara baldintzaturik dago eta hizkuntzaren funtzio primarioetara lotzeko erabiltzen duten forma.

  1. Idealizazio metafuntzioa: hiztunek haien mundu errealeko esperientzia interpretatu eta antolatzen dute; erlazio logikoak ezartzen dituzte eta haien munduko ikuskera eratzen dute. 
  2. Interpertsonal metafuntzioa: harreman sozialak, komunikazio eginkizunak eta talde sozialak ezartzen eta zaintzen dituzte.
  3. Hitzez hitzeko metafuntzioa: hiztunek testuak era egokituan sortaraztea onartzen du.

ITURRIAK:  

Question Answering (QA) informazio berreskurapen mota bat da. Hainbeste dokumentuekin, (World Wide Web esate baterako), sistema gai izan beharko litzateke hizkuntza naturalari buruzko galderen erantzunak berreskuratzeko. QA sistema, informazio berreskurapen sistemetan korapilatsuena da.

Question Answering sistema batek galdera mota asko ezagutzen ahalegintzen da. Ekintza, zerrendak, definizioak, noiz, non, zergatik, eta abar biltzen dituena.

QA lehenengo sistemak 1960. urtean sortu ziren eta hizkuntza natural sistemen interfaze ziren. Gaur egun, datu-base ezagutza dokumentuak erabiltzen dituzte eta hizkuntza natural prozesamendurako diren teknika desberdinak erabiltzen dituzte.

Sistema hau bilatzaile baten menpe dago eta erantzunak izango dituzten dokumentuak aurkitzen arduratuko da. Dokumentu askoren bildumak errendimendu hobeagoa ekarriko duela dirudi. Informazioa leku, testuinguru eta dokumentu desberdinetan egon daitekeela esan nahi du. Honek bi onura ditu: hizkuntza natural prozesamenduaren sistemen kargak murrizten dira eta gehien azaltzen diren erantzunak izango dira zuzenenak.

ITURRIAK:

Entradas antiguas »