Atzo genioen moduan

Itziar Aduriz Agirre

Praktikoaz gain, bere hitza betetzen duen emakumea ere banaiz.

Gauzak horrela, aurrekoan «jarraituko du» batekin bukatu nuenez nire aportazioa, euliei eta kanoiei buruz hitz egin nuen hura, hemen duzue bada, haren jarraipena-edo.

Euskaldunok komunitate txikia osatzen dugu. Are txikiagoa da hizkuntza kontuak lanabes bihurtu ditugunon azpi-komunitatea. Errezeloa dut, hala ere, batak bestearen berri eskasa izaten dugula. Normala dela esango nuke. Azkenean, bakoitzak berearekin nahikoa izaten baitu eta gainera, bazter guztietan sumatzen den egoera da denok oso lanpetuta gaudela, lanpetuegiak albo kontuetan hasteko.

Utzidazue puntu honetan parentesi txiki bat irekitzen. Izan ere, ideia hori bera aurkitzen ahal da UEUk bere uda ikastaroen barruan antolatu duen Hizkuntzalari Euskaldunen I. Topaketak: egungo ikerlerroak izeneko jardunaldian.

Parentesia itxita, eta biltzar horrek bere fruitua eman bitartean, aurreko artikuluaren jarraipenarekin hasiko naiz, komunitate hau osatzen dugunok hobekixeago elkar ezagutzeko balioko duelakoan. Baldinbaitere!

Gain-gainetik eta zeharka pasa nituen aurrekoan IXA taldearen baitan euskararen azterketak alor konputazionalari aplikatuta izan dituen emaitzak. Ezagunena den XUXEN zuzentzaile ortografikoa aipatu nuen eta corpusen gaiarekin lotuta zegoen lematizatzailea. Orduan pentsatu nuen puntu hori zabaldu eta, interesgarria izan zitekeela alor ezezagun honen berri ematea eta azaltzea zein diren gure aztergaiak hizkuntzari dagokionez eta euskararen lantze horretan dugun ikuspuntua. Horrekin batera eskura dauden beste tresna batzuk ezagutarazi nahiko nituzke, egun edo bihar erabiltzeko ongi etor dakizkigukeenak.

Azkarrena eta ikuserrazena IXA taldearen web orrian dauden produktuetara jotzea da.

Datuen prozesatzaileek hizkuntza baliabideen gainean lan egiten dute eta batzuetan publiko zabalari zuzendutako aplikazio egokiak sortzen dira.

Adibidez, eta modu sinple eta argi batean azaltzeko, Morfeus analizatzaile morfologikoak EDBL datu-basean dagoen informazio lexiko eta morfologikoa prozesatzen du eta bien artean XUXEN zuzentzaile ortografikoa elikatzen dute, publiko zabalari zuzendutako aplikazioa, alegia. Oinarri berekin, baina morfologikoki analizatu eta Eustagger desanbiguatzaile morfosintaktikoa aplikatu ondoren, lematizatzailea dugu. Hau ere aplikazioa dugu, baina zuzenean ez dauka XUXENek duen bezain erabilera zabala.

Horrekin bezala, beste hizkuntza mailetan ere lan egiten da, nahiz eta horren produktu izarrik ez egon.

Horrela, sintaxian ere bada analizatzailerik. Ixati da azaleko analizatzaile sintaktikoa eta Maltixa dependentzietan oinarritutako analizatzaile estatistikoa. Maila semantikoan sortu den adiera-desanbiguatzailea, WSD-IXA, sintaktikoekin batera, datu-base eta ontologietan dauden informazioa prozesatuz, besteak beste, itzulpen automatikoa egiten duten aplikazioen oinarri dira.

Itzulpen automatikoa, ai itzulpen automatikoa!!! Zenbat buruhauste ematen dizkigun! Kuriositate hutsa da, baina aplikazioen atalari erreparatuz gero ikusiko duzue gehienak itzulpen automatikoari buruzkoak direla. Hori dela eta,  eta kontu honen inguruan gauza asko daudelako esateko, hurrengo artikulua monografikoa izango da itzulpen automatikoaren gainean.

Hurrengoan pentsatzen hasi baino, honekin bukatu behar da, ordea. Eta bukatzeko, web orriko ikerlerroak atalari begi-kolpe bat ematea eskatuko nizueke, hor agertzen baita orain arte azaldu dudana argiago eta behar den bibliografia lan guztiekin apaindua.

Ibili pixka bat kuxkuxean eta hizkuntzarekin lotutako beharren bat-edo baldin duzue ez izan galdetzeko beldurrik.