19
Mai
2009

Ikaslearen idazkera ordenagailuak aztertuta

Azkenengo Hizpiden HUHEZIko Asier Irizarrek eta IXA taldeko Kepa Sarasolak idatzi zuten artikulua irakurtzen egon naiz: Puntuazio arteko hiru hitzeko segiden arterketa ikasleen testuetan eta alderaketa kazetaritza-testuekin.

Teknologiak hizkuntzaren irakaskuntzan eman dezakeenaz dihardugula LMSak, bipuntuzeroak eta halakoak izaten ditugu mintzagai azkenotan, baina bada beste arlo bat, teknikoagoa eta ez hain erakargarriagoa agian, hizkuntzaren analisi informatikoa. Kepak eta Asierrek hortik ere zer hartua dagoela ohartarazi gaituzte.

Konputagailuak testu idatziak aztertzen jarri dituzte hain zuzen ere. Testuon artean euskara ikasleek idatzitakoak eta Egunkariarenak, eta alderaketa egin dute haien artean. Ikasleen testuen artean argudio-testuak dira nagusi, Egunkariarenak berriz edozertariko kazetaritza testuak direla ulertu dut.

Idazkien corpus horretan puntuazio-zeinuen artean hitz bakarreko, biko eta hiruko segidak bilatu zituzten, arreta bereziki testu-antolatzaileetan eta lokailuetan jarrita,  eta emaitza deigarri batzuk atera dira:

  • Ikasleek gehiago erabili dituzte komak eta puntu eta komak Egunkariakoek baino.
  • Ikasleen testuetan "beraz" da puntuazio-zeinuen artean gehien erabilitako hitza, Egunkarian berriz aldiz, "berriz".
  • "Halaber" Egunkarian sarri erabili den arren ikasleen testuan ez da ia agertu. "Badirudi ikasleei ez zaiela hitz hori gustatzen" diote egileek.
  • Bi hitzeko kateetan "izan ere" da erabiliena oro har. Ikasleen artean "hau da" ia bestearen parean. Egunkarian "hala ere" izan da bigarrena
  • Hiru hitzekoetan "hain zuzen ere" eta "hori dela eta" nagusi guztietan.
  • Ere tartean dagoen kateetan, "izan ere" nagusi guztietan.
  • Ikasleen testuetan "beraz", "horrela" eta "adibidez" maizago agertzen dira kazetaritza testuetan baino.
  • Ikasleek oso gutxi erabiltzen dituzte "hain zuzen", "ildo horretan", "nolanahi ere", "esate baterako" eta "aldi berean". Aldiz, "dena den", "era berean", "batez ere", "horretaz gain", "hau da" eta "alde batetik" Egunkarian baino askoz sarriago ikasleen idazkietan.

Analisia interesgarria edo deigarria izateaz gainera (eta kasu honetan esango nuke proba edo erakustaldia izan dela batez ere), sentsazioa izan dut emaitzetan kuantifikatuta agertu diren horiek testu bat ikasle batek idatzia delako "intuizioa" ematen diguten elementuak eta kopuruak izaten direla. Hizkuntza uste dugun baino neurgarriagoa da seguruenik, eta honen garapenak baliabide eta tresna gehiago ekar ditzakeela esango nuke. Autoreek ere hala uste dute:

...badira hizkuntzaren kalitatea neurtzeko beste hainbat eta hainbat elementu semantiko, sintaktiko edo pragmatiko ere guk hemen aztertu ez ditugunak. Saiatu beharko genuke beste neurri horiek lantzeko tresna informatikoak sortzen.

Espero dezagun hizkuntzaren azterketa konputazional-edo horrek laster batean fruitu gehiago ematea eta sotware-a zein erabilpenerako ideiak eta metodoak guztiok eskura izatea.

Bide batez. Asierrek eta Kepak eurek prestatu dituzte tresnok programazio-lengoiaren ezagutzaz baliatuta. Denok ez gara horraino ailegatzen, baina han-hemenka badira horrelako emaitza zehatzak eskaini barik ere, testuak aztertu edo haiekin jolasteko aukeraren bat ematen diguten beste tresna batzuk:

  • Wordle-k bezala etiketa-hodeiak edo hitz-odeiak sortzen dituztenak. Badakizue, hitzak testuan agertzen diren maiztasunaren arabera handiago edo txikiagoak izango dira hodeian.
  • Testu prozesadore gehienetan aukera izaten duzue testuaren hitz eta karaktere kopuruak kontatzeko. Ez da asko izaten, badira hala ere gauza gehiago bilatzen duten programak: gehien agertzen diren hitzak eta euren sailkapena adibidez. Probatu Windows-erako izen bereko bi programa hauek adibidez: TextSTAT edoTextStat, edo testuaren estatiskikak online ematen dituen Textalyser.

Test mining (Testu "meatzaritza") edo test analytics deitzen diren disziplinekin lotutako software-a bilatzen baduzue, zer edo zer aurkituko duzue beharbada, eta irudimen apur batekin ideia interesgarriren bat irten daiteke.

Gauza gehiago ere izango dira baina gaur apur bat alfertuta nabil aplikazio edo tresna gehiago bilatzeko, hala ere, seguru zuetako baten batek ikusi duela zerbait interesgarria hortik. EHUren proiektu hau bezala, izenagatik baino ez bada ere.

Foroetako partehartzeak zenbatesten

ainhoaeusk (ez da egiaztatu)-(e)k 2009, Maiatza 19 - 12:13-(e)an bidalia.

Hizkuntza zenbakitan azaltzeak aplikazio interesgarriak ditu, nahiz eta beti "baina" askorekin hartu behar diren emaitzak.

Tesi aurreko ikerketa proiektuan antzeko zerbaitetan aritu nintzen ikasleen foroetako partehartzeak neurtzen. Diskurtso-markatzaile batzuk definitzen baditugu, azter dezakegu ikasleek noraino sakontzen duten argumentazioa. Adibidez, "nire ustez" eta antzeko markatzaileekin batera "-lako", "ze" edo "baina" eta antzerakoak agertzen diren azter dezakegu.

Nik horretarako kontu teoriko eta laguntza-taulez gain, NVivo izeneko programa bat erabili nuen, elkarrizketak eta debateak kategorizatzeko tresna bat. Zoritxarrez, ordainpeko software pribatiboa da eta windowspean baino ez dabil, baina probarako bertsioa deskarga daiteke. Nahiko konplexua da programa baina datu mota asko jartzen ditu eskura (kategorizazioen arabera): http://www.qsrinternational.com/

Ixa taldekoekin jarri behar dut harremanetan ea tesiko ikerketarako pistak ematen dizkidaten! :D

Software librerik?

Benito-(e)k 2009, Maiatza 19 - 12:45-(e)an bidalia.

Atzo sarean bilaketa arina egiten, oso azalekoa egia esanda, inpresioa hartu nuen software librea deitu daitekeen gauza gutxi daudela arlo horretan. Beharbada tarte eta arreta handiagoarekin eginez gero aurkituko dira gauza gehiago, baina horixe lehenengo inpresioa: ordainpeko software-a gehiena eta asko nahikoa zaharrak gainera.

Eta lastima da, seguru nago hainbat unibertsitate eta ikerketa-zentrotan sortu eta erabili direla halako erremintak eta garapen lan polita egin dela eta egongo dela jeneroa.

Bidali iruzkin berria

The content of this field is kept private and will not be shown publicly.
By submitting this form, you accept the Mollom privacy policy.
Sindikatu edukia