23
Urt
2007

Feed43

Feed43-n jarioa sortu

Abiatu 

Feed43 eskaintzen ez duten guneetan RSS jarioa lortzeko sare-tresna da. Efektiboa baina apur bat konplikatua ematen du hasieran. Jario bat zelan lortu dugun kontatuko dugu. Norberak halako bat egiten duenean gida edo, hobeto esanda, eredu modura erabiltzeko.

Joan www.feed43.com gunera. Jarioa sortzeko ez duzu erregistratu behar, baina erregistratu barik sortzen dituzun jarioak ezin izango dituzu gorde. Erregistratzea merezi du, debalde da eta zeure jarioak uneoro edukiko dituzu zerrendatuta eta editatzeko moduan (debaldeko kontuarekin 20 gehienez).

Erregistratuta edo erregistratu barik Create new feed ipintzen duen lekuan sakatu, jarioa sortzeko orrira joango zara.

Han zaudela pauso hauek jarraitu behar dituzu:

Step 1. Specify source page address (URL).

Honez azpian bi koadro ikusiko dituzu, ezkerrekoan (luzeena), "erreseseatu" nahi duzun orriaren helbidea jarri beharko duzu. http://www.aikor.com/bloga/tximintx adibidez.

Honen ondoren behean daukazun load botoia sakatu. Behean orrialde horren kodea agertuko da, nabigatzaileak irakurtzen duen html-a. Kode hori hasiera baten anabasa handia irudituko zaigu, baina pazientzia apur batekin hieroglifikoan gauzak ikusten hasiko gara.

Step 2. Define extraction rules.

Orriaren kodean bilatu behar dugu orain. Zer bilatu? Orri horretan interesatzen zaigun informazioa, berrizten dena eta agregatzailearen bidez jarraitu nahi duguna. Blog baten adibidez, post-etako tituluak eta mezuak. Beste guztia (Blogaren titulua, alboko barra,...) beti izango da berdina eta ez zaigu interesatzen ezta? Hasi gaitezen bila ba! Tximintx-en blogean adibidez.

Komeni da beti web orria bistan edukitzea, Tximintxen blogean adibidez, goian izenburua eta logoa ikusten ditugu, alboko barran gaiak, loturak eta abar,... hori ez zaigu interesatzen, ez da berrizten. Goazen mezuetara. Mezu bakoitzeak honako egitura dauka: titulua, testua eta behean post-aren datuak: kategoria, egilea, data,... Guri momentuz titulua eta testua baino ez zazkigu interesatzen. Non daude bada?

Erreparatu dezagun bistan daukagun blogean zeintzuk diren tituluak, eta bilatu ditzagun kodean. Adibidez, "Testu dokumentuak eskegi ditugu" dugu titulu bat. Kodearen amaraunean saiatuko gara topatzen. Hara! Sasi artean topatu dugu:

</style>
<div class="post_block">
<div class="post_title"><a href="http://www.aikor.com/bloga/tximintx/Testu-dokumentuak-eskegi-ditugu.html">Testu dokumentuak eskegi ditugu</a></div>
<div class="post_body"><div class="post_text">Orain arte ez dugu zerbitzu hori erabili baina<a href="http://www.aikor.com/bloga/blogatek"> Ioritzek</a> emandako aholkuari jarraituz, testuak egoki eskegitzeko zerbitzua topatu dugu.<br /><br />

Eureka! Oihanaren erdian aurkitu dugu! Errepikatzen den estruktura baten erdian dago, beraz, suposatuko dugu mezu guztietan antzeko zerbait edukiko dugula eta titulua beti agertuko dela leku horretan. Zer dauka inguruan? "<div class="post_title">"+link-a+titulua+</a>. Hemen daukagu errepikatzen den egitura.

Baina, hor badago interesatzen zaigun beste gauza bat ere. RSS jario baten tituluaren gainean sakatuta mezuaren orri orijinalera joango gara, ezta? Beraz, link hori ere beharko dugu. Non dago link-a? Oraintxe esan dugu, tituluaren aurrean a href=" eta "> sinboloen artean, tituluaren aurrean. Beraz, errepikatzen den katean daukagu interesatzen zaizkigun elementu birekin: titulua eta link-a. Honako zerbait:

<div class="post_title"><a href="LINK-A">TITULUA</a></div>

Beste mezuen egiturari erreparatzen badiegu, berehala konturatu gara guztietan errepikatzen dela estruktura berdina. Estruktura horren berri eman behar diogu aplikazioari, nola egingo dugu?

..define extraction rules izenburuaren azpiak koadro bi ikusiko ditugu: Global Search Pattern eta Item (repeatable) Search Pattern. Lehenengoa ez da derrigorrezkoa, orriaren zein ataletan bilatzea nahi dugun galdetzen digu, ez badugu ezer zehazten orri guztian bilatuko du, baina orri sinple baten ez dauka garrantzi handirik. Bigarren koadroan dago gakoa.

Koadro horretan errepikatzen den katea hori sartu behar dugu, baina guri interesatzen zaizkigun elementuen ordez aldagai edo komodin bat sartuko dugu, sinbolo hau: {%}. Honela geratuko zaigu:

<div class="post_title"><a href="{%}">{%}</a></div>

Hau da, aplikazioari esan diogu: bilatu kate hau kodean, eta errepikatzen den bakoitzean gorde {%} sinbolo horren lekuan dagoena eta baztertu beste guztia.

Honekin titulua eta link-a harrapatu ditugu dagoeneko. Baina testua ere nahi dugu. Jarraitu dezagun kodean nabigatzen eta ikusiko dugu mezu bakoitzaren testua beti hasten dela <div class="post_text"> etiketa baten ostean, eta behera-behera eginda mezuaren datuak hasten diren </div> etiketa baten aurrean amaitzen dela. Gehitu diezaiogun lehengo kateari bada:

<div class="post_title"><a href="{%}">{%}</a></div><div class="post_body"><div class="post_text">{%}</div>

Dena dela, hau gehiago ere sinplifikatu daiteke, beste komodin bat dago: {*}. Komodin honek aplikazioari "hau eta hau eta hau eta hau" esan beharrean "hemen tartean dagoen guztia" diotsa. Begitu zelan geratuko litzatekeen:

title"><a href="{%}">{%}</a>{*}_text">{%}</div>

Hau daukagu orduan: hartu title"><a href=" eta ">-ren artean dagoena, gero hartu horren ostean eta </a>-ren artean dagoena ere, hortik salto egin _text">-era arte, eta hartu ondoren dagoena </div>-era arte. Hau da, hartu link-a, titulua eta testua.

Sartu dezagun hau "Item (repeatable) Search Pattern" koadroan, eta konprobatzeko sakatu dezagun "extract" botoia. Behean koadro handiago baten honako zerbait agertu behar da:

Item 1

{%1} = http://www.aikor.com/bloga/tximintx/Testu-dokumentuak-eskegi-ditugu.html
{%2} = Testu dokumentuak eskegi ditugu
{%3} = Orain arte ez dugu zerbitzu hori erabili baina<a href="http://www.aikor.com/bloga/blogatek"> Ioritzek</a> emandako aholkuari jarraituz, testuak egoki eskegitzeko zerbitzua topatu dugu.<br /><br />Bi testu eskegi ditugu momentuz:<br /><br />- Natalia Lopezek Derioko eta Getxoko Berbalagunen arteko aldeak nabarmentzeko egindako ikerketa lana. <a href="http://www.box.net/public/vyjutp2ne0">Hemen</a>, kontuz pdf-a da.<br /><br />- Tximintx elkarteak 2004an Deriori buruzko han-hemenka sakabanatutako datu soziolinguistikoak biltzeko egindako ahalegina. <a href="http://www.box.net/public/xtq5pe0zlk">Hemen</a>, kontuz pdf-a da.<br />

Item 2

...

Item bakoitza blogeko mezu bat izango da, non {%1} link-a izango den, {%2} titulua eta {%3} testua. Honela agertzen ez bada eta errore mezua ematen badigu zerbait ez dago ondo estrakzio katean eta aldaketak egin beharko ditugu probatu arte.

Step 3. Define output format

Orain gure jarioari nahi dugun itxura emango diogu.

Feed title, feed link eta feed description koadroak automatikoki beteko dira gehienetan. Gure orriaren titulua, esteka eta deskribapena dira, blogarena kasu honetan. Beheko koadroak interesatzen zaizkigu:

  • Item Title Template: hemen mezu bakoitzaren tituluan agertzea nahi dugun sartuko dugu, gure kasuan {%2}, hau da estrakzio katean titulua izan da bigarren lekuan egon den {%} txirinboloa.
  • Item Link Template: hemen mezuaren link-a edo permalink-a. {%1} gure kasuan, fijatzen bazarete, estrakzio katean atera dugun lehenengoa izan da.
  • Item Content Template: Testua edo mezuaren edukia. {%3}, ezta? Jakina, falta den bakarra da eta! Baina horrez gain katean azkenengo atera duguna izan da, ezta?

Preview mode botoian sakatu eta ikus dezagun gure jarioa zelan geratu den.

Aikor
http://www.aikor.com/bloga/tximintx
Aikor

   1. Testu dokumentuak eskegi ditugu
      http://www.aikor.com/bloga/tximintx/Testu-dokumentuak-eskegi-ditugu.html
      Orain arte ez dugu zerbitzu hori erabili baina Ioritzek emandako aholkuari jarraituz, testuak egoki eskegitzeko zerbitzua topatu dugu.

      Bi testu eskegi ditugu momentuz:

      - Natalia Lopezek Derioko eta Getxoko Berbalagunen arteko aldeak nabarmentzeko egindako ikerketa lana. Hemen, kontuz pdf-a da.

      - Tximintx elkarteak 2004an Deriori buruzko han-hemenka sakabanatutako datu soziolinguistikoak biltzeko egindako ahalegina. Hemen, kontuz pdf-a da.

      -- Delivered by Feed43 service
   2. Artxiboak arakatzen ....
      http://www.aikor.com/bloga/tximintx/Artxiboak-arakatzen-.html
      Tximintxek bere bloga izan aurretik, Topaguneak eskainitako aukera bat erabiliz, orri estatikoa eduki zuen. Hortik ateratako testu batzuk berreskuratu ditugu eta gure blogetan sartu. Kontuan izan testuak 2005eko apirilean idatzitakoak direla (neolitiko garaian ia-ia).

      NORTZUK GARA?

      Zer da Tximintx alkartea?

      Tximintx euskara alkarte bat da. Bertara hainbat derioztar bildu gara, adin eta esparru ezberdinekoak. Hortaz, gure taldea zabala eta anitza da, eta bertako ateak zabalik ditu euskaraz eta euskararen alde lan egin gu.....

Voila! Hemen gure jarioa!

Step 4. Get your RSS feed

Orain aukera edukiko dugu gure jarioaren helbidea atontzeko. Printzipioz honelako helbidea ematen digu:

 Feed URL is: http://feed43.com/3076668632728417.xml

Baina  Change file name  of this feed to make it more user-friendly ipintzen duen lekuan sakatzen badugu azken zati hori itxurosoagoa egiteko aukera daukagu. Adibidez:

http://feed43.com/tximintx.xml 

Listo! Feed43-ek aldaketak automatikoki gordetzen ditu. 

Lortu dut

txerra (ez da egiaztatu)-(e)k 2007, Urtarrila 23 - 20:36-(e)an bidalia.

Egin dut bai. Aikor.com-eko albisteak atalari gehitu dizkiot RSSak, bihar edo etzi gauza bera egiten saiatuko naiz artikuluekin. Eskerrik asko, Benito.

Aikor albisteak:
http://feed43.com/aikor-albisteak.xml

Aikorrek jarrioak jarri ditu

txerra (ez da egiaztatu)-(e)k 2007, Otsaila 15 - 12:56-(e)an bidalia.

Aikor aldizkariak jarioak jarri dizkie albisteei eta artikuluei. Hona hemen:
http://www.aikor.com/rss/albisteak.php
http://www.aikor.com/rss/artikuluak.php

Bidali iruzkin berria

The content of this field is kept private and will not be shown publicly.
By submitting this form, you accept the Mollom privacy policy.
Sindikatu edukia