Šiuo straipsniu pratęsiu anksčiau rašytą straipsnį apie “Web feeds” - “Web feeds (RSS, Atom) - 1 dalis“. Jame rašiau apie žiniatinklio srauto pagrindus, kaip naudotis ir kam tai reikalinga. Šiuo straipsniu paaiškinsiu apie / standartus bei formą.

Sąvokos
- duomenų formatas, dar kitaip vadinamas žiniatinklio srautu (angl. web feeds).
santrupa turi tris reikšmes. Pateikiu pagal populiarumą:
Tikrai paprastas surinkimas (angl. Really Simple Syndication)
Išsamus puslapio aprašymas (angl. Rich Site Summary) - ( 0.91)
RDF (angl. Resource Description Framework Site Summary) - ( 0.9, 1.0 ir 1.1)
Lietuviškai apibrėžti būtų galima taip: “Labai paprasta sindikacija”.

- sindikacijos standartas, pateikiamas kalba ir naudojamas žiniatinklio srautuose (angl. web feeds). Daugeliui tikriausiai iškyla klausimas, jeigu yra , kam reikia ?
buvo sukurtas dėl daug egzistuojančių neišbaigtų sindikacijos formatų. Pavyzdžiui dėl suderinamumo su XML-RPC problemų.

Keletas skirtumų
2.0 įrašai gali būti sudaryti iš paprasto teksto (angl. Plain text) arba ištaisyto HTML (angl. Escaped HTML), ir neturi galimybės identifikuoti, kuris iš jų yra naudojimas. HTML palaikymas yra nekoks, pavyzdžiui & pakeičiamas į &. Įrašo pavadinime (angl. Title) panaudojus laužtinius skliaustus gausite klaidas, kadangi jie paprasčiausiai nepalaikomi. Taip pat 2.0 turinio modelis nepalaiko žymių kalbos, ko pasekoje susiduriame su turinio ‘usability’ problemomis.
turi daug geriau sutvarkytą elementų palaikymo sistemą. Turiniui privalo būti paskirtas vienas iš šių tipų:

  • paprastas tekstas, be jokių žymių (pagal nutylėjimą)
  • ištaisytas (angl. escaped) HTML
  • taisyklinga (angl. well-formed) xHTML žymių kalba
  • Kitos žymės
  • base64-encoded binary turinys

2.0 turi „description“ (aprašymo elementą), kuriame galima talpinti santrauką arba pilną straipsnį. šį elementą realizavo patogiau – išskirstė į du skirtingus elementus: „summary“ ir „content“.

Kalbos, naudojamos įrašuose identifikavimui, 2.0 naudoja savo žymę <language>, naudoja :lang atributą.
2.0 suteikia galimybę nurodyti el. paštą žiniatinklio srauto autoriui/savininkui (angl. author). Tam naudojamos žymės <managingEditor> ir <webMaster>, o įrašų autoriams nurodyti naudojama <author>. Kai kurie autoriai nenori dalintis savo el. paštu ir todėl naudoja <dc:creator>.

1.0 suteikia <author> ir <contributor> elementus abiems lygiams - ir srauto aprašymo, ir įrašams. Abu elementai privalo turėti nurodytą autoriaus vardą, taip pat pasirinktai galima papildomai nurodyti el. paštą arba tinklalapio adresą.

Daugiau skirtumų galima surasti http://en.wikipedia.org/wiki/Atom

Formatas

2.0

<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
<channel>
    <title>Pixel.lt RSS srautas</title>
    <link>http://jusu.svetaine.com/</link>
    <description>Geriausios svetainės naujienų RSS srautas.</description>
    <language>lt</language>
    <pubDate>Tue, 10 Apr 2007 04:00:00 GMT</pubDate>
    <lastBuildDate>Tue, 10 Jun 2007 09:41:01 GMT</lastBuildDate>
    <managingEditor>belenkas@svetaine.com</managingEditor>
    <webMaster>webmaster@svetaine.com</webMaster>
<item>
<title>Kažkas kažkodėl</title> 
<link>http://domenas.org/2007/02/13/atom03</link> 
<guid isPermaLink="false">urn:uuid:1225c695-cfb8-4ebb-aaaa-80da344efa6a</guid> 
<pubDate>Sat, 13 Apr 2007 18:30:02 GMT</pubDate>
<description>Kažkoks straipsnio tekstas - pilnas/santrauka</description>
</item> 
 
</channel>
</rss>

Taigi, privalomos kanalo žymės (<channel>) aprašymui yra trys:

  • <title> - Srauto pavadinimas - svetainės pavadinimas. Čia paliekama teisė jums rinktis, kaip norite pateikti savo internete. Dažniausiai užpildoma svetainės pavadinimu, pvz.: Pixel.lt srautas.
  • <link> - URL adresas į svetainę, kuri atstovauja jūsų pateiktą srautą.
  • <description> - Žodis/frazė/sakinys apibūdinantis jūsų srautą - čia taip pat paliekama laisva valia - improvizuokite kaip norit..

Visos kitos žymės nurodytos pavyzdyje yra nebūtinos ir užpildomos pasirinktinai, jų yra ir daugiau, tačiau dauguma jų yra nereikšmingos. Apie jas visas galite rasti w3schools.

Privalomos žymės įrašui (<item>) yra lygiai tokios pačios kaip aukščiau išvardintos, tiesiog jų paskirtis yra nurodyti informaciją ne apie bendrai srautą, o apie būtent tą įrašą.
Visas žymes galima rasti taip pat w3schools.

1.0

<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
 
<title>Pavyzdinis Atom srautas</title>
<subtitle>Tai mūsų Atom srautas</subtitle>
<link href="http://svetaines.nuoroda.com/"/>
<updated>2007-02-13T18:30:02Z</updated>
<author>
<name>Vardenis pavardenis</name>
<email>vpavardenis@domenas.com</email>
</author>
<id>urn:uuid:60a76c80-d399-11d9-b93C-0003939e0af6</id>
 
<entry>
<title>Kažkas kažkodėl</title>
<link>http://domenas.org/2007/02/13/atom03</link> 
<id>urn:uuid:1225c695-cfb8-4ebb-aaaa-80da344efa6a</id>
<updated>2007-02-13T18:30:02Z</updated> 
<summary>Kažkoks straipsnio tekstas – santrauka</summary> 
<content>Kažkoks straipsnio tekstas – pilnas tekstas</content>
</entry>
 
</feed>

srauto (<>) aprašyme privalomos šios žymės:

  • <id> - Jūsų srauto unikalus ID. Galima naudoti savo svetainės adresą, jeigu jis yra pakankamai ilgas ir unikalus. Aukščiau pateiktame pavyzdyje yra sugeneruotas atsitiktinių simbolių ID.
  • <title> - Toks pats tikslas kaip ir , šios žymės nepatartina palikti tuščios.
  • <updated> - Nurodo, kada paskutinį kartą buvo atnaujintas srautas (įdėtas naujas įrašas ir pan.).

Taip pat rekomenduočiau naudoti ir šias žymes: <author> (privaloma nurodyti bent jau vardą) ir <link> (nuoroda į svetainę).
srauto įrašo (<entry>) aprašyme reikalingos lygiai tokios pačios žymės kaip ir bendram srauto aprašyme, tik informacija taikoma įrašui. Papildomai rekomenduojamos šios žymės:

  • <summary> - turinys, jūsų įrašo santrauka (ne pilnas tekstas).
  • <content> - Jūsų įrašo pilnas tekstas (ne santrauka).

Taip pat rekomenduoju nurodyti ir <author> bei <link>.

Kaip pastebėjote sudėtis šiek tiek skiriasi.
2.0 ‘‘ aprašymui naudoja <description> žymę, o 1.0 <subtitle>. Kaip jau minėjau anksčiau, vietoje <language> žymės naudojamos , naudoja :lang atributą. nebeturi <webMaster>, <rating>, <textInput>, <skipHours>, <skipDays> žymių, jos visiškai ‘useless’ (nenaudingos). <managingEditor> pakeista į <author> arba <contributor>.
Taip pat vietoje <guid>, naudojama <id>. Na ir žinoma vietoj <description> naudojama <summary> ir/arba <content>, priklausomai nuo to ar teikiate pilną straipsnį, ar ne.

Šioje dalyje tiek, jeigu turite klausimų/pastabų - laukiu komentarų. ;)

Panašūs straipsniai


“Web feeds (RSS, Atom) - 2 dalis” komentarų: 1

  1. Tomas

    Tai pasirodo Atom protingiau padarytas. Kodel kazin RSS visi naudoja?

Rašyti komentarą

Jūs privalote prisijungti jeigu norite rašyti komentarą.