RDFa

RDFa (pentru RDF în atribute) este o recomandare W3C care permite ca instrucțiunile RDF să fie încorporate în HTML , XHTML și într-un număr de dialecte XML . Împreună cu microformatele și microdatele, este una dintre cele mai frecvente metode de actualizare a paginilor HTML (X) cu informații suplimentare citite de mașină . RDFa este una dintre tehnologiile Webului semantic .

istorie

RDFa ca modul de XHTML

Încă din 2004, Mark Birbeck a prezentat un concept în publicația sa XHTML și RDF , care stă la baza RDFa. (Termenul RDFa nu apare încă în acest document.) În 2007, aceste idei și-au găsit drumul în proiectul W3C Module XHTML RDFa .

RDFa 1.0

În octombrie 2008, RDFa 1.0 a devenit recomandarea oficială a W3C. De la origini, s-a bazat foarte mult pe mecanismele de extensie dovedite ale lumii XML, în special spațiile de nume XML . Ca urmare, RDFa 1.0 a funcționat numai în XHTML și nu a putut fi combinat cu HTML clasic.

RDFa 1.1 și RDFa Lite

Versiunea actuală, RDFa 1.1, a fost ridicată la rangul de recomandare W3C în iunie 2012. Principala diferență față de RDFa 1.0 este lipsa particularităților specifice XML. RDFa poate fi folosit acum în dialecte XML (cum ar fi Atom și SVG ), precum și în HTML, în special HTML 5 . RDFa Lite a fost creat în același timp cu RDFa 1.1. RDFa Lite nu este o variantă proprie, ci un subset de RDFa care reduce semnificativ complexitatea, în special pentru începători.

Noțiuni de bază

Din perspectiva RDF, RDFa este una dintre mai multe moduri de a lista RDF. Spre deosebire de notațiile RDF pure, cum ar fi RDF / XML sau Turtle, RDFa încorporează expresiile RDF într-un limbaj de marcare a documentului existent (cum ar fi HTML). Informațiile nu trebuie păstrate de două ori și actualizate. Informațiile scrise pentru oameni pe o pagină web pot fi completate prin intermediul RDFa în așa fel încât programele de computer (de exemplu, motoarele de căutare) să capteze și semnificația lor semantică.

Din punctul de vedere al HTML, RDFa este, pe lângă microformate și microdate, un alt mod de a structura conținutul unui site web și de a-l face ușor de înțeles pentru mașini. RDFa poate recurge la un număr mare de vocabulare standard încercate și testate ( FOAF , SKOS , Dublin Core , SIOC, schema.org), dar permite și definirea unor termeni noi.

Pentru a realiza acest lucru, RDFa completează așa-numitele limbi invitate în cel mai simplu caz cu următoarele atribute (subsetul RDFa Lite ):

vocab
definește un spațiu de nume standard, adică vocabularul utilizat (înlocuirea mecanismului spațiului de nume XML)
prefix
Dacă este necesar, definește câteva alte spații de nume cu prefixele lor (înlocuirea mecanismului spațiului de nume XML)
resursă
poate desemna subiectul sau obiectul declarației RDF
proprietate
determină predicatul enunțului
tip de
determină tipul subiectului

Aproape toate expresiile RDF pot fi modelate cu atributele enumerate mai sus. În plus, specificația completă RDFa 1.1 cunoaște următoarele atribute pentru cazurile de utilizare avansate:

despre
este necesar în cazuri individuale în loc de resurse pentru a defini subiectul
conţinut
specifică conținut care poate diferi de conținutul lizibil în limba invitatului (de exemplu, ora formatată în loc de ora cinci )
tip de date
indică un tip de date unic pentru o valoare
în listă
creează elemente de listă RDF
rel
determină predicatul
rev
determină predicatul (dacă subiectul este în ordinea după obiect)

În cele din urmă, următoarele două atribute HTML sunt evaluate de procesoarele RDFa conform regulilor fixe și fac parte din instrucțiunile RDF generate:

src
Sursa unui fișier imagine , devine un obiect la RDFa
href
Hyperlinkul către o altă adresă web devine un obiect la RDFa

Exemple

Următorul exemplu folosește vocabularul schema.org creat de motoarele de căutare majore și sintaxa RDFa-Lite simplificată:

<div vocab="http://schema.org/" typeof="Product">
  <p>Kaufen Sie den
     <span property="name">Staubsauger XF704</span>
     jetzt im Sonderangebot!
     <img property="image" src="acmeXF704.jpg" />
  </p>
</div>

Specificația din vocab="http://schema.org/"linia 1 înseamnă că toți identificatorii RDF pot fi găsiți în următorul arbore din spațiul de nume schema.org. Atributul typeof="Product"imediat după acesta indică faptul că în cele ce urmează se vorbește despre un subiect de tip produs și că toate informațiile suplimentare se referă la acesta. Rândul 3 property="name"indică, de asemenea, că numele produsului urmează acum. property="image"în rândul 5 arată că fișierul de imagine de mai jos este imaginea produsului.

Exemplul poate fi extins:

<div vocab="http://schema.org/" typeof="Product">
  <p>Kaufen Sie den
     <span property="name">Staubsauger XF704</span>
     jetzt im Sonderangebot!
     <img property="image" src="acmeXF704.jpg" />
  </p>
  <p prefix="dc: http://purl.org/dc/elements/1.1/" resource="acmeXF704.jpg">
     (Produktabbildung: Foto
<span property="dc:title">Sauberkeit</span>“ von
     <span property="dc:creator">Max Mustermann</span>,
     <span property="dc:rights">freigegeben zur weiteren Verwendung
     ohne Einschränkung</span>)
  </p>
</div>

În linia 7, un nou spațiu de nume, este inclus un nou vocabular. De asemenea, în linia 7 indică faptul resource="acmeXF704.jpg"că informațiile suplimentare se referă la imaginea acmeXF704.jpg. property="dc:title", property="dc:creator"Și property="dc:rights"în liniile 9-11, cu expresiile din vocabularul Dublin Core, oferă informații mai detaliate cu privire la drepturile de titlu, drepturile de autor și exploatarea acestei imagini.

Diseminare și aplicații practice

Potrivit WebDataCommons.org, 12,7% din paginile HTML examinate au folosit o formă de marcare structurată în februarie 2012:

format Conținut în adrese URL
Microformate 49,77%
RDFa 35,96%
Microdate 14,26%
în 188 de milioane de adrese URL cu microdate

În noiembrie 2013, distribuția sa modificat semnificativ în favoarea formatelor W3C (RDFa și Microdata), dar există și mai multe site-uri care utilizează mai multe formate:

format Conținut în adrese URL
RDFa 50,53%
Microdate 47,17%
Microformate 26,44%
în 585 de milioane de adrese URL cu microdate

În noiembrie 2019, proporția de pagini HTML cu adnotări structurate era deja de 38%, deși distribuția în diferite formate s-a modificat semnificativ:

format Conținut în adrese URL
Microdate 43,12%
JSON-LD 23,70%
Microformate 22,99%
RDFa 10,19%
în 935 de milioane de adrese URL cu microdate

Exemple semnificative de aplicare practică sunt:

  • Schema.org este o inițiativă comună a motoarelor de căutare (Google, Yahoo!, Bing, Yandex) pentru a crea un vocabular de bază pentru îmbogățirea semantică a site-urilor web. Din 11 noiembrie 2011, schema.org acceptă oficial RDFa.
  • Google acceptă RDFa cu fragmentele sale bogate .
  • Facebook folosește RDFa în Open Graph Protocol .
  • Drupal este un sistem de management al conținutului (CMS) care a încorporat RDFa de la versiunea 7.
  • Wordpress , de asemenea, un CMS, acceptă RDFa prin intermediul pluginurilor.

Instrumente

Alternative

Microformate

Microformatele renunță la atribute noi și folosesc numai clasa de atribute HTML familiare , rel și rev . Aceasta înseamnă că nu există probleme la integrarea microformatelor, chiar și cu editori HTML care verifică validitatea codului pe baza unei versiuni HTML specifice.

Microformatele diferite sunt limitate fiecare la un singur subiect: există microformate speciale pentru rețete, CV-uri, rețele sociale și așa mai departe. Acest lucru simplifică aplicația atâta timp cât este tocmai aceste subiecte. Extensiile nu sunt posibile în orice moment, dar trebuie aprobate de comunitate. O legare a datelor în sensul datelor conectate nu este posibilă cu microformatele.

Microdate

Microdatele au fost create împreună cu HTML 5. Specificațiile sunt foarte asemănătoare cu RDFa. Diferențele reale se află în modelul de date pe care se bazează cele două specificații. RDFa a fost creat cu scopul expres de a implementa conceptul RDF existent în (X) HTML. În consecință, maparea între RDF și RDFa funcționează bine. Microdatele au fost create cu cerințe diferite. Schimbul cu surse RDF nu funcționează clar în fiecare constelație.

Link-uri web

Dovezi individuale

  1. a b Raport de extragere a datelor de pe Web - Corpus din februarie 2012 . Web Data Commons. 22 martie 2012. Adus pe 24 iunie 2012.
  2. a b Raport de extragere a datelor de pe web - Corpus noiembrie 2013 . Web Data Commons. 1 noiembrie 2013. Adus pe 28 aprilie 2014.
  3. XHTML și RDF W3C Note 14 februarie 2004 . Consorțiul World Wide Web . 14 februarie 2004. Adus pe 23 iunie 2012.
  4. Module XHTML RDFa, Module pentru a sprijini adnotarea elementelor RDF, Proiectul editorului W3C 2 aprilie 2007 . Consorțiul World Wide Web . 2 aprilie 2007. Accesat la 23 iunie 2012.
  5. ^ RDFa în XHTML: Sintaxă și procesare, o colecție de atribute și reguli de procesare pentru extinderea XHTML pentru a sprijini RDF, Recomandarea W3C 14 octombrie 2008 . Consorțiul World Wide Web . 14 octombrie 2008. Adus 23 iunie 2012.
  6. RDFa Core 1.1, Sintaxă și reguli de procesare pentru încorporarea RDF prin atribute, Recomandarea W3C 07 iunie 2012 . Consorțiul World Wide Web . 7 iunie 2012. Adus 23 iunie 2012.
  7. Raport de extragere a datelor de comunicații web - Corpus noiembrie 2019. Adus la 4 ianuarie 2021 .
  8. ^ Dan Brickley: Utilizarea RDFa 1.1 Lite cu Schema.org . 11 noiembrie 2011. Adus 23 iunie 2012.
  9. Ce este Schema.org? schema.org.
  10. ^ Tantek Çelik: Procesul microformatelor . 25 aprilie 2012. Adus pe 24 iunie 2012.
  11. Microdate către RDF: fundal . Consorțiul World Wide Web . 12 ianuarie 2012. Adus 23 iunie 2012.