Inițiativă de codificare a textului
Text Encoding Initiative (TEI) este o organizație fondată în 1987 ( organizat ca un consorțiu TEI din 2000 ) și un format de document al același nume de codificare și schimbul de texte, care a dezvoltat și continuă să se dezvolte. În versiunea curentă P5 , formatul se bazează pe XML și este definit într-un limbaj metalic din care pot fi derivate scheme oficiale precum DTD , schema XML și schema RELAX NG .
TEI s-a transformat într-un standard de facto în cadrul științelor umaniste , unde este folosit, de exemplu, pentru a codifica lucrări tipărite ( știința ediției ) sau pentru a marca informații lingvistice ( lingvistică ) în texte.
poveste
TEI a fost din 1988 pe baza SGML dezvoltat primul proiect P1 ( P pentru propunerea în limba engleză - propunere ) a fost publicat în 1990. După o versiune intermediară a P2 (1992), conținea îmbunătățirile și corecțiile, în 1994, care la rândul său a îmbunătățit versiunea TEI P3 - prima versiune stabilă - adoptată. Odată cu dezvoltarea și diseminarea XML, TEI a trebuit, de asemenea, să evolueze. Consorțiul TEI a fost înființat în acest scop în 2000. Prima versiune XML P4 a apărut în 2002, în același timp versiunea TEI Lite a fost creată cu o gamă redusă de elemente. Versiunea P5 a fost dezvoltată din 2005 și a fost lansată pe 1 noiembrie 2007. A fost revizuit din punct de vedere tehnic și extins din punct de vedere al conținutului, inclusiv un standard pentru descrierea manuscriselor ( MASTER ).
tehnologie
TEI este alcătuit din diverse module legate de subiect care conțin , de exemplu, elemente pentru structura documentului, pentru marcarea poeziilor și dramelor, pentru marcarea liniilor și paginilor individuale, pentru tabele, pentru comentarii critice pentru text sau pentru corpusuri de limbă , terminologii și dicționare . Există un nucleu de module care <p/>
conțin elemente generale ca la paragrafe. În funcție de proiect, acest nucleu poate fi extins pentru a include modulele necesare care permit etichetarea foarte diferențiată a caracteristicilor textului. Schema TEI pentru o aplicație specifică este ea însăși definită ca un document TEI într-o limbă metalică (numit document ODD: un document face totul ). Schemele formale precum DTD , schema XML și schema Relax-NG pot fi generate automat din documentul ODD . Site-urile web TEI oferă instrumente atât pentru adaptarea TEI, cât și pentru crearea schemelor.
Exemple
Salut Lume!
<?xml version="1.0" encoding="UTF-8"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
<fileDesc>
<titleStmt>
<title>Hallo Welt!</title>
</titleStmt>
<publicationStmt>
<p>Demo für Wikipedia</p>
</publicationStmt>
<sourceDesc>
<p>Originales Werk, keine Vorlage</p>
</sourceDesc>
</fileDesc>
</teiHeader>
<text>
<body>
<p>Hallo Welt!</p>
</body>
</text>
</TEI>
Exemplu practic
Următorul exemplu codifică o poezie cu informații bibliografice detaliate , precum și informații despre numărul de linii și pagini (TEI Lite).
<?xml version="1.0" encoding="UTF-8"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
<fileDesc>
<titleStmt>
<title>Auf dem Brocken</title>
<author>Heinrich Heine (1797–1856)</author>
<respStmt>
<name>Wiki Autor</name>
<resp>Umwandlung in TEI-konformes XML</resp>
</respStmt>
</titleStmt>
<publicationStmt>
<p>aus Wikisource, der freien Quellensammlung
(<ptr target="http://de.wikisource.org/wiki/Auf_dem_Brocken"/>)</p>
</publicationStmt>
<sourceDesc>
<biblFull>
<titleStmt>
<title level="a">Auf dem Brocken</title>
<title level="m">Buch der Lieder</title>
<title level="m" type="sub">Aus der Harzreise</title>
<author>Heine, Heinrich</author>
</titleStmt>
<publicationStmt>
<publisher>Hoffmann und Campe</publisher>
<pubPlace>Hamburg</pubPlace>
<date>1827</date>
<availability>
<p>Gemeinfrei, keine Nutzungsbeschränkungen</p>
</availability>
</publicationStmt>
</biblFull>
</sourceDesc>
</fileDesc>
</teiHeader>
<text>
<body>
<pb n="302"/>
<head>Auf dem Brocken.</head>
<lg type="stanza">
<l>Heller wird es schon im Osten</l>
<l>Durch der Sonne kleines Glimmen,</l>
<l>Weit und breit die Bergesgipfel,</l>
<l>In dem Nebelmeere schwimmen.</l>
</lg>
<lg type="stanza">
<l n="5">Hätt’ ich Siebenmeilenstiefel,</l>
<l>Lief ich, mit der Hast des Windes,</l>
<l>Ueber jene Bergesgipfel,</l>
<l>Nach dem Haus des lieben Kindes.</l>
</lg>
<lg type="stanza">
<l>Von dem Bettchen, wo sie schlummert,</l>
<l n="10">Zög’ ich leise die Gardinen,</l>
<l>Leise küßt’ ich ihre Stirne,</l>
<l>Leise ihres Munds Rubinen.</l>
</lg>
<lg type="stanza">
<l>Und noch leiser wollt’ ich flüstern</l>
<l>In die kleinen Lilien-Ohren:</l>
<l n="15">Denk’ im Traum, daß wir uns lieben,</l>
<l>Und daß wir uns nie verloren.</l>
</lg>
</body>
</text>
</TEI>
Vezi si
Link-uri web
- Site-ul oficial al consorțiului TEI
- TEI în practică
- Inițiativă de codificare a textului pe GitHub
- Observații online: „„ Informații de ieri mâine ”: inițiativa de codificare a textului”
- Christof Schöch, Un format de text digital pentru studii literare: Liniile directoare ale Inițiativei de codificare a textului și utilizarea lor în constituirea textului și analiza textului, Romance Studies 4 (2016): 325-364.
Dovezi individuale
- ↑ Matthew L. Jockers, Rosamond Thalken: Analiza textului cu R: Pentru studenții la literatură (= Metode cantitative în științele umaniste și sociale ). Editura Springer International, Cham 2020, ISBN 978-3-03039642-8 , pp. 134 , doi : 10.1007 / 978-3-030-39643-5 ( springer.com [accesat la 27 aprilie 2020]).
- ^ P5: Liniile directoare pentru codarea și schimbul electronic de texte. Istoric istoric tei-c.org
- ^ P5: Liniile directoare pentru codarea și schimbul electronic de texte. Infrastructura TEI tei-c.org