Limbaj de marcare hipertext

HTML (Hypertext Markup Language)
Captură de ecran
Extensie fișier : .html, .htm
Tip MIME : text / html
Dezvoltat de: World Wide Web Consortium (W3C)
Lansare inițială: 1992
Versiune curentă: 5.2 (începând cu 14 decembrie 2017)
Tip: Limbaj de marcare
Extins la: XHTML , HTML5
Standard (e) : ISO / IEC 15445

W3C HTML 5 W3C HTML 4.01 W3C HTML 3.2

Site web : www.w3.org/html

Hypertext Markup Language ( HTML , limba engleză pentru Hypertext -Auszeichnungssprache ) este un text pe bază de limbaj de markup pentru structurarea documentelor electronice , cum ar fi textul cu hyperlink - uri , imagini și alte tipuri de conținut. Documentele HTML sunt baza World Wide Web și sunt afișate de browserele web . Pe lângă conținutul afișat de browser, fișierele HTML pot conține informații suplimentare sub formă de metainformații , de ex. B. despre cele folosite în textLimbi , autor sau conținutul rezumat al textului.

HTML este dezvoltat în continuare de World Wide Web Consortium (W3C) și de Web Hypertext Application Technology Working Group (WHATWG). Versiunea actuală este HTML 5.2 din 14 decembrie 2017 , care este deja acceptată de multe browsere web actuale și alte motoare de aspect . Extensible Hypertext Markup Language (XHTML) este , de asemenea , fiind înlocuit cu HTML5.

HTML este utilizat ca limbaj de marcare pentru a structura semantic un text , dar nu pentru a-l forma. Reprezentarea vizuală nu face parte din specificațiile HTML și este determinată de browserul web și paginile master, cum ar fi CSS . Excepție fac elementele legate de prezentare marcate ca fiind depășite ( limba engleză este depreciată ).

Apariția

Înainte de dezvoltarea World Wide Web și a componentelor sale, inclusiv HTML, nu era posibilă schimbul de documente electronic cu ușurință, rapiditate și structurare între mai multe persoane și conectarea lor eficientă între ele. În plus față de protocoalele de transmisie, a fost necesar un limbaj de markup ușor de înțeles. Exact aici se află punctul de plecare al HTML. Pentru a împărtăși rezultatele cercetării cu alți angajați ai Organizației Europene pentru Cercetare Nucleară (CERN) și pentru a le face accesibile din cele două locații din Franța și Elveția, un proiect a fost înființat la CERN în 1989 pentru a găsi o soluție la această problemă. La 3 noiembrie 1992, a apărut prima versiune a specificației HTML.

sintaxă

Textului i se oferă o structură prin marcarea părților de text.

Distincția se face folosind elemente standardizate (SGML) . Majoritatea acestor elemente HTML sunt marcate de o pereche de etichete, adică o etichetă de început și o etichetă de final. O zi de început începe întotdeauna cu semnul <. Acesta este urmat de numele elementului (de exemplu, ppentru un paragraf sau h1pentru un antet de prim ordin) și, opțional, de o listă a atributelor sale (de exemplu, class="warning"sau id="warning"). Ziua de >început este închisă cu una . O etichetă de final constă din caractere </, numele elementului și cel care termină >. Etichetele de început și de sfârșit care aparțin împreună, împreună cu conținutul dintre ele, formează un element al specificației generale SGML . Aceste elemente pot fi imbricate conform regulilor specificate într-o definiție a tipului de document (DTD):

<p>Ein Textabsatz, der ein <em>betontes</em> Wort enthält.</p>

Anumite elemente nu trebuie notate în mod explicit. Conform regulii SGML „OMITTAG”, eticheta finală poate lipsi pentru unele elemente (de exemplu, </p>sau </li>). În plus, nici o diferență (z. B. pentru nume de elemente și atribute sunt sensibile la caz <ul>, <UL>, <uL>). Pentru comparație: în XHTML aceste reguli sunt scrise mai strict.

În plus față de elementele cu etichete de început și de sfârșit, există și elemente goale în HTML, cum ar fi întreruperile de linie ( br) sau imaginile ( img).

Eine Textzeile,<br>die hier fortgesetzt wird.
<img src="E-Mail-Button.jpg" alt="E-Mail">

Este vorba de HTML descriptiv (engleză descriptiv ), nu procedurală (engleza procedurală ) și orientată spre prezentare (engleză prezentaționale ) markup , chiar dacă HTML a fost utilizat în versiunile anterioare ale acestui. Elementele HTML nu sunt informații despre prezentare care îi spun browserului web cum să formateze vizual textul . Mai degrabă, elementele sunt o etichetă structurantă care poate fi utilizată pentru a atribui un sens zonelor de text, de ex. B. pentru un antet, pentru un paragraf de text și pentru text accentuat. Modul în care această semnificație este transmisă în cele din urmă utilizatorului (în cazul unui titlu, de exemplu, prin font mărit, bold ) depinde inițial de browserul web și depinde de mediul de ieșire. Deși documentele HTML sunt de obicei afișate pe ecranele computerului , ele pot fi de asemenea afișate pe alte suporturi, de exemplu pe hârtie sau folosind ieșirea vocală . Șabloanele în format CSS sunt potrivite pentru influențarea prezentării unui document HTML în diferite medii. <h1></h1><p></p><em></em>

Prin urmare, elementele si atributele de prezentare , cum ar fi , și sunt considerate de actualitate (limba engleză depreciată ) și trebuie evitată în conformitate cu opinia generală; acestea nu ar trebui să mai fie utilizate în software-ul nou dezvoltat și ar trebui înlocuite atunci când software-ul generator de documente este revizuit. <font></font><u></u>noshade

Citirea în textul sursă și prelucrarea informațiilor existente este, de asemenea, denumită analiză în terminologia tehnică , iar pregătirea pentru mediul de ieșire ca redare . Limbajul HTML descrie modul în care browserul (sau un alt program, cum ar fi un editor de text ) trebuie să „înțeleagă” marcajele din text, nu cum le convertește apoi în afișaj. Așa spune, totuși, că a urmat un titlu, dar în care nu există dimensiunea fontului sau stilul fontului , acesta trebuie prezentat - aici s-au naturalizat doar unele valori implicite obișnuite, dar o parte din specificațiile HTML nu sunt. <h1>

Set de caractere

Setul de caractere standard, bazat inițial pe ASCII pe 7 biți , a fost extins pentru a include numeroase caractere speciale în primele zile ale WWW și codificat ca entitate HTML. Suportul seturilor de caractere universale pentru toate limbile comune din întreaga lume a necesitat sprijinul UTF (Unicode), care este acum implementat în toate browserele comune. HTML este, prin urmare, conceput pentru portabilitate independentă de platformă, cu condiția ca acesta să fie acceptat de randatorul HTML utilizat. Alegerea setului de caractere care stau la baza pentru un document web se face în elementele meta din antetul fișierului, apoi browserul se adaptează la acesta.

Creatorii de site-uri web a căror tastatură poate să nu furnizeze direct toate caracterele, cum ar fi umlauturile germane , pot codifica caractere speciale în mai multe moduri ; o umlaut A („ä”) poate fi fie codificată ca entitate HTML ( &auml;), ca Unicode zecimal ( &#228;) sau ca Unicode hexazecimal ( &#x00E4;), consultați specificațiile punctului de cod Unicode # din documente . Mulți editori de site-uri web complexe rezolvă automat caractere speciale atunci când textul sursă este codat.

În rezoluția în liniile de adresă ( URL-uri ) se va întâmpla invers, aici nu sunt caracterele direct acceptate sunt după metoda MIME în codificarea caracterelor ASCII, astfel. B. %20pentru un spațiu dacă apare, de exemplu, într-un nume de fișier și trebuie să fie diferit de spațiul obișnuit de la sfârșitul legăturii .

Tipul limbii

HTML este un limbaj de marcare și ca atare este de obicei diferențiat de limbajele de programare (a se vedea secțiunea Sistematică externă: Clasificarea ca limbaj de programare sau format de date în articolul despre limbaje de marcare). Un lucru comun cu majoritatea limbajelor de programare este că nu este necesar niciun software special (a se vedea și lista editorilor HTML ) pentru editarea documentelor sursă , dar orice editor de text este suficient.

Un concept similar (descriere logică) ca în spatele HTML se află în spatele sistemului de tipografiere TeX / LaTeX , care, spre deosebire de HTML, vizează ieșirea imprimantei pe hârtie.

Versiuni

HTML a fost propus pentru prima dată pe 13 martie 1989 de Tim Berners-Lee la CERN din Geneva.

  • HTML (fără numărul versiunii, 3 noiembrie 1992): versiunea originală care se bazează doar pe text.
  • HTML (fără numărul de versiune, 30 aprilie 1993): În plus față de text, integrarea imaginii a fost adăugată în plus față de atribute precum afișajul aldin sau cursiv.
  • HTML + (noiembrie 1993) Îmbunătățiri planificate care au fost încorporate în versiunile ulterioare, dar care nu au fost adoptate niciodată ca HTML +.
  • HTML 2.0 (noiembrie 1995): Versiunea definită cu RFC 1866 a condus inter alia. Tehnologia formularelor. Statutul acestui standard este „ISTORIC”. Predecesorii sunt, de asemenea, depășiți.
  • HTML 3.0 : Nu a fost publicat deoarece a fost depășit cu introducerea browserului Netscape în versiunea 3 înainte de publicarea planificată.
  • HTML 3.2 (14 ianuarie 1997): numeroase caracteristici noi, cum ar fi tabele, fluxul de text în jurul imaginilor, integrarea appleturilor .
  • HTML 4.0 (18 decembrie 1997): Introducere foi de stil , scripturi și cadre. A existat, de asemenea, o separare în strictă , cadru și tranziție . O versiune ușor corectată a fost publicată pe 24 aprilie 1998.
  • HTML 4.01 (24 decembrie 1999): Înlocuit HTML 4.0 cu multe remedieri minore. A fost standard mult timp până în 2014.
  • XHTML 1.0 (26 ianuarie 2000): HTML 4.01 reformulat folosind XML . O versiune revizuită a fost publicată la 1 august 2002.
  • XHTML 1.1 (31 mai 2001): După ce XHTML a fost împărțit în module, a fost definită o versiune strictă cu XHTML 1.1, în care setul de cadre și variantele de tranziție introduse cu HTML 4 au fost omise.
  • XHTML 2.0 (închis, 26 iulie 2006): Această versiune nu ar mai trebui să se bazeze pe HTML 4.01 și să introducă câteva elemente noi, cum ar fi: B. <nl>pentru listele de navigare. Separarea distincției și stilului ar trebui completată în această versiune. - W3C a încetat să lucreze la XHTML 2.0 în vara anului 2009 deoarece XHTML urma să fie înlocuit cu HTML5.
  • HTML5 (Recomandare, 28 octombrie 2014): a creat un nou vocabular bazat pe HTML 4.01 și XHTML 1.0. Specificația DOM aparținând HTML a fost, de asemenea, revizuită și extinsă.
  • HTML 5.1 (Recomandare, 1 noiembrie 2016)
  • HTML 5.2 (Recomandare, 14 decembrie 2017): versiunea actuală.

Structura HTML

Structura generală

Un document HTML cuprinde trei zone:

  1. document declarația de tip (DOCTYPE) chiar la începutul fișierului care conține folosite tipul documentului de definiție precizează (DTD), de exemplu. B. HTML 5,
  2. antetul HTML ( HEAD), care conține în principal informații tehnice sau documentare care de obicei nu sunt afișate în zona de afișare a browserului
  3. corpul HTML ( BODY), care conține informațiile care sunt de obicei văzute în zona de afișare a browserului.

Structura de bază a unui site web arată astfel:

<!DOCTYPE html>
<html>
  <head>
    <title>Titel der Webseite</title>
    <!-- weitere Kopfinformationen -->
    <!-- Kommentare werden im Browser nicht angezeigt. -->
  </head>
  <body>
    <p>Inhalt der Webseite</p>
  </body>
</html>

Cap HTML

În capul ( în engleză cap ) poate fi utilizat șapte elemente diferite:

title
se referă la titlul paginii, pe care majoritatea browserelor îl afișează în bara de titlu.
meta
poate conține o varietate de metadate . A se vedea elementul meta .
base
specifică fie un URI de bază, fie un cadru de bază .
link
este folosit pentru a specifica relații logice cu alte resurse. Cel mai adesea folosit pentru a include foi de stil .
script
încorporează codul într-un anumit limbaj de scriptare , în principal JavaScript .
style
conține informații despre stil, în principal declarații CSS .
object
integrează un fișier extern. Browserelor nu le este permis să afișeze astfel de obiecte în antetul documentului. Începând cu HTML5, eticheta obiect nu mai este permisă în antetul HTML.

Corp HTML

HTML Organismul conține informațiile reale pagina. HTML face distincție între elementele de bloc și cele în linie. Principala diferență este că primii își generează propriul bloc în ieșire, în care conținutul este găzduit, în timp ce elementele în linie nu întrerup fluxul de text. Pur și simplu, elementele de bloc au întotdeauna propriul lor paragraf. Cu toate acestea, cu ajutorul CSS este posibil să se afișeze elemente de bloc, cum ar fi un element inline și invers. În plus, toate elementele pot fi, de asemenea, marcate ca blocuri inline prin CSS , cu rezultatul că un astfel de element are proprietățile atât ale unui element de bloc, cât și ale unui element inline.

Un titlu de prima ordine este marcat după cum urmează:

<h1>Überschrift</h1>

h1reprezintă titlul 1 , deci caracterizează un titlu de primul (și în HTML cel mai înalt) nivel de schiță. De asemenea, este posibil h2să utilizați h6titluri de la al doilea la al șaselea nivel de structură.

Un hyperlink :

<a href="http://example.com/">Dies ist ein Verweis auf example.com</a>

Hiperlinkurile sunt referințe la alte resurse, mai ales documente HTML, care pot fi de obicei urmărite în browser cu un clic. Acest link ar putea fi redat astfel: Aceasta este o referință la example.com. Acest exemplu arată, de asemenea, că elementul link este un element inline și nu pornește o linie nouă.

Textul normal este specificat cu p(pentru paragraf ) în mod implicit , deși un text fără pacesta ar fi posibil fără probleme, dar este foarte recomandat, deoarece pe de o parte permite o separare între textul sursă și ieșire, iar pe de altă parte comanda este obligatorie pentru programarea CSS cel târziu este necesară.

Acesta este modul în care un text este redat în HTML:

<p>Ich bin ein Beispieltext</p>

Pentru logică, de exemplu, sunt disponibile elementele strongsau emcu care se pot distinge text puternic accentuat sau accentuat. În mod implicit (conform recomandării W3C) strong- și emelementele sunt redate cu caractere aldine sau cursive .

Descrierea structurală a textului face mai ușoară adaptarea redării la vizualizator, de exemplu, pentru a citi textul unei persoane cu deficiențe de vedere sau pentru a-l reda ca Braille .

Variante HTML

La elaborarea ultimei versiuni HTML 4, trebuie luat în considerare faptul că elementele și atributele sunt încă utilizate pentru prezentare în multe documente HTML. Rezultatul a fost în cele din urmă trei variante:

Strict

Această definiție a tipului de document (DTD) cuprinde inventarul principal al elementelor și atributelor. Cele mai multe dintre elementele și atributele pentru a influența prezentarea lipsesc, inclusiv elementele font, centerși uși atribute , cum ar fi bgcolor, alignși target. Foliile de stil ar trebui să își asume rolul în documentele stricte . Text și elemente care formează non-bloc-interiorul elementelor body, form, blockquoteși noscripttrebuie în mod normal să fie amplasat într - un element container, de exemplu , într - un pelement de .

Tranzitorie

Varianta de tranziție conține elemente și atribute mai vechi care permit, de asemenea, marcarea fizică a textului. Acest DTD este destinat să ofere autorilor web care nu sunt încă capabili să separe structurarea logică și prezentarea unul de altul de a scrie HTML conform standardului. În același timp, ar trebui să se asigure că site-urile web existente pot fi afișate în continuare de browserul web actual.

Set cadru

Pe lângă toate elementele variantei de tranziție, această variantă conține și elementele pentru generarea seturilor de cadre .

Tehnici suplimentare și dezvoltări ulterioare

Foi de stil în cascadă

De-a lungul anilor, HTML a fost extins pentru a include elemente care servesc proiectării vizuale a documentelor. Acest lucru a fost contrar ideii originale de independență a sistemului. O revenire la separarea structurii și a aspectului (mai bine: prezentare) a fost făcută prin definiția Foi de stil în cascadă (CSS). Aspectul sau prezentarea documentului trebuie specificat într-un fișier separat, așa-numita foaie de stil. Acest lucru îmbunătățește adaptabilitatea aspectului la dispozitivul de ieșire respectiv și la nevoile speciale ale utilizatorului, de exemplu un afișaj special pentru persoanele cu deficiențe de vedere. În prezent, suportul CSS al browserului este suficient pentru a implementa un design sofisticat.

În primii ani ai HTML până în anii 2000, nu s-a făcut nicio distincție strictă între aspect și fizica paginii. Proiectarea a fost implementată cu ajutorul atributelor de aspect cum ar fi color="Farbe"sau a etichetelor de aspect cum <font>, sau aspectul tabelelor a fost tableaproximativ specificat direct în zonă. Acest lucru este considerat acum depășit și neprofesionist. În plus, codul CSS poate fi, de asemenea, integrat într-o pagină fără un fișier exportat.

Un fișier CSS poate fi integrat în antetul HTML folosind elementul link:

<link rel="stylesheet" type="text/css" href="stylesheet.css">

HTML dinamic

Foarte devreme în istoria HTML, au fost inventate tehnologii suplimentare care permit schimbarea dinamică a documentelor HTML în timp ce acestea sunt afișate în browser. Cel mai comun este JavaScript . Astfel de documente interactive se numesc HTML dinamic . Aceste tehnici au fost dezvoltate independent una de cealaltă de diferiți producători de browsere, mai presus de toate Microsoft și Netscape . Ca rezultat, au existat probleme semnificative în implementarea tehnicilor între diferitele browsere. Toate browserele populare care activează JavaScript interpretează acum Document Object Model (DOM). Acest lucru face posibilă scrierea de scripturi executabile în toate browserele. Cu toate acestea, există încă diferențe în ceea ce privește suportul pentru standardul DOM.

XHTML

XHTML 1.0 a fost dezvoltat pe baza HTML 4.01 (SGML) . XHTML îndeplinește regulile sintactice ale XML, care sunt mai stricte decât SGML , dar cele trei variante ale DTD sunt identice semantic cu varianta DTD corespunzătoare a HTML 4.01.

HTML5

Avantajele respective ale SGML și XML ale versiunilor HTML anterioare au fost combinate în HTML5. Spre deosebire de versiunile HTML anterioare, nu mai există un DTD în HTML5.

Ajax

Cu tehnologia Ajax , JavaScript poate fi utilizat pentru a schimba și reîncărca în mod specific conținutul individual al browserului web deja încărcat, fără a fi nevoie să reîncărcați complet site-ul web. Datorită volumului mai mic de date, pe de o parte, este activat un răspuns mai rapid al serverului web și, pe de altă parte, pot fi simulate modurile de reacție ale aplicațiilor desktop.

Vezi si

literatură

  • Stefan Münz , Wolfgang Nefzger: manual HTML . Franzis-Verlag, Poing 2005, ISBN 3-7723-6654-6 .
  • Stefan Mintert (Ed.): XHTML, CSS & Co. Specificațiile W3C pentru publicarea web. Addison-Wesley, München 2003, ISBN 3-8273-1872-6 .
  • Mark Lubkowitz: Programarea și proiectarea site-urilor web - HTML, CSS, JavaScript, PHP, Perl, MySQL, SVG și fluxuri de știri, cu CD . Galileo Press, Bonn 2004, ISBN 3-89842-557-6 .
  • Elisabeth Robson, Eric Freeman: HTML și CSS din cap până în picioare . O'Reilly, Köln 2012, ISBN 978-3-86899-934-1
  • Stephan Heller: Workshop HTML5 și CSS3 . Implementarea profesională a aspectelor web - o introducere în dezvoltarea front-end . Ediția I, 2012; dpunkt.verlag, Heidelberg; ISBN 978-3-89864-807-3 .

Link-uri web

Commons : HTML  - colecție de imagini, videoclipuri și fișiere audio

Tutoriale

Wikibooks: Dezvoltarea site-urilor web  - Materiale de învățare și predare
Wikibooks: Manual Web Design  - Materiale de învățare și predare

Validare

Standarde mai vechi

Dovezi individuale

  1. W3C HTML 5 w3.org
  2. W3C HTML 4.01 w3.org
  3. W3C HTML 3.2 w3.org
  4. a b HTML 5.2. Recomandare. W3C, 14 decembrie 2017, accesat la 1 ianuarie 2018 .
  5. a b Simon Pieters: diferențe HTML 5 față de HTML 4. w3.org, 18 septembrie 2014, accesat la 1 octombrie 2014 (engleză): „HTML 5 înlocuiește aceste documente. [DOM2HTML] [HTML4] [XHTML1] "
  6. Marcare HTML / reguli / text în wiki SELFHTML
  7. Entități - tabel pentru umlauturi folosite frecvent, caractere speciale și simboluri la e-workers.de; accesat la 11 noiembrie 2018
  8. Tim Berners-Lee : Managementul informației: o propunere. Martie 1989, Accesat la 25 noiembrie 2014 .
  9. HTML , versiunea originală
  10. ^ David Raggett: O revizuire a formatului de document HTML +.
  11. ^ XHTML 2.0, schiță de lucru W3C
  12. XHTML 2 este întrerupt . Anunț Heise, 3 iulie 2009
  13. privind întreruperea dezvoltării anunțului XHTML 2 al W3C
  14. HTML5, un vocabular și API-uri asociate pentru HTML și XHTML. Recomandare. W3C, 28 octombrie 2014, accesat 27 noiembrie 2014 .
  15. Etichetă obiect HTML. Accesat la 26 iulie 2017 (engleză americană).