Limbaj de marcare hipertext
HTML (Hypertext Markup Language) | |
---|---|
Extensie fișier : |
.html, .htm
|
Tip MIME : | text / html |
Dezvoltat de: | World Wide Web Consortium (W3C) |
Lansare inițială: | 1992 |
Versiune curentă: | 5.2 (începând cu 14 decembrie 2017) |
Tip: | Limbaj de marcare |
Extins la: | XHTML , HTML5 |
Standard (e) : |
ISO / IEC 15445
W3C HTML 5 W3C HTML 4.01 W3C HTML 3.2 |
Site web : | www.w3.org/html |
Hypertext Markup Language ( HTML , limba engleză pentru Hypertext -Auszeichnungssprache ) este un text pe bază de limbaj de markup pentru structurarea documentelor electronice , cum ar fi textul cu hyperlink - uri , imagini și alte tipuri de conținut. Documentele HTML sunt baza World Wide Web și sunt afișate de browserele web . Pe lângă conținutul afișat de browser, fișierele HTML pot conține informații suplimentare sub formă de metainformații , de ex. B. despre cele folosite în textLimbi , autor sau conținutul rezumat al textului.
HTML este dezvoltat în continuare de World Wide Web Consortium (W3C) și de Web Hypertext Application Technology Working Group (WHATWG). Versiunea actuală este HTML 5.2 din 14 decembrie 2017 , care este deja acceptată de multe browsere web actuale și alte motoare de aspect . Extensible Hypertext Markup Language (XHTML) este , de asemenea , fiind înlocuit cu HTML5.
HTML este utilizat ca limbaj de marcare pentru a structura semantic un text , dar nu pentru a-l forma. Reprezentarea vizuală nu face parte din specificațiile HTML și este determinată de browserul web și paginile master, cum ar fi CSS . Excepție fac elementele legate de prezentare marcate ca fiind depășite ( limba engleză este depreciată ).
Apariția
Înainte de dezvoltarea World Wide Web și a componentelor sale, inclusiv HTML, nu era posibilă schimbul de documente electronic cu ușurință, rapiditate și structurare între mai multe persoane și conectarea lor eficientă între ele. În plus față de protocoalele de transmisie, a fost necesar un limbaj de markup ușor de înțeles. Exact aici se află punctul de plecare al HTML. Pentru a împărtăși rezultatele cercetării cu alți angajați ai Organizației Europene pentru Cercetare Nucleară (CERN) și pentru a le face accesibile din cele două locații din Franța și Elveția, un proiect a fost înființat la CERN în 1989 pentru a găsi o soluție la această problemă. La 3 noiembrie 1992, a apărut prima versiune a specificației HTML.
sintaxă
Textului i se oferă o structură prin marcarea părților de text.
Distincția se face folosind elemente standardizate (SGML) . Majoritatea acestor elemente HTML sunt marcate de o pereche de etichete, adică o etichetă de început și o etichetă de final. O zi de început începe întotdeauna cu semnul <
. Acesta este urmat de numele elementului (de exemplu, p
pentru un paragraf sau h1
pentru un antet de prim ordin) și, opțional, de o listă a atributelor sale (de exemplu, class="warning"
sau id="warning"
). Ziua de >
început este închisă cu una . O etichetă de final constă din caractere </
, numele elementului și cel care termină >
. Etichetele de început și de sfârșit care aparțin împreună, împreună cu conținutul dintre ele, formează un element al specificației generale SGML . Aceste elemente pot fi imbricate conform regulilor specificate într-o definiție a tipului de document (DTD):
<p>Ein Textabsatz, der ein <em>betontes</em> Wort enthält.</p>
Anumite elemente nu trebuie notate în mod explicit. Conform regulii SGML „OMITTAG”, eticheta finală poate lipsi pentru unele elemente (de exemplu, </p>
sau </li>
). În plus, nici o diferență (z. B. pentru nume de elemente și atribute sunt sensibile la caz <ul>
, <UL>
, <uL>
). Pentru comparație: în XHTML aceste reguli sunt scrise mai strict.
În plus față de elementele cu etichete de început și de sfârșit, există și elemente goale în HTML, cum ar fi întreruperile de linie ( br
) sau imaginile ( img
).
Eine Textzeile,<br>die hier fortgesetzt wird.
<img src="E-Mail-Button.jpg" alt="E-Mail">
Este vorba de HTML descriptiv (engleză descriptiv ), nu procedurală (engleza procedurală ) și orientată spre prezentare (engleză prezentaționale ) markup , chiar dacă HTML a fost utilizat în versiunile anterioare ale acestui. Elementele HTML nu sunt informații despre prezentare care îi spun browserului web cum să formateze vizual textul . Mai degrabă, elementele sunt o etichetă structurantă care poate fi utilizată pentru a atribui un sens zonelor de text, de ex. B.
pentru un antet, pentru un paragraf de text și pentru text accentuat. Modul în care această semnificație este transmisă în cele din urmă utilizatorului (în cazul unui titlu, de exemplu, prin font mărit, bold ) depinde inițial de browserul web și depinde de mediul de ieșire. Deși documentele HTML sunt de obicei afișate pe ecranele computerului , ele pot fi de asemenea afișate pe alte suporturi, de exemplu pe hârtie sau folosind ieșirea vocală . Șabloanele în format CSS sunt potrivite pentru influențarea prezentării unui document HTML în diferite medii.
<h1>…</h1>
<p>…</p>
<em>…</em>
Prin urmare, elementele si atributele de prezentare , cum ar fi , și sunt considerate de actualitate (limba engleză depreciată ) și trebuie evitată în conformitate cu opinia generală; acestea nu ar trebui să mai fie utilizate în software-ul nou dezvoltat și ar trebui înlocuite atunci când software-ul generator de documente este revizuit.
<font>…</font>
<u>…</u>
noshade
Citirea în textul sursă și prelucrarea informațiilor existente este, de asemenea, denumită analiză în terminologia tehnică , iar pregătirea pentru mediul de ieșire ca redare . Limbajul HTML descrie modul în care browserul (sau un alt program, cum ar fi un editor de text ) trebuie să „înțeleagă” marcajele din text, nu cum le convertește apoi în afișaj. Așa spune, totuși, că a urmat un titlu, dar în care nu există dimensiunea fontului sau stilul fontului , acesta trebuie prezentat - aici s-au naturalizat doar unele valori implicite obișnuite, dar o parte din specificațiile HTML nu sunt.
<h1>
Set de caractere
Setul de caractere standard, bazat inițial pe ASCII pe 7 biți , a fost extins pentru a include numeroase caractere speciale în primele zile ale WWW și codificat ca entitate HTML. Suportul seturilor de caractere universale pentru toate limbile comune din întreaga lume a necesitat sprijinul UTF (Unicode), care este acum implementat în toate browserele comune. HTML este, prin urmare, conceput pentru portabilitate independentă de platformă, cu condiția ca acesta să fie acceptat de randatorul HTML utilizat. Alegerea setului de caractere care stau la baza pentru un document web se face în elementele meta din antetul fișierului, apoi browserul se adaptează la acesta.
Creatorii de site-uri web a căror tastatură poate să nu furnizeze direct toate caracterele, cum ar fi umlauturile germane , pot codifica caractere speciale în mai multe moduri ; o umlaut A („ä”) poate fi fie codificată ca entitate HTML ( ä
), ca Unicode zecimal ( ä
) sau ca Unicode hexazecimal ( ä
), consultați specificațiile punctului de cod Unicode # din documente . Mulți editori de site-uri web complexe rezolvă automat caractere speciale atunci când textul sursă este codat.
În rezoluția în liniile de adresă ( URL-uri ) se va întâmpla invers, aici nu sunt caracterele direct acceptate sunt după metoda MIME în codificarea caracterelor ASCII, astfel. B. %20
pentru un spațiu dacă apare, de exemplu, într-un nume de fișier și trebuie să fie diferit de spațiul obișnuit de la sfârșitul legăturii .
Tipul limbii
HTML este un limbaj de marcare și ca atare este de obicei diferențiat de limbajele de programare (a se vedea secțiunea Sistematică externă: Clasificarea ca limbaj de programare sau format de date în articolul despre limbaje de marcare). Un lucru comun cu majoritatea limbajelor de programare este că nu este necesar niciun software special (a se vedea și lista editorilor HTML ) pentru editarea documentelor sursă , dar orice editor de text este suficient.
Un concept similar (descriere logică) ca în spatele HTML se află în spatele sistemului de tipografiere TeX / LaTeX , care, spre deosebire de HTML, vizează ieșirea imprimantei pe hârtie.
Versiuni
HTML a fost propus pentru prima dată pe 13 martie 1989 de Tim Berners-Lee la CERN din Geneva.
- HTML (fără numărul versiunii, 3 noiembrie 1992): versiunea originală care se bazează doar pe text.
- HTML (fără numărul de versiune, 30 aprilie 1993): În plus față de text, integrarea imaginii a fost adăugată în plus față de atribute precum afișajul aldin sau cursiv.
- HTML + (noiembrie 1993) Îmbunătățiri planificate care au fost încorporate în versiunile ulterioare, dar care nu au fost adoptate niciodată ca HTML +.
- HTML 2.0 (noiembrie 1995): Versiunea definită cu RFC 1866 a condus inter alia. Tehnologia formularelor. Statutul acestui standard este „ISTORIC”. Predecesorii sunt, de asemenea, depășiți.
- HTML 3.0 : Nu a fost publicat deoarece a fost depășit cu introducerea browserului Netscape în versiunea 3 înainte de publicarea planificată.
- HTML 3.2 (14 ianuarie 1997): numeroase caracteristici noi, cum ar fi tabele, fluxul de text în jurul imaginilor, integrarea appleturilor .
- HTML 4.0 (18 decembrie 1997): Introducere foi de stil , scripturi și cadre. A existat, de asemenea, o separare în strictă , cadru și tranziție . O versiune ușor corectată a fost publicată pe 24 aprilie 1998.
- HTML 4.01 (24 decembrie 1999): Înlocuit HTML 4.0 cu multe remedieri minore. A fost standard mult timp până în 2014.
- XHTML 1.0 (26 ianuarie 2000): HTML 4.01 reformulat folosind XML . O versiune revizuită a fost publicată la 1 august 2002.
- XHTML 1.1 (31 mai 2001): După ce XHTML a fost împărțit în module, a fost definită o versiune strictă cu XHTML 1.1, în care setul de cadre și variantele de tranziție introduse cu HTML 4 au fost omise.
-
XHTML 2.0 (închis, 26 iulie 2006): Această versiune nu ar mai trebui să se bazeze pe HTML 4.01 și să introducă câteva elemente noi, cum ar fi: B.
<nl>
pentru listele de navigare. Separarea distincției și stilului ar trebui completată în această versiune. - W3C a încetat să lucreze la XHTML 2.0 în vara anului 2009 deoarece XHTML urma să fie înlocuit cu HTML5. - HTML5 (Recomandare, 28 octombrie 2014): a creat un nou vocabular bazat pe HTML 4.01 și XHTML 1.0. Specificația DOM aparținând HTML a fost, de asemenea, revizuită și extinsă.
- HTML 5.1 (Recomandare, 1 noiembrie 2016)
- HTML 5.2 (Recomandare, 14 decembrie 2017): versiunea actuală.
Structura HTML
Structura generală
Un document HTML cuprinde trei zone:
- document declarația de tip (DOCTYPE) chiar la începutul fișierului care conține folosite tipul documentului de definiție precizează (DTD), de exemplu. B. HTML 5,
- antetul HTML (
HEAD
), care conține în principal informații tehnice sau documentare care de obicei nu sunt afișate în zona de afișare a browserului - corpul HTML (
BODY
), care conține informațiile care sunt de obicei văzute în zona de afișare a browserului.
Structura de bază a unui site web arată astfel:
<!DOCTYPE html>
<html>
<head>
<title>Titel der Webseite</title>
<!-- weitere Kopfinformationen -->
<!-- Kommentare werden im Browser nicht angezeigt. -->
</head>
<body>
<p>Inhalt der Webseite</p>
</body>
</html>
Cap HTML
În capul ( în engleză cap ) poate fi utilizat șapte elemente diferite:
title
- se referă la titlul paginii, pe care majoritatea browserelor îl afișează în bara de titlu.
meta
- poate conține o varietate de metadate . A se vedea elementul meta .
base
- specifică fie un URI de bază, fie un cadru de bază .
link
- este folosit pentru a specifica relații logice cu alte resurse. Cel mai adesea folosit pentru a include foi de stil .
script
- încorporează codul într-un anumit limbaj de scriptare , în principal JavaScript .
style
- conține informații despre stil, în principal declarații CSS .
object
- integrează un fișier extern. Browserelor nu le este permis să afișeze astfel de obiecte în antetul documentului. Începând cu HTML5, eticheta obiect nu mai este permisă în antetul HTML.
Corp HTML
HTML Organismul conține informațiile reale pagina. HTML face distincție între elementele de bloc și cele în linie. Principala diferență este că primii își generează propriul bloc în ieșire, în care conținutul este găzduit, în timp ce elementele în linie nu întrerup fluxul de text. Pur și simplu, elementele de bloc au întotdeauna propriul lor paragraf. Cu toate acestea, cu ajutorul CSS este posibil să se afișeze elemente de bloc, cum ar fi un element inline și invers. În plus, toate elementele pot fi, de asemenea, marcate ca blocuri inline prin CSS , cu rezultatul că un astfel de element are proprietățile atât ale unui element de bloc, cât și ale unui element inline.
Un titlu de prima ordine este marcat după cum urmează:
<h1>Überschrift</h1>
h1
reprezintă titlul 1 , deci caracterizează un titlu de primul (și în HTML cel mai înalt) nivel de schiță. De asemenea, este posibil h2
să utilizați h6
titluri de la al doilea la al șaselea nivel de structură.
Un hyperlink :
<a href="http://example.com/">Dies ist ein Verweis auf example.com</a>
Hiperlinkurile sunt referințe la alte resurse, mai ales documente HTML, care pot fi de obicei urmărite în browser cu un clic. Acest link ar putea fi redat astfel: Aceasta este o referință la example.com. Acest exemplu arată, de asemenea, că elementul link este un element inline și nu pornește o linie nouă.
Textul normal este specificat cu p
(pentru paragraf ) în mod implicit , deși un text fără p
acesta ar fi posibil fără probleme, dar este foarte recomandat, deoarece pe de o parte permite o separare între textul sursă și ieșire, iar pe de altă parte comanda este obligatorie pentru programarea CSS cel târziu este necesară.
Acesta este modul în care un text este redat în HTML:
<p>Ich bin ein Beispieltext</p>
Pentru logică, de exemplu, sunt disponibile elementele strong
sau em
cu care se pot distinge text puternic accentuat sau accentuat. În mod implicit (conform recomandării W3C) strong
- și em
elementele sunt redate cu caractere aldine sau cursive .
Descrierea structurală a textului face mai ușoară adaptarea redării la vizualizator, de exemplu, pentru a citi textul unei persoane cu deficiențe de vedere sau pentru a-l reda ca Braille .
Variante HTML
La elaborarea ultimei versiuni HTML 4, trebuie luat în considerare faptul că elementele și atributele sunt încă utilizate pentru prezentare în multe documente HTML. Rezultatul a fost în cele din urmă trei variante:
Strict
Această definiție a tipului de document (DTD) cuprinde inventarul principal al elementelor și atributelor. Cele mai multe dintre elementele și atributele pentru a influența prezentarea lipsesc, inclusiv elementele font
, center
și u
și atribute , cum ar fi bgcolor
, align
și target
. Foliile de stil ar trebui să își asume rolul în documentele stricte . Text și elemente care formează non-bloc-interiorul elementelor body
, form
, blockquote
și noscript
trebuie în mod normal să fie amplasat într - un element container, de exemplu , într - un p
element de .
Tranzitorie
Varianta de tranziție conține elemente și atribute mai vechi care permit, de asemenea, marcarea fizică a textului. Acest DTD este destinat să ofere autorilor web care nu sunt încă capabili să separe structurarea logică și prezentarea unul de altul de a scrie HTML conform standardului. În același timp, ar trebui să se asigure că site-urile web existente pot fi afișate în continuare de browserul web actual.
Set cadru
Pe lângă toate elementele variantei de tranziție, această variantă conține și elementele pentru generarea seturilor de cadre .
Tehnici suplimentare și dezvoltări ulterioare
Foi de stil în cascadă
De-a lungul anilor, HTML a fost extins pentru a include elemente care servesc proiectării vizuale a documentelor. Acest lucru a fost contrar ideii originale de independență a sistemului. O revenire la separarea structurii și a aspectului (mai bine: prezentare) a fost făcută prin definiția Foi de stil în cascadă (CSS). Aspectul sau prezentarea documentului trebuie specificat într-un fișier separat, așa-numita foaie de stil. Acest lucru îmbunătățește adaptabilitatea aspectului la dispozitivul de ieșire respectiv și la nevoile speciale ale utilizatorului, de exemplu un afișaj special pentru persoanele cu deficiențe de vedere. În prezent, suportul CSS al browserului este suficient pentru a implementa un design sofisticat.
În primii ani ai HTML până în anii 2000, nu s-a făcut nicio distincție strictă între aspect și fizica paginii. Proiectarea a fost implementată cu ajutorul atributelor de aspect cum ar fi color="Farbe"
sau a etichetelor de aspect cum <font>
, sau aspectul tabelelor a fost table
aproximativ specificat direct în zonă. Acest lucru este considerat acum depășit și neprofesionist. În plus, codul CSS poate fi, de asemenea, integrat într-o pagină fără un fișier exportat.
Un fișier CSS poate fi integrat în antetul HTML folosind elementul link:
<link rel="stylesheet" type="text/css" href="stylesheet.css">
HTML dinamic
Foarte devreme în istoria HTML, au fost inventate tehnologii suplimentare care permit schimbarea dinamică a documentelor HTML în timp ce acestea sunt afișate în browser. Cel mai comun este JavaScript . Astfel de documente interactive se numesc HTML dinamic . Aceste tehnici au fost dezvoltate independent una de cealaltă de diferiți producători de browsere, mai presus de toate Microsoft și Netscape . Ca rezultat, au existat probleme semnificative în implementarea tehnicilor între diferitele browsere. Toate browserele populare care activează JavaScript interpretează acum Document Object Model (DOM). Acest lucru face posibilă scrierea de scripturi executabile în toate browserele. Cu toate acestea, există încă diferențe în ceea ce privește suportul pentru standardul DOM.
XHTML
XHTML 1.0 a fost dezvoltat pe baza HTML 4.01 (SGML) . XHTML îndeplinește regulile sintactice ale XML, care sunt mai stricte decât SGML , dar cele trei variante ale DTD sunt identice semantic cu varianta DTD corespunzătoare a HTML 4.01.
HTML5
Avantajele respective ale SGML și XML ale versiunilor HTML anterioare au fost combinate în HTML5. Spre deosebire de versiunile HTML anterioare, nu mai există un DTD în HTML5.
Ajax
Cu tehnologia Ajax , JavaScript poate fi utilizat pentru a schimba și reîncărca în mod specific conținutul individual al browserului web deja încărcat, fără a fi nevoie să reîncărcați complet site-ul web. Datorită volumului mai mic de date, pe de o parte, este activat un răspuns mai rapid al serverului web și, pe de altă parte, pot fi simulate modurile de reacție ale aplicațiilor desktop.
Vezi si
literatură
- Stefan Münz , Wolfgang Nefzger: manual HTML . Franzis-Verlag, Poing 2005, ISBN 3-7723-6654-6 .
- Stefan Mintert (Ed.): XHTML, CSS & Co. Specificațiile W3C pentru publicarea web. Addison-Wesley, München 2003, ISBN 3-8273-1872-6 .
- Mark Lubkowitz: Programarea și proiectarea site-urilor web - HTML, CSS, JavaScript, PHP, Perl, MySQL, SVG și fluxuri de știri, cu CD . Galileo Press, Bonn 2004, ISBN 3-89842-557-6 .
- Elisabeth Robson, Eric Freeman: HTML și CSS din cap până în picioare . O'Reilly, Köln 2012, ISBN 978-3-86899-934-1
- Stephan Heller: Workshop HTML5 și CSS3 . Implementarea profesională a aspectelor web - o introducere în dezvoltarea front-end . Ediția I, 2012; dpunkt.verlag, Heidelberg; ISBN 978-3-89864-807-3 .
Link-uri web
- HTML5, un vocabular și API-uri asociate pentru HTML și XHTML. Recomandarea W3C 28 octombrie 2014. W3C, 28 octombrie 2014, accesat la 28 octombrie 2014 (engleză, standard HTML actual).
- Diferențe HTML5 față de HTML4. Proiect de lucru W3C 18 septembrie 2014. W3C, 18 septembrie 2014, accesat 25 septembrie 2014 .
- Grup de lucru HTML. W3C, 12 iunie 2014, accesat la 26 septembrie 2014 .
- HTML. SELFHTML -Wiki, 6 septembrie 2014, accesat la 25 septembrie 2014 (prezentare detaliată împreună cu CSS).
- Câteva idei timpurii pentru HTML. W3C, 9 ianuarie 2003, accesat la 25 noiembrie 2014 (cu privire la originea HTML).
Tutoriale
Validare
- Lista de verificare a standardelor web
- Validator W3C pentru verificarea corectitudinii sintactice a unui document HTML
- Diverse instrumente utile de testare , SiteCheck (engleză)
- Validator WDG pentru verificarea unui site web complet
Standarde mai vechi
- Hypertext Markup Language 2.0. W3C, 22 septembrie 1995, accesat la 25 septembrie 2014 .
- Specificații de referință HTML 3.2. Recomandarea W3C 14-ianuarie-1997. W3C, 14 ianuarie 1997, accesat la 25 septembrie 2014 .
- Specificație HTML 4.0. Recomandarea W3C, revizuită la 24 aprilie 1998. W3C, 24 aprilie 1998, accesat la 25 septembrie 2014 .
- Specificații HTML 4.01. Recomandarea W3C 24 decembrie 1999. W3C, 24 decembrie 1999, accesat la 25 septembrie 2014 .
- Specificație HTML 4.01. Traducere germană. ediția W3.de, 24 decembrie 1999, accesată la 25 septembrie 2014 .
Dovezi individuale
- ↑ W3C HTML 5 w3.org
- ↑ W3C HTML 4.01 w3.org
- ↑ W3C HTML 3.2 w3.org
- ↑ a b HTML 5.2. Recomandare. W3C, 14 decembrie 2017, accesat la 1 ianuarie 2018 .
- ↑ a b Simon Pieters: diferențe HTML 5 față de HTML 4. w3.org, 18 septembrie 2014, accesat la 1 octombrie 2014 (engleză): „HTML 5 înlocuiește aceste documente. [DOM2HTML] [HTML4] [XHTML1] "
- ↑ Marcare HTML / reguli / text în wiki SELFHTML
- ↑ Entități - tabel pentru umlauturi folosite frecvent, caractere speciale și simboluri la e-workers.de; accesat la 11 noiembrie 2018
- ↑ Tim Berners-Lee : Managementul informației: o propunere. Martie 1989, Accesat la 25 noiembrie 2014 .
- ↑ HTML , versiunea originală
- ^ David Raggett: O revizuire a formatului de document HTML +.
- ^ XHTML 2.0, schiță de lucru W3C
- ↑ XHTML 2 este întrerupt . Anunț Heise, 3 iulie 2009
- ↑ privind întreruperea dezvoltării anunțului XHTML 2 al W3C
- ↑ HTML5, un vocabular și API-uri asociate pentru HTML și XHTML. Recomandare. W3C, 28 octombrie 2014, accesat 27 noiembrie 2014 .
- ↑ Etichetă obiect HTML. Accesat la 26 iulie 2017 (engleză americană).