Arhivare pe termen lung

În cadrul arhivării pe termen lung ( LTA ) se definește ca achiziționarea, stocarea pe termen lung și păstrarea disponibilității permanente a informațiilor . Mai ales cu arhivarea pe termen lung a informațiilor disponibile digital ( păstrarea digitală ) apar noi probleme. Pentru conservarea resurselor digitale, „pe termen lung” nu înseamnă emiterea unei garanții timp de cinci sau cincizeci de ani, ci mai degrabă dezvoltarea responsabilă a strategiilor care pot face față schimbării constante cauzate de piața informației.

definiție

O definiție generală valabilă a termenului nu există încă. Deoarece arhivele păstrează întotdeauna materialul arhivistic „pentru eternitate”, termenul de arhivă pe termen lung este, de asemenea, un pleonasm și, conform contribuției lui Reinhard Altenhöner și Sabine Schrimpf, sugerează o stare statică. Prin urmare, ambii pledează pentru termenul „disponibilitate pe termen lung” (LZV).

Deoarece multe dintre problemele arhivării digitale pe termen lung apar doar după aproximativ zece ani, cum ar fi salturile de versiuni mari în software-ul utilizat, această valoare este utilizată ca limită pentru luarea în considerare a arhivării pe termen lung. În plus, arhivarea pe termen lung se poate distinge de backupul datelor .

Probleme

În timp ce obiectele fizice au fost păstrate și păstrate în arhive , muzee și biblioteci de mult timp, apar probleme complet noi cu publicațiile electronice . Dacă datele sunt stocate în formă analogică, calitatea datelor se deteriorează odată cu degradarea mediului, motiv pentru care accentul este pus pe conservarea mediului. Pe de altă parte, datele stocate digital pot fi reconstituite prin formatare adecvată în cazul unor mici erori în mediu, prin care se poate garanta o calitate constantă a datelor în ciuda deteriorării mediului. Dacă aceste erori în mediu devin prea mari, datele nu mai pot fi reconstituite complet și astfel se pierd iremediabil („uitarea digitală”). Prin urmare, când vine vorba de arhivarea pe termen lung a datelor digitale, accentul nu mai este pus pe păstrarea suportului, ci pe copierea acestuia în timp util înainte ca datele să fie pierdute. Deoarece mass-media (de ex., Bandă magnetică și DVD), formatele și dispozitivele de citire / scriere pentru stocarea digitală se schimbă rapid în timp, testarea regulată și continuitatea schimbărilor necesită o atenție constantă și o planificare pe termen lung. Formatele de proprietate și restricțiile privind drepturile de autor , printre altele, cauzează probleme la transferul pe sisteme noi .

Perioada de valabilitate a suportului suport

De exemplu, deși pergamentul și hârtia vechi pot fi păstrate timp de sute de ani dacă sunt depozitate corect, acest lucru nu se aplică noilor suporturi de stocare . Majoritatea publicațiilor din prima jumătate a secolului XX sunt tipărite pe hârtie degradată de coroziunea acidă . În lucrările tipărite și manuscrisele mai vechi, apar alte probleme: a fost folosită cerneala cu fiere de fier în fabricare, ingredientele cernelii pot fi folosite prin amestecuri dezechilibrate folosind coroziunea cernelii . Acest lucru se întâmplă atunci când cerneala este un surplus de acid galic sau prevalează surplusul de vitriol . Celuloza este atacat într - un mod similar cu coroziunea acidă, iar hârtia se poate rupe din cauza diferite și schimbătoare nivelurile de umiditate de-a lungul liniilor de litere.

Filmele analogice, fotografiile și benzile magnetice au, de asemenea, o perioadă de valabilitate limitată. Durata de viață a mediilor de stocare digitale, cum ar fi dischetele, hard disk-urile și CD-urile / DVD-urile arse, este chiar mai scurtă. Operatorii de date digitale își pierd datele structurate specifice mediului, fie din cauza influențelor asupra mediului (de exemplu, din cauza câmpurilor magnetice suficient de puternice în vecinătatea dischetelor și a benzilor magnetice), fie structura datelor este modificată atât de mult de influențele chimice sau fizice încât pot fi stocate mai multe date în ea sau datele deja scrise nu mai pot fi citite deloc (de exemplu dacă CD-ROM-urile au fost expuse la radiații UV pentru o perioadă de timp suficient de lungă). Adesea, lizibilitatea datelor eșuează doar deoarece dispozitivele și programele de citire adecvate nu mai sunt disponibile într-un moment mai târziu sau că standardele mai vechi de formatare a datelor nu mai pot fi interpretate sau că interfețele tehnice ale citirii foarte vechi a datelor dispozitivele nu mai sunt acceptate. Pentru a evita problemele menționate mai sus, poate avea sens să (re) convertim anumite date selectate, stocate electronic (înapoi) în formă non-electronică și să dăm permanent date importante în piatră - ca un echivalent modern al obiceiului cultural al strămoșii noștri, ca să spunem așa - gravăm într-o placă de nichel aproape indestructibilă folosind un fascicul de ioni.

O altă metodă de stocare permanentă a imaginilor și textelor în formă lizibilă analogică este arderea lor pe plăci de gresie folosind pigmenți ceramici . Proiectul Memoria omenirii (MOM) stochează imagini ale bunurilor culturale ale muzeului și produse culturale de zi cu zi pe plăci de gresie și le stochează în camere din muntele sărat al lui Hallstatt . Durabilitatea teoretică este dată de sute de mii de ani. Durabilitatea unui suport de date ceramice a fost dovedită de cel puțin 5000 de ani ( tablete cuneiforme ).

Perioada de valabilitate a unor suporturi de date la 20 ° C și 50% rel. Umiditate
mediu Termen de valabilitate preconizat Densitate de înregistrare (kbit / kg)
Panouri ceramice 5000 de ani (securizat), probabil câțiva 10.000 de ani
Panouri din gresie cu imprimare color ceramică arsă câțiva 100.000 de ani dacă sunt protejați împotriva eroziunii (presupus)
Tăblițe și tablouri din piatră câțiva 1.000 de ani (securizat) 1 × 10 −3 - 1
Placă de nichel câțiva 1.000 de ani (presupus)
Cărți și manuscrise realizate din acid liber de hârtie și
cu acid liber și fier liber cerneluri
mai mulți 100 de ani (securizat) 3 × 10 3 - 3 × 10 4
Cărți și manuscrise realizate din hârtie acidă
(în special lucrări tipărite din secolele XIX și începutul secolului XX)
70 - 100 de ani
Hârtie de ziar analog hârtiei tipografice acide / fără
Filme pe celuloid (azotat de celuloză) mai mult de 100 de ani (securizat), probabil până la 400 de ani
Filme pe triacetat de celuloză 44 ani (securizat)
Filme pe polietilen tereftalat (PET) Film color până la 150 de ani (presupus)

Film alb-negru până la 700 de ani (presupus)

Suport de stocare optic
(ars) b
  • CD-R : 5 - 10 ani
  • CD-RW : neclar, mai puțin decât DVD-RAM suspectat
  • DVD-ROM : neclar, mai puțin decât DVD-RAM suspectat
  • DVD ± R : neclar, mai puțin decât DVD-RAM suspectat
  • DVD ± RW : neclar, mai puțin decât DVD-RAM suspectat
  • DVD-RAM : 30 de ani (presupus)
  • DVD-R cu strat reflectorizant de aur de 24k: publicitate de până la 100 de ani
  • M-DISC (DVD, BD sau BDXL modificat): conform producătorului, până la 1.000 de ani
  • BD-R : până la 50 de ani (conform testelor de laborator)
  • CD: 4 × 10 8
  • DVD: 2 - 4 × 10 9
  • BD: 2-4 × 10 10
Suport de stocare optic (apăsat)
  • CD : în condiții ideale estimate la 50 - 80 de ani a
  • DVD : cel puțin 100 de ani (presupus)
  • BD : 82 - 85 de ani (presupus)
  • GlassMasterDisc (date gravate în sticlă): mai mult de 1.000 de ani (informații despre producător)
Dischete ca suport de arhivă (stocat) 10 - 30 de ani (în funcție de densitatea datelor?)
  • Disc HD de 5,25 ": 4,80 × 10 5
  • Disc DD de 3,5 ": 2,80 × 10 5
  • Disc HD de 3,5 ": 5,76 × 10 5
Unitățile de hard disk din mers 2 - 10 ani, în funcție de timpul de funcționare zilnic, în medie 5 ani
Hard disk-uri ca suport de arhivă (stocat) 10-30 de ani
Memorie flash (stocată) 2 - 10 ani
Benzi magnetice > 30 de ani (securizat)
Discul optic Magneto (disc MO) 30 - 50 de ani
Unitate amovibilă Iomega REV până la 30 de ani (presupus)
A La sfârșitul anilor 1980, plasticul predispus la ciuperci sau permeabil la oxigen sau cernelurile agresive au fost uneori utilizate pentru imprimare, ceea ce a redus stabilitatea datelor.
b Datorită faptului că DVD ± R-urile cu dublu strat ar putea cauza probleme de citire legate de sistem, sunt recomandate DVD-urile cu un singur strat (4,7 GB).

Schimbare rapidă a mediului și a sistemului

În special, în cazul informațiilor stocate digital, există problema suplimentară că datele nu mai sunt accesibile, deși suportul în sine a fost păstrat.

Citibilitatea mediului de stocare

Pentru a putea accesa informațiile stocate, suportul respectiv trebuie să poată fi citit (afară). Cu unele suporturi, cum ar fi tablete de piatră sau cărți, acest lucru poate fi posibil și pentru o persoană fără ajutoare. În cazul suporturilor stocate digital, este de obicei necesar un dispozitiv de citire adecvat, de multe ori o unitate. Dacă dispozitivele de citire nu mai sunt disponibile, de exemplu din cauza schimbărilor tehnologice, datele nu mai pot fi citite sau doar cu dificultate. Un exemplu este formatele de bandă învechite .

Formate de date învechite

Chiar dacă mediul de stocare a fost păstrat și este încă lizibil, poate fi imposibil să accesați datele stocate. Deoarece datele stocate digital nu sunt accesibile imediat, ci sunt codificate digital și structurate într-o manieră specifică mediului, este posibilă citirea acestor date numai dacă sunt disponibile un program și un sistem de operare care „înțeleg” conținutul unui fișier. Deoarece multe sisteme de operare și programe utilizează propriul proces (proprietar) pentru a codifica datele, lizibilitatea datelor nu mai poate fi garantată de îndată ce un sistem de operare sau un program nu este întreținut în mod continuu. Această problemă este agravată de politica multor producători de software de a publica noi versiuni de programe cu formate de stocare a datelor modificate, pe care formate mai vechi de stocare a datelor din același program nu le mai pot utiliza pe deplin.

Alte restricții

Sistemele proprietare și restricțiile privind drepturile de autor fac mai dificilă copierea și migrarea datelor, care sunt necesare pentru arhivarea pe termen lung, deoarece pașii necesari nu sunt cunoscuți sau permiși. Introducerea gestionării drepturilor digitale (DRM) în special va exacerba problema în viitor. Un astfel de set de reguli pentru date sau documente digitale este necesar deoarece, la fel ca în cazul datelor convenționale, problemele legate de drepturile de autor trebuie clarificate înainte de a putea fi arhivate. Diferența dintre datele convenționale și documentele electronice rezultă din faptul că, în acest din urmă caz, copia și originalul sunt practic indistincte. Când migrați documente în special, este necesar să faceți copii și, dacă este necesar, să modificați documentele originale. Prin urmare, consimțământul autorului pentru astfel de măsuri trebuie obținut în prealabil. Copiile suplimentare care sunt înmânate cititorilor de documente trebuie să fie remunerate corespunzător și, dacă este necesar, trebuie să fie corelate cu notificări de blocare dacă nu li se permite să fie transmise gratuit.

Găsirea informațiilor

Nu este suficient să copiați doar datele originale: trebuie să fie posibil să le regăsiți pe noul suport. Prin urmare, anumite date suplimentare privind structura și conținutul datelor originale, așa-numitele metadate , trebuie introduse în cataloage, baze de date sau alte mijloace de identificare pentru a fi disponibile pentru citirea sau căutarea ulterioară a datelor.

Coerența datelor

O problemă adesea trecută cu vederea atât cu arhivarea pe termen lung, cât și cu arhivarea pe termen scurt este verificarea faptului că datele sunt lipsite de erori. Datele pot fi modificate intenționat, dar pot fi, de asemenea, modificate neobservate de erori de sistem.

O cale de ieșire aici ar putea fi stocarea distribuită în diferite locații din diferite organizații și protecția cu sume de verificare criptografice stocate distribuite . Aceasta va inter alia. practicat cu soluția open source LOCKSS . În Germania există și un proiect german ( LuKII ) care îndeplinește această cerință.

procedură

Practic, metodele de migrare / conversie și emulare pot fi distinse în arhivarea electronică .

Prin utilizarea unor standarde deschise , cum ar fi formate grafice ( TIFF , PNG , JFIF ) sau formate de documente gratuite ( XML , PDF / A , OpenDocument ), care sunt considerate a fi relativ de lungă durată și a căror structură este cunoscută public, ciclurile de după care a salvat datele trebuie reformatate mai mult timp. Probabilitatea ca în continuare să existe sisteme și programe care să poată citi astfel de date peste câțiva ani este, prin urmare, semnificativ mai mare.

Pentru a preveni pierderea datelor din cauza îmbătrânirii purtătorilor de date, datele trebuie copiate în mod regulat către noii suporturi de date în perioada de securitate garantată a unui suport. Acest lucru înseamnă că puteți trece și la un nou format de operator, de îndată ce cel utilizat anterior a devenit învechit din cauza dezvoltărilor tehnice ulterioare .

Cu toate acestea, costurile ridicate care decurg din această menținere a stocurilor de date înseamnă că numai cele mai importante date pot fi păstrate în acest mod. Fluxul de date și metadate de astăzi, cauzat nu în ultimul rând de utilizarea în continuă creștere a sistemelor digitale de procesare a datelor, agravează în continuare problema celei mai bune clasificări posibile a volumelor de date relevante pentru stocare. Proporția datelor stocate pe termen lung va fi neapărat relativ mică, ceea ce impune cerințe tehnice ridicate și alte cerințe specifice subiectului în ceea ce privește selectarea informațiilor care vor fi susținute în ceea ce privește tehnologia datelor. O problemă suplimentară apare din separarea relației dintre volumul de date și lățimea de bandă a datelor. Volumul crește semnificativ mai rapid decât lățimea de bandă disponibilă pentru a transfera date de pe un mediu pe altul. Acest lucru nu afectează doar datele guvernamentale și comerciale. Și în sectorul privat, mass-media convențională, care poate fi stocată adesea mult timp, este înlocuită cu suporturi digitale mai ușor de gestionat (fotografii și negative cu imagini digitale pe un CD-ROM).

Bibliotecile și arhivele de copiere a depozitelor sunt responsabile pentru arhivarea pe termen lung în Germania .

Vezi si

literatură

Link-uri web

Wikibooks: Arhivare pe termen lung  - materiale de învățare și predare

Dovezi individuale

  1. Ute Schwens, Hans Liegmann: Arhivarea pe termen lung a resurselor digitale . În: Rainer Kuhlen, Thomas Seeger, Dietmar Strauch (eds.): Bazele informațiilor și documentării practice. Ediția a V-a, complet revizuită. München: Saur, 2004, p. 567.
  2. Reinhard Altenhöner, Sabine Schrimpf: Conservarea și disponibilitatea pe termen lung a resurselor digitale: strategie, organizare și tehnici . În: Rolf Griebel, Hildegard Schäffler și Konstanze Söllner (eds.): Managementul bibliotecii Praxishandbuch . De Gruyter Saur, Berlin 2014, ISBN 978-3-11-030293-6 , pp. 850-872 .
  3. ^ Lothar Schmitz, Uwe M Borghoff, Peter Rödig, Jan Scheffczyk: Arhivarea pe termen lung . În: Spectrum de informatică . bandă 28 , nr. 6 , 1 decembrie 2005, ISSN  1432-122X , p. 489 , doi : 10.1007 / s00287-005-0039-7 .
  4. Arhivați DVD-urile în testul pe termen lung -c't-Archiv, 16/2008, pagina 116. (Nu mai este disponibil online.) În: heise.de. 16 august 2011, arhivat din original la 23 iulie 2008 ; Adus la 20 februarie 2015 .
  5. mp: un standard uniform pentru inundația de date digitale. 10 martie 2008, accesat la 27 octombrie 2012 .
  6. a b c Michael W. Gilbert: Digital Media Life Expectancy and Care. (Nu mai este disponibil online.) University of Massachusetts Amherst, 1998, arhivat din original la 22 decembrie 2003 ; accesat pe 4 ianuarie 2011 .
  7. Bit Rot. Software Preservation Society, 7 mai 2009, accesat la 4 ianuarie 2011 .
  8. Studiu Google despre cauza defectării unităților de hard disk. În: heise.de. 16 februarie 2007, accesat la 20 februarie 2015 .
  9. Studiu Google privind durabilitatea hard disk-urilor în funcționare continuă ( Memento din 13 februarie 2009 în Arhiva Internet ) (PDF; 247 kB): Secțiunea 3.1, Figura 2 (engleză)
  10. UNC: Hard disk-uri și memorie flash: distracție cu potențial de risc. În: speicherguide.de. 29 iunie 2006, arhivat din original la 24 septembrie 2015 ; Adus la 17 septembrie 2015 .
  11. ↑ Perioada de valabilitate a mediilor de stocare: unde datele sunt corecte. În: netzwelt.de. 22 aprilie 2007, accesat la 20 februarie 2015 .
  12. ^ Tom Coughlin: Păstrarea datelor pentru o lungă perioadă de timp. Accesat la 3 ianuarie 2021 .
  13. Copiere de rezervă a datelor ›Wiki› ubuntuusers.de. Adus la 3 ianuarie 2021 .
  14. Henrik Stamm: tehnologia MO. Institute for Computer Science de la Universitatea Humboldt din Berlin, 26 mai 2001, accesat la 17 septembrie 2015 .
  15. Hartmut Gieselmann: DVD-uri în testul pe termen lung - c't. În: heise.de. 21 iulie 2008, accesat la 20 februarie 2015 .
  16. Uwe M. Borg Hoff u a.: Arhivare pe termen lung . Metode de conservare a documentelor digitale. dpunkt.-Verl., Heidelberg 2003, p. 21.
  17. Frank Dickmann: Arhivarea pe termen lung a datelor de cercetare: Cum faceți față peta și exabytes? În: Deutsches Ärzteblatt Supliment: Practică . bandă 108 , nr. 41 , 2011, p. 6-8 ( uni-goettingen.de [accesat la 24 martie 2020]).
  18. Heike Neuroth, Stefan Strathmann, Achim Oßwald, Regine Scheffel, Jens Klump, Jens Ludwig (eds.): Arhivarea pe termen lung a datelor de cercetare. Un inventar . Verlag Werner Hülsbusch, Universitätsverlag Göttingen, Boizenburg 2012, ISBN 978-3-86488-008-7 , p. 16 , urn : nbn: de: hbz: 79pbc-opus-4204 ( th-koeln.de [PDF]).
  19. Asko Lehmuskallio, Edgar Gómez Cruz: De ce practici vizuale materiale? În: Fotografie digitală și viața de zi cu zi: studii empirice asupra practicilor materiale vizuale . Routledge, 2016, ISBN 978-1-317-44778-8 , pp. 1 .
  20. Natascha Schumann: Introducere în arhivarea digitală pe termen lung . Scivero Verl., 2012, ISBN 978-3-944417-00-4 , pp. 46 ( ssoar.info [accesat la 24 martie 2020]).