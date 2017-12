Dedičstvo národa cez Google

Slovenská národná knižnica chce do dva a pol roka zdigitalizovať väčšinu písomného dedičstva Slovákov.

17. máj 2013 o 21:53 Juraj Javorský

Ak by ste si dnes chceli prečítať Slávy dceru v podobe, v akej ju napísal Ján Kollár, musíte sadnúť do auta a zájsť do Martina, kde sídli Slovenská národná knižnica. V miestnej študovni dostanete biele rukavice, dozor a knihu, a môžete študovať. O dva roky vám bude stačiť vyhľadať si rukopis knihy na internete.

Všetko, čo sa kedy napísalo po slovensky, o Slovensku alebo čo napísali Slováci, bude v digitálnej podobe a nájdete to aj cez Google. Taký je aspoň plán knižnice. Dá sa to stihnúť? A má to zmysel?

Je krátko po druhej, takže ľudia, ktorí hľadajú chyby v prepisoch historických dokumentov, už majú v práci po záverečnej.

Ostala tu len vedúca, aby ukázala ich robotu – v ľavej časti monitora je fotografia starých novín Národný denník, napravo tie isté staré noviny, ale v podobe textov, v ktorých sa už dá hľadať, kopírovať alebo čítať.

Sme vo Vrútkach, na pracovisku Slovenskej národnej knižnice, ktoré je záverečným štádiom prerodu zažltnutého krehkého papiera na elektronický dokument.

Tu sa robia posledné práce na takzvanej digitalizácii národného písomného dedičstva. „Našou úlohou je zachovať ich v stave, v akom vyšli,“ predstavuje miestnu dogmu vedúca Monika Šušorená.

Preto opravujú len jeden typ chýb: keď sa dokument v počítači nezhoduje s historickou predlohou. Gramatické chyby v pôvodnom texte nechávajú pre budúce generácie, aj chyby sú predsa súčasťou histórie.

Od nasledujúceho pracovného dňa už tu bude desať ľudí snoriť v prepisoch starých textov aj po druhej popoludní. V Národnej knižnici zavádzajú druhú zmenu. Musia pridať v tempe, ak chcú stihnúť zdigitalizovať viac než dva a pol milióna dokumentov do konca roku 2015 a zaslúžiť si tak päťdesiat miliónov eur z európskych fondov.

Tisíce strán za hodinu

Pri týchto číslach, samozrejme, ručné prepisovanie textov nepripadá do úvahy. Sú na to programy na optické rozpoznávanie textu, ktoré sú tým lepšie, čím viac druhov písma a jazykov poznajú. A keďže tony dokumentov sú staré aj dvesto, tristo rokov, softvér sa musí vedieť vysporiadať s desiatkami typov písma, vrátane ornamentálneho.

„Ak by softvér pracoval s 99,9-percentnou presnosťou, znamenalo by to, že na jednej stránke sa vyskytne jedna chyba. Pri 99 percentách už je to jedna chyba na každý riadok,“ hovorí Dominik Kubík, ktorý v Národnej knižnici šéfuje technike.

V knižnici majú ruské programy, ktoré sú špičkou v odbore, ale ich reálna presnosť pri starších dokumentoch je okolo 95 percent. Preto je jedno oddelenie zamestnané len úpravou skenov a kontrolou kvality.

Dojem rýchlosti, ktorá dáva nádej na včasné splnenie cieľa, sa dá získať v hale pre skenery a skeneristov. Každú knihu a každý dokument treba prelistovať a odfotiť stránku po stránke. Tisíce strán každú hodinu. A treba to urobiť spôsobom, ktorý prežije aj tá najkrehkejšia starina.

Človek a stroj

Formulou jeden je automatický skener. Človeka potrebuje len výnimočne. Je veľký ako dodávka a drahý ako dom. V jeho vákuovom jadre je cez sklo dobre vidieť roztvorenú knihu.

Prevráti list, prebleskne biele svetlo a ďalšia dvojstrana je odfotená a pripravená pre čítací softvér. Skener narába s knihami so sterilnou starostlivosťou.

„Strany nadvihuje pomocou podtlaku, a keď náhodou zoberie dve stránky súčasne, všimne si to vďaka ultrazvukovému snímaču,“ hovorí Ivan Michalko, riaditeľ digitalizačného centra. Len vtedy stroj zavolá na pomoc človeka.

Viac práce majú tí, čo obsluhujú poloautomaty a manuálne skenery. K nim sa dostávajú knihy, ktoré vyžadujú ešte jemnejšie zaobchádzanie, napríklad keď nejdú otvoriť na 180 stupňov bez rizika poškodenia väzby. Taký stroj k sebe potrebuje človeka, čo otáča stránkami.

Hoci skenovanie rozhodne nie je žiadne staré remeslo, začína už mať svojich fachmanov. „Najšikovnejší človek dokáže s manuálnym skenerom oskenovať 800 strán za hodinu, teda toľko, čo automat,“ dodáva Michalko.

S dejinami v rukavičkách

Z 2,5 milióna dokumentov, ktoré treba zdigitalizovať, tvoria knihy len malú časť, približne stotisíc. Zvyšok sú dokumenty všetkého druhu – noviny, časopisy, články a príspevky v zborníkoch, mapy, plagáty, pohľadnice, ale aj sčítacie hárky a archívne dokumenty.

O tom, čo sa zdigitalizuje, rozhoduje aj fyzický stav. Každý titul prechádza rukami človeka, ktorý vyradí fyzicky citlivý dokument, ostatné rozdelí do debničiek, ktoré nakoniec doputujú k svojmu skeneru. Kým sa tak stane, zastaví sa každá kniha a dokument u čističov. Aj v čistiarni si človek a stroj delia prácu podľa toho, akú citlivosť si dokument vyžaduje.

Bezproblémové knihy stačí oprášiť a vložiť do stroja, ktorý ich podobne ako v autoumyvárni vypľuje na konci čisté. Hneď vedľa stroja však stojí iné zariadenie, podobné inkubátoru s dvomi otvormi na ruky.

Stará Biblia v koženom obale s kovovými prackami je tu práve v opatere pracovníčky, ktorá v rukavičkách otáčka stránky a jemnou kefou zotiera prach. Na prvý pohľad je jasné, že okrem veľkej dávky trpezlivosti si jej práca vyžaduje aj vrúcny vzťah ku knihám. Na otázku, či si po šichte dokážu ešte aj doma otvoriť a čítať knihu, celé oddelenie zborovo odpovedá áno.

Starý depozit, nový marketing

Prvou aj poslednou stanicou každej knihy a listiny je depozit. Odtiaľto odchádzajú na digitalizáciu, sem sa aj vracajú.

Napríklad Nóri majú depozit v jaskyni niekde pod severným pólom, náš depozit je na kopci nad Martinom v sídelnej budove Národnej knižnice.

Koľko prežijú listiny Pergamen – používal sa do 13. storočia a má životnosť tisíc a viac rokov.

– používal sa do 13. storočia a má životnosť tisíc a viac rokov. Ručný papier – v 14. storočí nahradil pergamen a vyrábal sa do roku 1850, kým ho nenahradil strojový papier. Bol kvalitný, robil sa s tým, že má vydržať.

– v 14. storočí nahradil pergamen a vyrábal sa do roku 1850, kým ho nenahradil strojový papier. Bol kvalitný, robil sa s tým, že má vydržať. Strojový papier – po roku 1850 nastúpila strojová výroba papiera z drevnej hmoty, ktorá obsahovala aj lignín – látku málo odolnú voči oxidácii, ktorú po čase vidno na žltnutí a krehnutí papiera. Starne v závislosti od uskladnenia – pri horších podmienkach prežije 150 až 200 rokov, vo vhodnom prostredí 300 až 400 rokov.

– po roku 1850 nastúpila strojová výroba papiera z drevnej hmoty, ktorá obsahovala aj lignín – látku málo odolnú voči oxidácii, ktorú po čase vidno na žltnutí a krehnutí papiera. Starne v závislosti od uskladnenia – pri horších podmienkach prežije 150 až 200 rokov, vo vhodnom prostredí 300 až 400 rokov. Súčasný papier – hoci už nie je ohrozený kyslosťou, dožije sa tiež len okolo 150 až 200 rokov. Noviny a časopisy z recyklovaného papiera ešte menej.

Státisíce kníh, novín a dokumentov tu usporiadane čaká, či si ich nejaký čitateľ alebo bádateľ vyžiada na prečítanie, alebo preskúmanie.

Ľudia z knižnice dúfajú, že to tak nebude navždy.

Okrem toho, že sa kapacita depozitu postaveného pred 30 rokmi pomaly naplnila, tunajšia klíma nie je dosť šetrná pre starý, papier, háklivý na vlhkosť, teplotu, prach a svetlo.

„Všetky výsledky ľudskej činnosti raz podľahnú zániku a my to chceme čo najviac oddialiť,“ vysvetľuje poslanie depozitu šéfka knižnice Katarína Krištofová.

Postavenie nového depozitu, podľa možnosti hneď vedľa dnešnej budovy, si stanovila za jeden zo svojich najdôležitejších cieľov.

Ďalším je dobrý marketing knižnice. Hovorí, že zdigitalizovanie knihy je len začiatok.

Každý digitálny záznam treba vybaviť informáciami, aby bol vyhľadateľný.

A nakoniec bude treba dať vedieť ľuďom, že svoje kultúrne dedičstvo si hocikedy vygooglia a prečítajú hoci aj na mobile.

Historické poklady z knižnice Zlomok Graduálu. Ide o najstarší notovaný fragment (koniec 11. storočia) z územia Slovenska.

Ide o najstarší notovaný fragment (koniec 11. storočia) z územia Slovenska. Praeceptorium divinae legis (Učitelia Božieho zákona). Je najstaršou prvotlačou v zbierkach knižnice. Autorom je Johannes Nider, vyšla v Bazileji v roku 1464.

(Učitelia Božieho zákona). Je najstaršou prvotlačou v zbierkach knižnice. Autorom je Johannes Nider, vyšla v Bazileji v roku 1464. Confessionale Defecerunt. Prvotlač Antonina Florentina z roku 1477. Významná časť odbornej verejnosti sa domnieva, že ide o jednu z prvých kníh vytlačených na území súčasného Slovenska.

Prvotlač Antonina Florentina z roku 1477. Významná časť odbornej verejnosti sa domnieva, že ide o jednu z prvých kníh vytlačených na území súčasného Slovenska. Kronika Jána z Turca (resp. Uhorská kronika – lat. Chronica Hungarorum). Kronika vyšla prvýkrát 20. marca 1488 v Brne, jej autorom bol prvý známy laický spisovateľ v Uhorsku Ján z Turca. Toto dielo mapuje uhorské dejiny od najstarších čias až po dobytie Viedne Matejom Korvínom v roku 1488 a významné je okrem iného aj tým, že sa v ňom po prvýkrát vyskytuje názov slovenského národa vo forme Slováčka (Zlowachko). V SNK sa nachádza jedna z jeho verzií.

(resp. Uhorská kronika – lat. Chronica Hungarorum). Kronika vyšla prvýkrát 20. marca 1488 v Brne, jej autorom bol prvý známy laický spisovateľ v Uhorsku Ján z Turca. Toto dielo mapuje uhorské dejiny od najstarších čias až po dobytie Viedne Matejom Korvínom v roku 1488 a významné je okrem iného aj tým, že sa v ňom po prvýkrát vyskytuje názov slovenského národa vo forme Slováčka (Zlowachko). V SNK sa nachádza jedna z jeho verzií. Bardejovský katechizmus Martina Luthera. Je najstaršou tlačou v domácom jazyku Slovákov (v slovakizovanej češtine). Vyšiel v Bardejove v roku 1581 a tento rok knižnica vydá faksimilné vydanie tohto diela. Pozrite si ukážky zdigitalizovaných historických dokumentov