Posláním Národní knihovny je zachovat národní kulturní dědictví, a to v celé jeho šíři a podobě - v tištěné podobě prostřednictvím povinného výtisku a v elektronické podobě prostřednictvím digitálních archivních verzí českých webových stránek. Snažíme se uchovat obraz českého webu, jak vypadal v určité době. Z tohoto důvodu procházíme český web a ukládáme archivní verze stránek. Všechna takto získaná data jsou v neměnné podobě dlouhodobě uchovávána v úložišti Národní knihovny ČR.
Archivujeme tzv. bohemikální zdroje, což jsou stránky, které jsou psané v českém jazyce nebo vydávané na území České republiky nebo autorem původem z Česka, případně se obsahově týkají České republiky.
Archivovaná verze stránky zaznamenává stránku v době, kdy byla sklizena. Archivní verze je pak uložena v archivu a za určitých podmínek zpřístupněna uživatelům.
V současné době jsou ve webovém archivu uložena komprimovaná data v řádu stovek terabajtů a tento objem neustále narůstá. První archivovanou stránku máme ze září 2001.
Wayback Machine je webová aplikace, která umožňuje uživatelům přístup k archivním verzím stránek nacházejících se v našem webovém archivu.
Ano, je to možné! Odkazy, které jsou v našem archivu jsou trvalé a fungují stejně jako odkazy na běžném internetu.
Český webový archiv nabízí několik možností vyhledávání. Vyhledávat můžete buď zadáním URL adresy stránek (např. http://www.nkp.cz, www.webarchiv.cz) nebo zadáním klíčových slov (např. knihovna).
Druhou možností je také prohlížení stránek v našem katalogu podle jejich tematického zařazení.
Vzhledem k povaze a rozsahu dat (mnoho verzí jedné stránky) je možné vyhledávat primárně pomocí URL adres jednotlivých stránek. U stránek, které jsou obsažené v našem výběrovém katalogu, je také možné využít vyhledávání pomocí klíčových slov a v jejich anotaci.
I když se snažíme vytvořit co nejkompletnější obraz českého internetu, tak mít v archivu všechny stránky prostě není v našich silách. Pokud zrovna ta vaše chybí, můžete ji navrhnout zde.
Pokud se vám zobrazuje chybové hlášení, že přístup k archivovaným verzím je blokován, důvodem je současné znění autorského zákona. To nám dovoluje zpřístupňovat online pouze stránky, k jejichž archivaci nám dal jejich vydavatel souhlas. Veřejně online je přístupná pouze malá část archivu.
Pokud máte zájem prohlédnout si celý archiv, můžete navštívit Referenční centrum Národní Knihovny ČR, kde jsou dostupné terminály, přes které je možné do archivu vstoupit.
Z technických důvodů nejsme vždy schopni archivovat stránky v takové podobě, v jaké jsou vystaveny na webu. Snažíme se vždy archivovat stránky tak, aby archivní verze byla kompletní, bohužel to není vždy možné. Vzhledem k omezenému diskovému prostoru a počítačovému výkonu se může stát, že se některé části stránky nenachází v našem archivu. Jedná se zejména o větší soubory, např. videa.
Archivované stránky jsou z technických důvodů zpřístupňovány pro uživatele s určitým zpožděním po archivaci (zpravidla tři měsíce). Potřebujeme čas ke zpracování stahovaných dat, zejména k vytvoření indexu pro zpřístupňovací aplikaci. Dalším důvodem může být, že různé webové stránky mají nastavenou různou frekvenci, se kterou jejich verze vytváříme. Např. u internetového periodika vytváříme kopii až 1x měsíčně, zatímco u statické webové prezentace 1x ročně. Maximální frekvence sklízení je však 1x měsíčně.
Stačí vyplnit formulář na našem webu, nebo nám napsat na adresu webarchiv[@]nkp.cz. Vaše stránka tak bude přijata jako návrh k zařazení do archivu a poté budete vyrozuměni, zda je vhodná k archivaci.
Snažíme se zachovat obraz českého webu, jak vypadal v určité době. Z tohoto důvodu procházíme veřejně dostupnou část českého webu, stahujeme data ze všech veřejně přístupných stránek s doménou *.cz a ukládáme je jako archivní verze. Všechna takto získaná data jsou v neměnné podobě dlouhodobě uchovávána v úložišti Národní knihovny ČR. Vaše stránky se tak stávají součástí historie a českého kulturního dědictví.
Stránky z archivu neodstraňujeme. Na základě domluvy lze v odůvodněných případech vyjmout stránky z archivace - zařazením stránek na blacklist, aby v budoucnu již stahovány nebyly, nebo je kompletně znepřístupnit pro ostatní uživatele.
V případě, že nemáte zájem o zařazení do archivu historie českého webu, prosím kontaktujte nás na adrese webarchiv[@]nkp.cz.
Český webový archiv ukládá archivní verze pouze stránek, které jsou veřejně přístupné, tzn. těch, které je možné navštívit i běžným prohlížením internetu. Nearchivujeme webové stránky, k jejichž přístupu je nutné oprávnění správce k zobrazení obsahu nebo jiná lidská interakce (např. odeslání formuláře).
Pokud máte pocit, že došlo k narušení vašeho soukromí, kontaktujte nás na emailové adrese webarchiv[@]nkp.cz.
Ne, nearchivujeme. Nicméně v rámci celoplošných sklizní je archivován celý český veřejný internet. Tedy pokud je na nějaké stránce veřejně vystavena např. emailová komunikace, telefonní čísla atd., pak se mohou v našem archivu objevit. Jedná se ale o pouze veřejně dostupné informace.
Bohužel to není možné, český webový archiv neposkytuje tyto služby pro veřejnost. Nicméně je možné si svoji stránku najít v archivu a z ní čerpat informace k jejímu obnovení. Nemůžeme ovšem garantovat, že se vaše stránka bude v archivu nacházet nebo bude v budoucnosti archivována.
V současnosti standardně soubory robots.txt nezohledňujeme, jelikož věříme, že historie webu by se měla uchovat v takové podobě, v jaké ho vidí lidé a ne vyhledávače.
V případě, že máte zájem o archivaci Vašich webových stránek, zašlete nám je jako návrh k archivaci prostřednictvím webového formuláře nebo na náš email webarchiv[@]nkp.cz.
Všechny návrhy musí projít hodnocením a případným testováním technických problémů. Pokud budou Vaše stránky vhodné pro archivaci z obsahového i technického hlediska, zařadíme je do výběrové sklizně. Budete-li mít zájem zveřejnit archivní verze Vašeho webu on-line na našich stránkách, budeme potřebovat Váš souhlas se zpřístupněním právně ošetřit. Vydavatele jednotlivých webových stránek vyzveme k vystavení webu pod licencí Creative Commons. Velkým vydavatelům, kteří spravují více zdrojů, nabídneme možnost uzavření licenční smlouvy.
Archivace v rámci Webarchivu Národní knihovny ČR je zcela bezplatná, veškeré náklady na archivaci nese Národní knihovna.
Je to soubor licencí, které umožňují autorům díla legálně sdílet a poskytnout je k využití veřejnosti za podmínek stanovených autorem (např. pouze nekomerční využití). Více se o licenci CC dočtete na našem webu.
Vystavením licence CC na svých stránkách nabízíte vy, jako autor, souhlas s využitím díla potenciálním uživatelům dle licence, na základě které jim poskytuje některá svá práva k dílu a jiná si vyhrazujete. Výhodou licence je její snadná aplikace (jedná se o umístění malého banneru).
Zatímco vystavením Vašich stránek pod licencí Creative Commons umožňujete všem uživatelům používat dílo dle příslušné licence, smlouvou dáváte souhlas pouze Národní knihovně se zpřístupněním archivních verzí Vašich stránek. Pro nás však mají obě varianty stejný efekt, záleží tedy na vás, jaká vám vyhovuje více.
Licence CC nabízí různé varianty licencí podle toho, jaká práva veřejnosti chcete ke svému dílu povolit či vyhradit. Ve všech variantách licence CC je však zachováno právo veřejnosti (za různých podmínek) na bezplatné šíření díla a povinnost uvést autora. Více informací o variantách licence naleznete na stránkách creativecommons.cz.
Vaše stránka může být archivována 1x až 12x ročně, případně pouze jednorázově (již ukončené projekty, statické stránky). Zpravidla to závisí na četnosti aktualizací stránek a jejich technické stránce. O frekvenci archivace Vašich stránek Vás budeme informovat.
Samozřejmě, stačí zadat URL adresu Vašich stránek do vyhledávače na našem webu. Upozorňujeme však, že archivované verze jsou zpřístupněny s určitým zpožděním od začátku archivace (zpravidla 3 měsíce).