Hlavní navigace

Veřejná zakázka: svobodný software pro archivy

13. 12. 2013

Sdílet

Technologická agentura České republiky zve dodavatele (vývojáře) na seminář věnující se připravovanému projektu zadání veřejné zakázky na vývoj menšího software pro archivy, který bude uvolněn na trh pod některou z open-source licencí. Předmětem činnosti IT dodavatele ve veřejné zakázce by mělo být hledání řešení (nalezení způsobu a vlastního vývoje) pro takovou realizaci software, aby jednotlivé archivy (a jiné paměťové instituce) mohly pomocí dalších IT dodavatelů tento software implementovat na svých různých technických platformách. Tato metoda je v zahraničí označována jako Pre-Commercial Procurement (PCP) a jde v České republice o projekt pilotní. Šanci mají zejména menší či střední IT dodavatelé.

Software by se měl věnovat archivnímu zpracování (pořádání) archiválií a tvorbu archivních pomůcek ve smyslu zákona č. 499/2004 Sb., o archivnictví a spisové službě a o změně některých zákonů, ve znění pozdějších předpisů, vyhlášky č. 645/2004 Sb., kterou se provádějí některá ustanovení zákona o archivnictví a spisové službě a o změně některých zákonů, ve znění pozdějších předpisů a Základních pravidel pro zpracování archiválií, které připravil Odbor archivní správy a spisové služby Ministerstva vnitra České republiky, který je také věcným gestorem projektu. Na webu TA ČR naleznete více informací.

Zprávičku zaslal Pavel Slípek z Technologické agentury ČR.

Našli jste v článku chybu?
  • Aktualita je stará, nové názory již nelze přidávat.
  • 13. 12. 2013 13:34

    Nm (neregistrovaný)

    Liší se potřeby archivnictví významně od potřeb knihoven, muzeí, repozitářů výzkumných organizací, apod.?

    Protože existuje řada stabliních a rozšířených OpenSource řešení, které se pro knihovny a digitální archivy v těchto organizacích využívají. Např. světově nejrozšířenější systém Dspace je pod MIT licencí: dspace.org Většina dalších (Eprints, Fedora, Invenio, ad.) má také svobodné licence i otevřený vývoj.

    Nechat si napsat a hlavně udržovat analogický system "na zelené louce" mi připadá jako rozhodnutí, pro které by měly existovat velmi, velmi vážné důvody. Nevýhody jsou totiž zřejmé.

  • 13. 12. 2013 13:42

    K> (neregistrovaný)

    osobne doufam, ze firmy ucastnici se toho rizeni jenom dopisou cestinu do stavajicich projektu, pripadne pridaji nektere specificky ceske vlastnosti.

  • 13. 12. 2013 16:05

    Karel (neregistrovaný)

    Trochu se bojím, že by se to mohlo stát. Vznikne tak "softwareové řešení", které se jako bude instalovat, ale ve skutečnosti se používat nebude. Málokterý archivář bude riskovat pobyt v teplákách se softwarem, jehož dodavatel nijak nebude ručit za soulad s legislativou.

  • 13. 12. 2013 16:02

    Karel (neregistrovaný)

    Ano, požadavky se liší naprosto zásadním způsobem.

    Jiný je účel, jiný je proces a navíc tam platí velmi přísná legislativa. Váš návrh se trochu podobá tomu "vezmeme účetní software a začneme s jeho pomocí provozovat banku".

  • 13. 12. 2013 18:50

    Nm (neregistrovaný)

    Vůbec neodpovídáte na to, jestli se opravdu požadavky systémově liší, nebo jde o nastavení systému a "pár skriptů kolem" (což samozřejmě nemusí být žádná trivialita).

    Systémovým rozdílem by bylo, kdyby archivní sw. byl v principu něco jiného než knihovna fungující zhruba podle OAIS modelu: Vloží se tam datové objekty a metadata o nich. Pak už vkladatel nemůže objekt sám měnit. Vyhledává se v tom, objekty se unikátně a persistentně identifikují a zálohují, případně přesouvají mezi archivy a pak se nějak zpřístupňují navenek. Změny metadat se sledují (provenance records), identita dat se kontroluje, případně se udržují repliky...

    Já to opravdu nevím, je archivní software něco principielně jiného?

    Protože to, jak se co zformátuje, komu se umožní přístup a kdy se co zazálohuje či smaže, to je nastavení.

  • 14. 12. 2013 9:14

    petr_p (neregistrovaný)

    V principu je to podobné. Ale český zákon klade řadu dalších specifických požadavků.

    Například musíte (měl byste, ten zákon je takový nedopečený) řešit integritu digitálních dokumentů. To znamená s dokumentem archivovat podpisový certifikát, certifikát autority, všechny mezilehlé certifikáty, seznamy odvolaných certifikátů všech autorit po cestě, a to všechno musíte opatřit časovým razítkem, které budete pravidelně přidávat nové, a ke každému razítku opět všechny certifikáty a seznamy odvolaných certifikátů k ověření razítka. Také nesmíte zapomenout, že to nejde dělat okamžitě, ale je třeba podle politiky každé autority počkat na vydání následného seznamu odvolaných certifikátů. Dále je třeba vzít v úvahu, že podle unijního práva musíme uznávat všechny unijní kvalifikované autority (což zcela prakticky nikdo nedělá). Navíc například německé autority žádné seznamy odvolaných certifikátů nemají, ony používají OCSP.

    A protože ve správě digitálních dokumentů jsme břídilové, tak digitální dokumenty autorizovaně konvertujeme do papírových, takže ke každému digitálnímu dokumentu máte ještě analogovou kopii, kterou je třeba archivovat, neztratit a včas řádně skartovat.

    Ostatně skartace je další kapitola. Různé dokumenty mají různé skartační lhůty, podle nich se přesouvají mezi archivy. Na to máme samozřejmě český specifický datový formát. A pak taky musíte řešit, že legislativa se mění, a co se mělo skartovat za pět let se může po změnit na deset nebo dva roky.

    Dále ten archiv má podporovat metadata spisové služby. To znamená, že se eviduje, kdy, jak, od koho, komu dokument byl doručen (včetně dokumentů vzniklých při doručování jako jsou dodejky České pošty), k tomu spisová metadata jako čísla jednací, evidenční a tak dále. Cest, jak může přijít dokument, je celá řada: papírovou poštou, datovou schránkou, elektronickou podatelnou, obyčejným e-mailem, může být podán na místě, na podatelně úřadu, telefonicky, ústně… To všechno se musí zachytit a archivovat.

  • 14. 12. 2013 16:18

    Nm (neregistrovaný)

    To je velmi zajímavé, díky. Konečně rozumím, v čem je ten opravdový problém.

    To docela vypadá, že ideální řešení je v principu jako níže zmíněný systém Kramerius: robustní standardní základ, jako třeba ta Fedora, která dobře řeší i provenance logs, a k tomu veliká netriviální nádstavba řešící ty specifické požadavky. A že jich teda je. Hlavně ten interface s fyzickým světem kopií a doručování atd. je tedy radost.

  • 13. 12. 2013 14:15

    kolemjdoucí (neregistrovaný)

    https://code.google.com/p/kramerius/

    Kramerius 4
    je softwarové řešení pro zpřístupnění digitálních dokumentů. Primárně je určen pro digitalizované knihovní sbírky, monografie a periodika. Využit může být ke zpřístupnění dalších typů dokumentů např. map, hudebnin a starých tisků, případně částí dokumentů jako jsou články a kapitoly. Systém je vhodný také pro tzv. digital born dokumenty, tedy dokumenty, které vznikly v elektronické podobě. Kramerius je průběžně upravován tak, aby struktura metadat odpovídala standardům vyhlašovaným Národní knihovnou České republiky. Systém poskytuje rozhraní pro přístup koncových uživatelů, zajišťující vyhledávání v metadatech a v plných textech, generování vícestránkových PDF dokumentů z vybraných stran, vytváření virtuálních sbírek a další operace nad uloženou sbírkou digitálních dokumnetů.

    Aktuální verze 4 je vyvíjena a průběžně publikována od roku 2009. Navazuje funkčností na předchozí verzi systému Kramerius končící označením 3.3.1. Nově je jako jádro systému použit open source repozitář Fedora (http://www.fedora-commons.org). Při vývoji jsou využívány další volně dostupné technologie třetích stran - Apache, Apache Tomcat, Apache Solr, Postgres SQL. Systém je založen na technologii Java a lze ho provozovat jako samostatnou webovou aplikaci v libovolném J2EE kontejneru (např. Apache Tomcat).

  • 13. 12. 2013 16:14

    Karel (neregistrovaný)

    Kontrolní otázka - jak tento systém zajišťuje, že jsou archiválie ve správný čas v souladu se zákonem skartovány? Asi nijak.

  • 13. 12. 2013 16:36

    zvířátko (neregistrovaný)

    Nevím, co požaduje zákon, ale v K4 se dají tituly nevratně smazat, jednoduchý script to zvládne, defaultně to tam pochopitelně není.

Byl pro vás článek přínosný?

Autor zprávičky