Archiving 2010 | Archiveren volgens OAIS met Archivematica

Logo Archivematica

OAIS: bijna iedereen heeft er al van gehoord. Weinigen hebben het ooit in werking gezien.

Voor wie er nooit van gehoord heeft: OAIS staat voor Open Archival Information System. Deze zeer abstracte ISO-norm beschrijft hoe een digitaal depot georganiseerd moet zijn voor duurzame opslag. Zeer kort uitgelegd werkt OAIS als volgt: een SIP (Submission Information Package) wordt aangeboden voor opname in het digitaal archief. De SIP ondergaat verschillende controles om vervolgens te worden omgevormd tot een AIP (Archival Information Package). Deze AIP wordt opgeslagen in het archief. Wordt de informatie nadien opgevraagd, dan wordt op basis van de AIP een DIP (Dissimination Information Package) aangemaakt en naar de gebruiker gestuurd. Al deze Information Packages bevatten zowel te archiveren digitale objecten als beschrijvende en technische metadata. Dit is slechts een zeer beknopte, sterk vereenvoudigde samenvatting. Meer informatie vindt u online.

Weinigen hebben het dus ooit in werking gezien … tot nu. Op Archiving 2010 bracht Peter Van Garderen (Artefactual Systems) een presentatie van Archivematica. Dit opensourceprogramma wordt gesponsord door UNESCO, het stadsarchief van Vancouver en het IMF. Er werd bewust gestreefd naar laagdrempeligheid en gebruiksvriendelijkheid om kleine en middelgrote erfgoedorganisaties toe te laten in overeenstemming met OAIS te archiveren. Verder is Archivematica gebaseerd op allerhande standaarden en best practices. Het programma kan op een USB-stick geïnstalleerd worden en van daarop worden opgestart. Het programma is geprogrammeerd in Unix en Python.

Met Archivematica kunt u SIP’s omzetten naar AIP’s en AIP’s naar DIP’s. Het brengt verschillende andere opensourceprogramma’s voor archivering samen (JHOVE, PRONOM, NLNZ Metadata Extractor, …). Hiermee identificeert en valideert Archivematica de bestanden, de checksum wordt gecontroleerd, de bestanden worden gecontroleerd op virussen, in quarantaine geplaatst, omgezet naar een archiveringsformaat en een raadpleegformaat, voorzien van metadata (Dublin Core, Premis, METS) en een unieke ID. Voor de omzetting naar een volgende information package gebruikt men Bagit. Eindresultaat: een AIP.

Waar u deze AIP’s vervolgens opslaat is uw keuze: op een netwerk, in een cloud, LOCSS … Bij deze opslag zal moeten gewaakt worden over de integriteit van de digitale objecten en moeten de nodige back-ups gemaakt worden. Daar zorgt Archivematica niet voor. De ingest werd reeds uitvoerig getest en werkt ook wanneer er bijvoorbeeld duizenden SIP’s aangeboden worden.

Vervolgens kunt u een DIP aanmaken met metadata. Deze kan worden gelezen met bijvoorbeeld Archon of ICA-AtoM. Dit laatste is eveneens een opensourceprogramma van Van Garderen voor het maken en ontsluiten van archiefbeschrijvingen in ISAD(G), ontwikkeld in opdracht van de Internationale Archiefraad. Indien men in ICA-AtoM de metadata wijzigt, kunnen de gewijzigde metadata teruggestuurd worden naar Archivematica. Zo blijven de metadata up-to-date.

Verschillende keren per jaar wordt een nieuwe versie van Archivematica gepubliceerd. Momenteel is een alfaversie beschikbaar. De bètaversie komt uit in oktober en zal onder meer de mogelijkheid bevatten om SIP’s te creëren. Archivematica bevat ook een helpdesk waar u zeven dagen per week, 24 uur per dag terecht kan. Deze dienstverlening kost wel 30.000 dollar per jaar. Voor wat hoort wat ...

Jeroen Poppe