Archivematica Camp te Amsterdam

Van 11 tot 13 april vond bij het Internationaal Instituut voor Sociale Geschiedenis (IISG) het tweede Archivematica Camp in Europa plaats. Het Camp werd georganiseerd door het Canadese bedrijf Artefactual Systems, de ontwikkelaar van Archivematica.

Archivematica is een open source software die organisaties de kans geeft om hun digitale collecties en archieven duurzaam te preserveren en toegankelijk te maken. De workflow om digitaal te archiveren is gebaseerd op het Open Archival Information System (OAIS). Standaarden zoals PREMIS, METS en Dublin Core werden erin geïmplementeerd.

De gebruikers van Archivematica zijn vooral terug te vinden in Angelsaksische landen zoals de Verenigde Staten en het Verenigd Koninkrijk. In 2017 implementeerde ook het Nederlandse IISG de software in haar werking. In samenwerking met Artefactual werd de software verder ontwikkeld om aan te sluiten op hun bestaande infrastructuur (Persistent Identifier Service, acquisitiedatabank, metadatasystemen en opslagsystemen). In 2018 zal een gebruikersgroep Nederland - Vlaanderen worden opgestart om gebruikers hun ervaringen, workflows en use cases met elkaar te laten delen.

Gebruikers kunnen Artefactual inhuren om op basis van hun noden en wensen een aangepaste workflow of specifieke tools te ontwikkelen. De ontwikkelde instrumenten worden ter beschikking gesteld aan de brede gebruikersgroep en indien relevant ook ingebed in de core van de software.

Het Archivematica Camp is geïnspireerd door gelijkaardige evenementen zoals Hydra Camp, Islandora Camp en Fedora Camp. Potentiële en frequente gebruikers krijgen de kans om met elkaar in contact te komen, ervaringen uit te wisselen en kennis te maken met nieuwe ontwikkelingen van de software. De doelgroep is ruim en varieert van archivarissen, conservatoren, bibliothecarissen, digitale preservatiespecialisten tot ontwikkelaars en systeembeheerders die willen instaan voor de ondersteuning, uitbouw of aanpassing van een digitaal preserveringssysteem voor hun organisatie.

Projectresultaten

Dag 1:

De eerste dag bestond uit een introductie van Archivematica. De rol van Archivematica in het digitale preserveringslandschap werd geschetst en er werd een overzicht gegeven van de mogelijkheden die de software aan haar gebruikers aanbiedt.

De deelnemers kregen de kans om van nabij kennis te maken met de geïmplementeerde en te automatiseren workflow om preserveringsacties in de praktijk te implementeren. Ze leerden bestanden te verpakken in een Submission Information Package (SIP – informatiepakket van digitale archiefbestanden met o.m. metadata) en deze om te vormen in een Archival Information Package (AIP – informatiepakket van digitale archiefbestanden en bijhorende PDI, preservation description information) en een DIP (Dissemination Information Package – informatiepakket van presentatieformaten met metadata).

Archivematica maakt hiervoor gebruik van micro-services die voor een bepaalde workflow aan en uit worden gezet en specifiek ingesteld. De micro-services zijn open source tools die een specifieke taak uitvoeren in het preserveringsproces: bv. een virusscan maken, vreemde tekens verwijderen uit de bestandsnamen, lege mappen verwijderen, de integriteit van bestanden checken, het normaliseren van bestanden tot preserverings- en raadplegingsformaten, enz. Digitale archieven en collecties kunnen er doorheen worden gevoerd met als doel het materiaal in een e-depot op te slaan en/of beschikbaar te stellen via een archiefbeschrijvingssysteem. Het systeem registreert alle bewerkingen en kenmerken van de bestanden zodat ze ook op langere termijn kunnen worden beheerd.

Aan de hand van hands-onoefeningen leerden de deelnemers de verschillende stappen in de workflow kennen en de micro-services te gebruiken. Ze gingen aan de slag met het Archivematica’s dashboard, die de tabbladen transfer, ingest, administratie en preservatieplanning bevat. Er werd ook dieper ingegaan op de mogelijkheden in opslag. De eerste dag was bedoeld als een oriëntatiedag voor deelnemers met interesse in Archivematica.

Dag 2:

Op dag 2 werd de groep gesplitst in twee streams.

De eerste stream ging dieper in op het inrichten van aangepaste en gespecialiseerde workflows, meer bepaald het toevoegen van beschrijvende metadata, het importeren van documentatie, de overdracht van gecomprimeerde bestanden (zipbestanden) en schijfkopieën en de manuele normalisatie. Artefactual gaf een overzicht van de beschikbare automatiseringstools. Daarnaast werd dieper ingegaan op de functionaliteiten die geen deel uitmaken van de core workflow: de backlog en appraisal tabs (bij dit laatste tab werd getoond hoe digitale bestanden worden herordend), de mogelijkheid om een AIP opnieuw te ingesten (bv. wanneer nieuwe metadata wordt toegevoegd), de encryptie van een AIP, transcriptie en het gebruik van MediaConch. MediaConch is een open source softwaretool dat audiovisuele bestanden valideert. Het werd ontwikkeld binnen het Europese PREFORMA project naast andere tools zoals veraPDF en DPF Manger. De theorie werd uitgevoerd in de praktijk aan de hand van enkele hands-on oefeningen.

In de tweede stream werd gedemonstreerd hoe automatiseringstools, REST APIs, logs, onderhoudstaken en upgrades worden geïnstalleerd. Artefactual ging dieper in op het loggen (onderzoeken van de logbestanden) en de evaluatie van de performantie.

Tijdens deze dag werden de praktijkcases voorgesteld van het IISG en het Zuse Institute van Berlijn. Robert Gillesse (IISG) en Marco Klindt (Zuse Institut Berlin) gaven uitleg over de implementatie van Archivematica binnen hun werking en deelden kennis en ervaringen met de deelnemers.

Dag 3:

Op de laatste dag werd bij stream 1 verder ingegaan op de vraag hoe AIP en METS-bestanden zijn samengesteld en opgebouwd. Diverse onderdelen van een METS-bestand werden verder toegelicht: metsHdr (de header), dmdSec (beschrijvende metadata), amdSec (administratieve metadata), fileSec (metadata over bestanden zelf), structMap (index). Stream 2, voor ontwikkelaars en systeembeheerders, ging dieper in op hoe METS-bestanden worden geschreven vanuit de databank.

De volgende sessies bestonden uit groepsdiscussies waarin diverse onderwerpen aan bod kwamen: de hiaten in de software, samenwerkingsmodellen om de software verder uit te bouwen, pre-ingest workflows, rapportering over digitale bestanden, de integratie van Archivematica in andere systemen, de opslagmogelijkheden en het gebruik van DIP’s.

Conclusie:

Tijdens het Archivematica Camp konden deelnemers kennismaken met de mogelijkheden in implementatie en de functionaliteiten van de open source software Archivematica. Digitale archivarissen leerden hoe ze hun preserveringsplannen voor born digital en gedigitaliseerd erfgoed in de praktijk kunnen toepassen. Het Camp is de ideale ontmoetingsplaats om met andere gebruikers en ontwikkelaar Artefactual kennis en ervaringen uit te wisselen en na te denken hoe er ingespeeld kan worden op nieuwe digitale ontwikkelingen. Hoe breder de gebruikersgroep wordt, hoe meer mogelijkheden er zijn om de software uit te breiden en te beantwoorden aan alle vereisten die digitale archivering met zich meebrengt. De software geeft kleine instellingen met weinig middelen de kans om digitale preservering binnen hun organisatie mogelijk te maken.

Meer lezen? Breng een bezoek aan de Archivematica website of de wiki waar je de handleidingen kan terugvinden. Op de website vind je ook een demo-omgeving waar je de software zelf kan uittesten.

De broncode vind je via Github. Er is ook een technische Google gebruikersgroep.

 

Praktische info

Looptijd van
Looptijd tot
Organisatienaam
Artefactual Systems
Contactpersoon
Sophie Bossaert (ADVN)
Adres
Lange Leemstraat 26, 2018 Antwerpen
Telefoon
03 225 18 37
Financieringsbron(nen)

Vlaamse overheid

Andere projecten

Zie document “Verantwoording van projectsubsidies voor ontwikkelingsgerichte en internationale projecten. Cultureel erfgoeddecreet” door ons bezorgd ...
Tekstaffiches vormen een zeer belangrijke bron voor de geschiedenis van het dagelijkse leven in Vlaanderen ...
Binnen het project werd gewerkt volgens vijf actielijnen: 1. De conservatie en ontsluiting van het ...