Digitaliseringsuitdagingen voor archieven

Beeldherkenning gebaseerd op foto van Michiel Hendryckx, CC BY-SA 3.0 <https://creativecommons.org/licenses/by-sa/3.0>, via Wikimedia Commons

Op 3 juni vindt het vierde webinar van de reeks To imagine otherwise: future archives plaats. Daarin spreekt Andrew Prescott, Professor of Digital Humanities aan de Universiteit van Glasgow, over de toekomst van digitalisering in archieven.

Digitalisering, kort door de bocht gesteld, beperkt zich vandaag vaak tot het omzetten van een analoog document naar een digitale variant, waarbij kwantiteit lijkt te primeren op kwaliteit. Welke (nieuwe) methodieken zullen we de komende jaren inzetten, rekening houdend met de explosieve toename van digital born records? Hoe kunnen nieuwe technieken als multispectrale beeldvorming en Reflectance Transformation Imaging (RTI) gebruikt worden om gedigitaliseerde documenten gedetailleerder te onderzoeken? Zijn virtual reality en artificiële intelligentie bruikbare tools in het digitaliseringsverhaal?

Het ADVN | archief voor nationale bewegingen onderzoekt het in het project Tegenlicht, met als centrale vraag: ‘Hoe kunnen we beeldherkenning inzetten bij het beschrijven van gedigitaliseerde fotonegatieven?’. Als vooruitblik op het webinar sprak FARO met Tom Cobbaert, hoofdarchivaris bij het ADVN | archief voor nationale bewegingen.

Tegenlicht

Sinds maart 2021 werken het ADVN, het FOMU (Fotomuseum Antwerpen) en KOERS (Museum van de Wielersport) samen in het project Tegenlicht, dat kadert in de inhaalbeweging digitale collectiedata van het Departement Cultuur, Jeugd en Media. Het project maakt zes negatiefarchieven toegankelijk die tot de kerncollecties van de drie erfgoedorganisaties behoren. Samen digitaliseren ze zo’n vierhonderdduizend fotonegatieven.

Tom Cobbaert: “Bij het ADVN selecteerden we onze vier grootste negatiefarchieven: de archieven van fotografen Danny Cortier, Werner Vandenberghe, Hendrik Van Lerberghe en Dirk Cornelis. Die brengen heel diverse facetten van de Vlaamse beweging in beeld, zoals de opgeblazen IJzertoren (1946) en de heropbouw ervan (1952-1965), betogingen zoals Leuven Vlaams (1968) en herdenkingen zoals de IJzerbedevaart.”

ADVN, © Hendrik Van Lerberghe
ADVN, © Hendrik Van Lerberghe
ADVN, © Wevako
ADVN, © Wevako


“Andere foto’s belichten de evolutie die de Vlaamse beweging onderging van militantenbeweging naar meer burgerlijk nationalisme. Zo fotografeerde Danny Cortier de verschillende edities van de beurs Flanders Technology die in 1983 voor het eerst georganiseerd werd om het Vlaamse bedrijfsleven en de bevolking te sensibiliseren over nieuwe technologische uitdagingen. De foto’s van Dirk Cornelis, huisfotograaf van het Vlaams Blok, hebben dan weer grote documentaire waarde om de campagnes van deze politieke partij uit de jaren 1990 en begin 2000 te analyseren.”

ADVN, ©Studio Dann
ADVN, ©Foto Fokus


Het FOMU digitaliseert het archief van Herman Selleslags, die het culturele en medialandschap tijdens de tweede helft van de twintigste eeuw in beeld bracht. KOERS blikt met de beelden van fotograaf Bart Vandenbroucke dan weer terug op grote maar ook kleinere wielerwedstrijden tijdens die periode.

Bulkdigitalisering

ADVN, © Studio Dann

In een eerste fase (maart-december 2021) onderzocht Phaedra Claeys, projectmedewerker Tegenlicht bij het ADVN, hoe de geselecteerde negatiefarchieven het best konden gedigitaliseerd worden.

Ze organiseerde een adviesgroep, overlegde met meemoo om de resolutie te bepalen en bevroeg onder meer het Noord-Hollands Archief, dat met het project Fotografisch Geheugen een vergelijkbaar digitaliseringsproject uitvoerde. Verschillende digitaliseringsopties werden bekeken: negatief per negatief? Per strook? Per contactvel?

Na afweging van kwaliteit, haalbaarheid en betaalbaarheid, bleek de laatste optie de beste. De fotonegatieven werden gescand in de transparante insteekhoezen waarin ze bewaard worden. Deze contactvelmethode laat toe om snel en eenvoudig een grote hoeveelheid negatieven te digitaliseren. Na onderhandeling met verschillende bedrijven, kozen de drie collectiebeherende organisaties om hiervoor met Picturae samen te werken.

Tom Cobbaert verduidelijkt: “Picturae levert ons de scans van de contactvellen. Eén vel bevat natuurlijk meerdere negatieffoto’s. Daarom vroegen het ADVN en KOERS bijkomend om van elke negatieffoto een aparte JPEG te maken. Zo hebben we meteen een gedigitaliseerde versie van alle foto’s die we via onze inventaris kunnen ontsluiten.”

Beeldherkenning

Tegenlicht zet niet enkel in op de digitalisering van de fotonegatieven, maar test in de tweede fase (2022) ook uit hoe beeldherkenning kan gebruikt worden bij de beschrijving op stukniveau. “Elk contactvel heeft al een algemene beschrijving. Het gaat om beschrijving op bladniveau, zoals de naam en de datum van een betoging,” verduidelijkt Tom Cobbaert. Met behulp van artificiële intelligentie en beeldherkenningssoftware wordt de beschrijving op stukniveau nu verder aangepakt. In het project wordt samengewerkt met Datable, een bedrijf dat inzet op digitale erfgoedstrategieën, data services en digitale duurzaamheid. Er wordt een workflow uitgewerkt om gezichten van personen op de foto’s automatisch te detecteren, te clusteren en te valideren en ze vervolgens te identificeren.

Daarbij spelen ook ethische vragen op: kan en mag een archief zomaar iedereen identificeren? Bij publieke figuren of mensen met een publieke functie is dit geen issue, maar bij onbekendere mensen rijzen er veel vragen over juridische en privacy-implicaties. Terwijl het ADVN initieel vooropstelde om zoveel mogelijk mensen te identificeren, en deze informatie als metadata toe te voegen op stukniveau, wordt momenteel herbekeken of er niet vooral op publieke personen zal gefocust worden. “Samen met het FOMU en KOERS bespreken we het idee om per organisatie een ‘gezichtsboek’ te maken. Een referentieset van publieke personen die in de eigen collecties van belang zijn, waar we geschikte portretbeelden aan koppelen uit verschillende fases van hun leven. Dit kan dan als referentieset dienen voor de beeldherkenning,” aldus Tom Cobbaert.

Het project toont de voordelen van digitalisering en het gebruik van beeldherkenning op grote schaal, maar maakt ook duidelijk dat er nog veel menselijke input bij komt kijken. Bij het ADVN gaat het bijvoorbeeld om zo’n 130.000 beelden die moeten gevalideerd worden, nadat ze door beeldherkenning zijn herkend en geclusterd. In de tweede fase van het project zal dan ingezet worden op crowdsourcing bij het valideren van de ‘herkende’ personen op de foto’s. In een derde fase (2023) zullen het ADVN, het FOMU en KOERS hun datamodellen en collectiebeheersystemen onder de loep nemen om na te gaan of en hoe dit kan gepubliceerd worden als (linked) open data.

Benieuwd naar meer internationale voorbeelden?

Volg op 3 juni het webinar van Andrew Prescott: Future Prospects for Digitization. Via deze link schrijft u zich gratis in.

Foto's: ADVN, © Studio Dann, © Wevako, © Foto Fokus en © Hendrik Van Lerberghe. 

Jelena Dobbels