Handschriftherkenning van het archief Melijn

Algemeen 

Het project Handschriftherkenning van het archief Melijn heeft tot doel twintig volumen van 17e en 18e-eeuwse brievenkopijenboeken en grootboeken te digitaliseren, transcriberen en publiceren. Het betreft een handelscorrespondentie van de Antwerpse textielhandelaarsfamilie Melijn die bestaat uit ca. 20.000 brieven; een schat aan te ontsluiten informatie. Het archief geeft onder andere inzicht in de verschillende handelswaar, de handelsroutes en de verschillende handelaarsfamilies uit deze periode. Daarnaast bevat de correspondentie van de familie Melijn ook heel wat informatie over bijvoorbeeld historische gebeurtenissen of zelfs smokkelroutes.   

Dit project is voor MoMu de uitgelezen kans om deze historische bron te ontsluiten. Daarnaast is het een opportuniteit om te onderzoeken wat moderne technologieën - zoals Handwritten Text Recognition (HTR), International Image Interoperability Framework (IIIF) en Omeka S - kunnen betekenen in de digitale ontsluiting van een archief.   

Digitaal herenigd  

In 1994 kwamen tien volumen van het Melijn-archief via een gift in bezit van het museum. Een dergelijke belangrijke historische bron over de textielhandel van Antwerpen staat in de archieven van MoMu zeker op z’n plek. Na verder onderzoek naar de archieven van de familie Melijn blijkt dat het archief via verervingen opgedeeld werd. Naast de tien volumen in de MoMu-archieven worden er nog eens tien volumen bewaard bij de Heemkundige kring Jan Vleminck. Binnen de context van dit project werden deze extra handschriften ook gedigitaliseerd. Op deze manier zal het Melijn-archief digitaal in ieder geval herenigd worden.   

Handschriftherkenning 

Met behulp van de applicatie Transkribus (READ-COOP) trainden we een computermodel dat de brieven automatisch leest en transcribeert naar computer-leesbare tekst. Op deze manier kunnen we meer dan 10.000 pagina’s handschrift transcriberen op korte tijd. De automatische transcripties dienen echter nog gecorrigeerd of gevalideerd te worden, en dit door een menselijk oog.  

Online platform 

We verwachten in de loop van 2022 in samenwerking met de UGent een use case uit te rollen van Madoc (Digirati). Dit publicatie- en crowdsourceplatform maakt gebruik van IIIF en Omeka S, en staat toe om verschillende personen tegelijk aan transcripties en annotaties te laten werken. Op dit platform zullen alle twintig de Melijn-volumes digitaal doorbladerbaar zijn, en zullen de brievenkopijenboeken van transcripties voorzien worden. De gebruiker zal ook de transcripties op concrete termen kunnen doorzoeken.  

Projectresultaten

Het project Handschriftherkenning van het archief Melijn liep van juni 2020 t.e.m. december 2021, en is inmiddels formeel afgesloten. Er wordt momenteel nog gewerkt aan de verwezenlijking van een aantal zaken: een definitief platform waarop de verschillende manuscripten te doorbladeren zijn, en een transcriptieworkshop en -marathon (transcribathon) die de validatie van de HTR gegenereerde transcripties evenals de opbouw van een vrijwilligersbasis dient te verzorgen. 

Het project zal resulteren in een online platform waarop de verschillende volumen van het Melijn-archief te doorbladeren en te doorzoeken zijn. We zullen gebruikmaken van het crowdsourcingplatform Madoc (Digirati, UGent). De handgeschreven brieven zullen hierbij (automatisch) getranscribeerd, en dus makkelijker leesbaar en doorzoekbaar zijn. 

Partnerorganisaties

Samenwerking met volgende organisaties/instellingen:  

  • Familie van Havre en Heemkundige Kring Jan Vleminck te Wijnegem voor de digitalisering van het bijkomstige deel archief; tien volumen aan briefkopijboeken en grootboeken.  
  • Samenwerking met meemoo en Vlaamse Erfgoedbibliotheken voor het organiseren van een workshop Transkribus voor de erfgoed- en archiefsector.  
  • Samenwerking met UGent voor de opstart en het gebruik van Madoc. Madoc is een open source annotatie- en crowdsourceplatform, ontwikkeld door Digirati, in samenwerking met de UGent. Draaiende op o.a. Omeka S en IIIF, maakt Madoc het mogelijk om een digitale editie samen te stellen en te publiceren, en om met verschillende personen tegelijk in deze editie annotaties en aanpassingen te maken. In het kader van het Melijn-project is Madoc een geschikt platform om de via Transkribus automatisch gegenereerde transcripties (HTR) van de manuscripten te valideren en/of corrigeren, en om de gedigitaliseerde volumes (en transcripties) makkelijk en gericht te kunnen doorzoeken.  

In Q3 2021 heeft de UGent de samenwerking voor een Melijn use case met Madoc enkele maanden bevroren, dit vanwege prioritering van een bijkomstig project. Inmiddels wordt de samenwerking weer voortgezet en streeft de UGent naar een update van het Madoc-platform (Q2), die een verbeterde usability met zich zou meebrengen, en dus ook de uitwerking van een Melijn use case mogelijk maakt.  We verwachten vanaf Q3 deze use case in de praktijk uit te rollen en een online crowdsourceplatform en digitaal archief te publiceren.  

Praktische info

Looptijd van
Looptijd tot
Organisatienaam
MoMu
Contactpersoon
Dieter Suls
Adres
Nationalestraat 28, 2000 Antwerpen
Telefoon
03 470 27 72
Financieringsbron(nen)

Vlaamse overheid 

Andere projecten

Aan de Universiteit Gent bestaat er een uitgebreide verzameling dialectbanden (592 banden), die echter slecht ...

Conférence internationale. Thème: Les villes coloniales dans une perspective globale Lieu et date: Saint-Louis du ...

Voortraject: het project ‘Mondelinge geschiedenis’Tussen 1 april 2007 en 15 december 2009 werden, volgens de ...