Transkribus, is dat misschien een medische term voor een overdraagbare, jeukende aandoening? Of heeft het te maken met een skriba in de overgang? Niets van dat alles. Transkribus is slimme software, het maakt gebruik van AI, artificial intelligence. Het is in staat geschreven tekst om te zetten naar drukletters. Dat wordt ook wel HTR, de Engelse afkorting van handschriftherkenning, genoemd. Het bijzondere van Transkribus is dat het (ook) in staat is om oude handschriften te herkennen en om te zetten. Je moet dan wel aangeven in welke taal en in welke eeuw het origineel is opgegesteld. Geen wonder dat archiefinstellingen zeer geïnteresseerd zijn. Maar ook mensen die uit hoofde van hun werk of hobby nog wel eens worstelen met oude handschriften, zullen hier baat bij hebben. Ook niet oninteressant, het gebruik is goeddeels gratis en redelijk eenvoudig.
Zoals de Engelsen zeggen, the proof of the pudding is in the eating. Daarom hieronder een paar testjes van wat het systeem vermag. Het eerste voorbeeld is een pagina uit het proces verbaal van een rechtszitting die in 1854 heeft plaats gevonden. Ik heb de afbeelding, een deel van het requisitoir van de Officier, wat contrastrijker gemaakt zodat de tekst er wat meer uitspringt.
by het Provinciaal Geregtshof
en Noord-Holland, in de zaak van
Johann Heinrich Kemper,
in hechtenis
De Procureur Generaal by het Provinciaal Geregtshof
in NoordHolland;
Gezien het Arrest van voornoemd Geregtshof, in Raad-
kamer vergaderd, van den 11 den september 1854;
Gezien de akte van beschuldiging, ten gevolge van dat
arrest opgemaakt;
Gelet op het onderzoek in de openbare teregtzittingen
gehouden op 3, 4 en 5 October 1854;
Gezien de artikelen 206, 207, 211 en 216 van het Wetboek van
strafvordering; 295, 296, 297, 298, 302, 304,2, 381nrs 1, 3, 4 en 5 102,
382, 384, 386 no.1, 36 en 52 van dat van strafregt, 1, 10, 13 no 3 en 25
der wet van 29 Juny 1854 (staatsblad no 102);
Requireert, dat de beschuldigde Johann Heinrich Kem-
per worde schuldig verklaard aan al de hem ten laste
gelegde feiten, en alzoo:
1o aan diefstal, met geweldpleging en gewapend gepleegd
by nacht, in een bewoond huis, door middel van bin-
nenbraak;
2o aan moord, gepleegd op eene vrouw en twee kinderen;
3o aan poging tot moord, gepleegd op eene vrouw en een
kind, welke poging beide malen door uiterlyke bedrij-
ven gebleken, en tot begin van uitvoering overgesla-
gen, hare uitwerking niet heeft gemist, dan door
toevallige en van des daders wil onafhankelyke
omstandigheden; en
zulks de onder de nummers 2 en 3 vermelde misda-
den, ten einde den in de eerste plaats genoemden
diefstal voor te bereiden, gemakkelijk te maken
en de ontdekking daarvan te voorkomen.
Requireert dientengevolge, dat de beschuldigde
Johann Heinrich Kemper worde veroordeeld tot de
straffe des doods, door den scherpregter uit te voe-
ren op een schavot op eene der openbare plaatsen
binnen
Wanneer je niet gewoon bent schuinschrift te lezen, dan ben je met Transkribus goed af. Het aantal correcties blijft binnen de perken en het scheelt je een hoop tikwerk vergeleken met de methode van het op de ouderwetse manier teksten moeten overtikken. Daar bestaat overigens ook een handig programmaatje voor: Transcript, freeware van Jacob Boerema.
Bovenstaande tekst is, ook in technisch opzicht, goed leesbaar. Maar wat is het resultaat wanneer we Transkribus loslaten op het handschrift van de griffier in dezelfde rechtszaak. Ook hij schrijft schuin maar net iets schuiner, vlakker en dus moeilijker leesbaar dan de Officier van Justitie in het eerdere voorbeeld. De gedrukte alinea's moeten voor Transkribus geen probleem vormen. Ook deze tekst is van wat meer contrast voorzien.
teregtstelling van den Beschuldigde bevolen is, benevens de Acte van Beschuldiging,
lyst der Getuigen, welke in deze zaak moeten worden gehoord.
De lyst der Getuigen wordt door den Griffier duidelyk voorgelezen, en bevonden, dat
de namens den Procureur-Generaal gedagvaarde en op de list vermelde Getuigen tegen-
voordig zyn, behalve de twee- en zes en dertigste, Willem Rin-
geling en Hanna Meyer Frank huisvrouw van Mozes
Salomon Groen, ten aanzien van welke eerste, de Procureur
Generaal mededeelt dat hij tijdens de dagvaarding reeds
zich buitenslands bevond, terwijl van de tweede een certi-
ficaat is ontvangen van den heer F.C. Winkler, genees-
heer en verloskundige aan het Nieuwe Diep, houdende dat
de getuige Hanna Meyer Frank, door zwangerschap buiten
staat is te verschijnen.
De Procureur Generaal de voortzetting der zaak gere…..
en de advocaat des beschuldigden hiertegen geen bezwaar
hebbende, besluit het Hof, na deliberatie, overeenkom-
stig het requisitor.
ven, en beveelt de overigen zich te begeven naar de voor hen bestemde Kamer, behalve de ..
laatsten welke verlof zich te verwijderen met last om den
volgenden dag ten 10 ure weder tegenwoordig te zijn
Hij vraagt aan de Getuige hare Namen, Voornamen, Ouderdom, Beroep en
Woonplaats, en doet voorts de overige vragen by het 183ste Artikel van het Wetboek van
Strafvordering bevolen, waarop de Getuige antwoordt, en, na vervolgens den by de Wet
voorgeschreven Eed in handen van den President te hebben afgelegd, zeggende, met opste-
king der twee voorste vingers van de regterhand: Zoo waarlijk helpe mij God Almagtig!
eene mondelinge verklaring aflegt.
De president vraagt aan den beschuldigde of hij iets
heeft in te brengen tegen hetgeen door de getuige is verklaard
Vervolgens zijn één voor één binnengekomen de dertien
de twaalfde getuige Maria Alida Prickwinkel, oud 4 jaren
van wier getuigenis het Openbaar Ministerie verklaart te
Het verschil tussen de gedrukte en de handgeschreven tekst is evident, het handschrift van de griffier is duidelijk wat te veel voor Transkribus. Daarbij moet wel gezegd worden dat dit zelflerende software is. Na verloop van tijd zullen de resultaten dus steeds beter worden. Dat in aanmerking nemend, is dit ontegenzeggelijk een mooie ontwikkeling. Wel moet er, bij grotere hoeveelheden transcripties, voor betaald worden. Er is nog een andere mogelijkheid en die heet Loghi. Dat is open source software maar eigenlijk alleen maar geschikt voor mensen met een behoorlijke IT-kennis. Het wordt ontwikkeld door de KNAW en het Nationaal Archief.