Vortrag am CompGen-Stand zur Genealogica 2022:
“Record Linkage” am Beispiel Leipziger Karteikarten
Am 22.11.2019 berichtete Thekla Kluttig hier im Blog:
“Dank fleißiger Erfasserinnen und Erfasser hatten ab März 2018 über 228.000 Personeneinträge zur Leipziger Bevölkerung aus der Kartei Leipziger Familien erfasst werden können. Das Sächsische Staatsarchiv, Staatsarchiv Leipzig stellte die Kartei zur Verfügung und begleitete das Projekt; CompGen digitalisierte die Kartei und organisierte das DES-Projekt technisch und personell.
Unser Vorstandsmitglied Georg Fertig berichtete im Mai 2019 auf dem diesjährigen Sächsischen Archivtag unter dem Motto Erschließung 2.0 über den erfolgreichen Abschluss und gab bereits einen kurzen Ausblick auf das Folgeprojekt: Die Erfassung von Daten zu (Leipziger) Testamenten aus dem Zeitraum 1696–1829. Dieses Projekt startet nun und wird die Datenlage zur Leipziger Bevölkerung in diesem Zeitraum weiter verbessern. Perspektivisch sollen die Daten auch mit den Daten aus dem freien Projekt Altes Leipzig verknüpft werden.”
Nach 14 Monaten konnte sie im Februar 2021 den Abschluss des DES-Projekts Leipziger Testamente melden.
Vortrag am CompGen-Stand zur Genealogica 2022
Unser Mitglied Jan Michael Goldberg von der Martin-Luther-Universität Halle arbeitet für die Leipziger Time Machine weiter an der Verknüpfung der Daten.
Darüber wird er uns am CompGen-Stand auf der Genealogica 2022 am Sonntag, den 3. April 2022, um 10 Uhr einen Bericht geben.
Automatisierte Verknüpfung (“Record Linkage”)
Neben den Kirchenbüchern gibt es noch zahlreiche andere Quellen, die Informationen über Personen aus früheren Zeiten enthalten. Eine Herausforderung ist es, diese Daten zusammenzuführen. Besonders, wenn viele Daten zu verarbeiten sind, ist eine automatisierte Lösung dabei hilfreich.
Im Zuge der Time Machine Leipzig wird an einer solchen automatisierten Lösung gearbeitet. Am Beispiel der Daten aus den CompGen-Datenerfassungsprojekten “Kartei Leipziger Familien” und “Kartei Leipziger Kreisamtstestamente” wird gezeigt, wie große Datenbestände zusammengeführt werden können.
Der Vortrag richtet sich eher an fortgeschrittene Genealoginnen und Genealogen. Am Ende wird hierbei ja die zentrale Frage sein: “Wie kann ich es nutzen?” Und die Antwort dazu lautet: Noch ist es nicht verfügbar und am Ende wird es auch kein Programm, wie man es kennt, sondern ein Python-Programmiercode. Den kann man nur mit einer Programmierumgebung ausführen.
Jan Michael Goldberg
“Record Linkage” am Beispiel Leipziger Karteikarten