CompGen-Meeting am 10.8.2023: Konsolidierung von Familiendaten
Die meisten von uns arbeiten für ihre Familien- und Ahnenforschung primär mit Kirchenbüchern. Doch neben den Kirchenbüchern gibt es noch zahlreiche weitere Quellen, die Informationen über Personen aus früheren Zeiten enthalten (z. B. Steuerlisten, Testamente, Urbare). Da in all diesen Quellen aber häufig die gleichen Personen vorkommen, ist es eine Herausforderung, solche Daten zusammenzuführen. Besonders, wenn viele Daten zu verarbeiten sind, ist eine automatisierte Lösung – z.B. auch für die Duplikat-Erkennung – hilfreich. Eine komplett automatisierte Lösung fehlte im deutschsprachigen Raum bisher. Unser Vorstandsmitglied Jan Michael Goldberg wird im CompGen-Meeting am 10.8.2023 über sein Vorgehen bei der Konsolidierung von Familiendaten berichten.
Beispiel DES-Projekt Leipziger Familien
Im Zuge der Time Machine Leipzig wurde an einer solchen automatisierten Lösung gearbeitet. Am Beispiel der Daten aus den CompGen-Datenerfassungsprojekten „Kartei Leipziger Familien“ mit Daten von über 240.000 Personen aus Kirchenbüchern von 1555 bis 1850 und der „Kartei Leipziger Kreisamtstestamente“ mit zirka 4.800 Erblassern von 1696 bis 1829 wird im Vortrag gezeigt, wie große Datenbestände zusammengeführt werden können.
Zusammenführen von großen Datenmengen in genealogischen Projekten
Der Vortrag richtet sich vor allem an Datenbank-erfahrene Genealoginnen und Genealogen. Vorgestellt wird eine Vorgehensweise, wie große Datenmengen zusammengeführt werden können. Das dahinterliegende Programm (Python-basiert) ist online frei zugänglich. Besonders geeignet erscheint es als Hilfestellung bei der Erstellung von Ortsfamilienbüchern. Als Datengrundlage hierfür kann z.B. die tabellarische Erfassung der jeweiligen Kirchenbücher genutzt werden.
Ein wissenschaftlicher Aufsatz zum Thema, an dem unser Referent mitgearbeitet hat, ist hier veröffentlicht.
CompGen lädt Sie zu diesem geplanten Zoom-Meeting ein:
Thema: „Konsolidierung von Familiendaten – Methoden des Record Linkage historischer Datenbestände“
Referent: Jan Michael Goldberg
Termin: Donnerstag, 10. August 2023, 20:00 Uhr MEZ
Achtung:
Der Vortrag wird auf Wunsch des Referenten NICHT aufgezeichnet (= wird also NICHT in unserem YouTube-Kanal zur späteren Ansicht stehen).
Dem Zoom-Meeting beitreten:
https://us06web.zoom.us/j/82371338268?pwd=QWV6W…
Meeting-ID: 823 7133 8268
Kenncode: 360586
Wir freuen uns auf Eure Teilnahme!