Daten der Citizen Science für die Wissenschaft?
Katrin Moeller, Vorstandsmitglied des Vereins für Computergenealogie, stellt in ihrem Vortrag die Bedeutung von sogenannten „Citizen-Science“-Datenbeständen für die wissenschaftliche Forschung vor, am Beispiel der Adressbuchdaten von CompGen. „Citizen Science“-Projekte werden an Universitäten und Forschungsinstituten immer beliebter. Das meint solche, in denen Freiwillige außerhalb von akademischen Einrichtungen Daten erheben und diese in wissenschaftlichen Untersuchungen genutzt werden. In der Geschichtswissenschaft werden allerdings drei Hindernisse für eine solche Zusammenarbeit gesehen: Erstens ob man mit „spröden“, „spärlichen“ Informationen überhaupt Sinnvolles herausfinden kann, auch wenn sie in großer Zahl vorliegen. Zweitens, ob diese Daten denn überhaupt fehlerfrei genug sind. Und drittens, ob es möglich ist, die Entstehung der Daten gut genug zu verstehen, sowohl was den Aufbau der Originalquellen betrifft als auch in Bezug auf die Erfassungsprojekte.
Moeller diskutiert diese Herausforderungen anhand der Adressbuchdatenbanken des Vereins für Computergenealogie, die Millionen von Einträgen umfassen. Sie führt dabei verschiedene Schritte der Qualitätskontrolle und Datenanreicherung vor, bei denen vor allem der Einsatz sogenannter „kontrollierter Vokabulare“ wichtig ist. Ein solches ist z.B. das bereits in den Erfassungsprojekten mit eingespielte Geschichtliche Ortsverzeichnis, ein anderes ist die Ontologie der historischen deutschsprachigen Amts- und Berufsbezeichnungen (OhdAB), ein drittes die Zuordnung von Vornamen zum Geschlecht. Durch solche Anreicherungen, durch die damit verbundene Qualitätsprüfung und durch ein genaues Lesen der enthaltenen Informationen wird es erst möglich, inhaltliche Forschungsergebnisse zu schaffen, zum Beispiel zur Berufstätigkeit von Frauen.
Das Video startet hier oder drücke auf den Pfeil auf dem Video.