Historische Zeitungen werden mit Transkribus lesbar gemacht
Auf der Facebookseite Zeitungsportal NRW teilt Michael Herkenhoff von der Universitäts- und Landesbibliothek Bonn Neuigkeiten zur Volltexterkennung von historischen Zeitungsbeständen mit: Der Auftrag zur OCR-Erkennung ist vergeben, der Volltext wird mit der Software Transkribus Platform erzeugt werden. In diesem Jahr wird mit einer Zeitung ein Testlauf durchgeführt, um Workflows und Verfahren zu proben. Ab 2021 wird der gesamte Bestand nach und nach texterkannt. Ende 2022 werden alle Zeitungen im Volltext durchsuchbar sein. Dazu wird voraussichtlich 2022 die Suchoberfläche angepasst.
Das Zeitungsportal zeit.punktNRW wird vom Land NRW gefördert. In diesem Projekt werden Lokalzeitungen aus NRW im Zeitraum von 1801-1945 digitalisiert. Die im Portal gezeigten historischen Zeitungen aus 243 Orten erschienen zwischen 1748 und 1979, überwiegend aus Nordrhein-Westfalen (plus zwei aus Belgien), aber auch einige Zeitungen aus Rheinland-Pfalz und anderen Bundesländern sind vertreten.