Home Korpus

Das nebenstehende Bild ist eine Seite aus Rudolf Zäch: Die neuzeitliche Küche. Wallisellen, 1931.

Wie dieser sind viele Texte aus der ersten Jahrhunderthälfte in Fraktur publiziert, einer Schrift, die von jüngeren Lesern oft nicht mehr mühelos gelesen werden kann. Die Digitalisierung macht solche Texte wieder neu zugänglich.

Nachdem ein Text angeschafft wurde, werden zuerst alle relevanten bibliografischen Angaben in einer Datenbank erfasst.

Für die Digitalisierung muss oft zuerst das Originalbuch zerschnitten werden, damit die die Seiten einzeln gescannt und für das OCR (Optical Character Recognition - automatische Texterkennung) aufbereitet werden können.

Die hier ausgewählte Seite enthält eine ganze Reihe von Herausforderungen, so das automatische Erkennen der Frakturschrift und der gesperrten Wörter, wofür es eines speziellen Programms bedarf. Weiter muss der Umgang mit speziellen Textelementen wie den Marginalien, den Aufzählungen und der Anmerkung bestimmt werden.