Home DE
Die Herausforderung: Digitalisierung alter Dokumente
Die Besonderheiten dieser Schrift beinhalten das verlängerte „s“ und Ligaturen oder zusammenhängende Buchstaben bei bestimmten Kombinationen. Die Erscheinungshäufigkeit dieser Eigenart ist entscheidend für das Verständnis von Frakturschrift, wenn man Erkennungstechnologien für Texte, die aus der Zeit zwischen 1800 und 1938 entstanden, entwickeln möchte.
Die Lösung von ABBYY: Standard OCR gegen "Gothic/Fraktur" OCR
*Verarbeitet mit ABBYY Recognition Server: Fraktur de- & aktiviert
Ergebnis:
Die Bildbeispiele zeigen klar und deutlich, dass für Fraktur optimierte Erkennungstechnologien eingesetzt werden müssen, wenn es gilt gedrucktes, historisches Material mit alten Schriften zu verarbeiten.
Dies gilt natürlich auch für Dokumente in denen „alte“ und „neue“ gemischt Schriften verwendet werden.
-
-
Digitaler Zugang zur Vergangenheit
Das Staatsarchiv Zürich und das Institut für Computerlinguistik der Universität Zürich konvertieren mit ABBYY Fraktur OCR 11.000 Seiten an Regierungsratsbeschlüssen, um diese öffentlich online zugänglich zu machen.
Stattsarchiv Zürich
-
-
-
IMPACT Centre of Competence
… is a new, none profit organisation with the mission to make the digitisation of historical printed text “better, faster, cheaper”. It will provide tools, services and facilities to further advance the state-of-the-art in the field of document imaging, language technology and the processing of historic text.