Unterschiedliche Ansätze zur Qualitätsoptimierung bei der OCR historischer Texte

Das Projekt IMPACT wurde von der Europäischen Kommission als ein wissenschaftliches Forschungsprojekt gegründet. Vier Jahre lang arbeiten mehrere Oranisationen an einer Reihe von Technologien, um den Zugang zu historischen Texten zu verbessern (IMProving ACcess to Texts).

Wenn man die "natürlichen Herausforderungen" bei der Digitalisierung und Erkennung alter Dokumente ansieht, so wird schnell deutlich, dass es keine einfache Lösung gibt, mit der die Ergebnisse sofort deutlich verbessert würden.

Um die beste Qualität innerhalb eines Projektes zu erhalten, müssen alle Verarbeitungsschritte optimiert werden:

  • Erzielung der bestmöglichen Bild-/Scanqualität
  • Säuberung/Optimierung der existierenden Dokumentenbilder, sodass sie bei der OCR bessere Ergebnisse liefern
  • Sicher stellen, dass die korrekten Dokumentstellen für die Erkennung gefunden/definiert werden
  • Anwendung einer guten/passenden OCR-Technologie/Engine
  • Nutzen externer Resourcen wie Wörterbücher, um die Erkennungsergebnisse zu verbessen
  • … Seite in Bearbeitung


Zurück zu: Fraktur OCR - Ein Überblick