METAe - Meta Data ENGINE

  • Das METAe Projekt war ein Forschungs- und Entwicklungsprojekt, co-finanziert von der Europäischen Kommission (Fünftes Rahmenprogramm, IST Programm, Bereich „Digital Heritage and Cultural Content“).
  • Das Projekt lief von September 2000 bis September 2003 und umfasste 14 Partner aus sieben europäischen Ländern und den USA.

Partner im METAe Projekt waren:

  • Universität Innsbruck (Österreich), Projektkoordinator,
  • Universität Flo­renz (Italy),
  • Bibliotéque Nationale de France,
  • Nationalbibliothek Norwegens,
  • Friedrich Ebert Stiftung (Deutschland),
  • CCS Compact Computer Systeme (Deutschland),
  • Cornell Library University (USA)
  • ABBYY ;-)

METAe ist/war ein Konsortium von europäischen Bibliotheken und Digitalisierungsunternehmen, die zusammen an der METAe Engine arbeiteten, einem Softwarepaket, das speziell für die Organisation des Arbeitsflusses bei der Archivierung und Konvertierung historischer Materialien wie Büchern, Zeitschriften, und Zeitungen konzipiert wurde.

Weitere Informationen über METAe: http://meta-e.aib.uni-linz.ac.at/index.html

ABBYYs Rolle im METAe Projekt

Entwicklung der OCR-Technologie für Fraktur

Eine Unterart der gotischen Schriften, sogenanntes Fraktur, war im 18. bis zur Mitte des 20 Jahrhunderts in vielen europäischen Ländern weit verbreitet, z. B. in Deutschland, Österreich, Norwegen, Schweden, Finnland, Tschechien, Estland, Litauen, in der Schweiz und in den Niederlanden. Im Fall der deutschen Sprache wurde Fraktur bis zum Jahr 1941 in etwa 80% aller gedruckten Dokumente verwendet.

Es ist eine Tatsache, dass heutzutage eine große Anzahl von Lesern keine Texte in Fraktur lesen kann. Demnach war es von großer Bedeutung, eine Onifont-OCR zu entwickeln, die Fraktur ohne vorheriges Training erkennen kann. Zusätzlich zu den speziellen Classifiern hängt die Qualität der OCR-Ergebnisse maßgeblich von den im Hintergrund genutzten Wörterbüchern ab. Ein gutes Wörterbuch, und nicht nur eine Liste von Wörtern, verbessert die Erennungsrate erheblich.

Es wurdem fünf historische Wörterbücher entwickelt, die

  • den historischen Stand der Rechtschreibung in den Sprachen Englisch, Französisch, Deutsch, Italienisch und Spanisch wiedergeben.
  • zwischen 50.000 und 100.000 historische Wortstämme enthalten und damit über 90% der in historischen Texten vorkommenden Wörter abdecken sollten.

ABBYY FineReader XIX wurde auf Basis der Bedürfnisse von Universitäten und Forschungszentren entwickelt. Das Produkt wurde durch eine Kooperation mit dem METAe Projekt entwickelt.

Ein SDK (software development kit), welches die Fraktur Classifier und die historischen Wörterbücher enthält, ist erhältlich.

Zurück zu: Forschungs- & Digitalisierungsprojekte