Region auswählen | Seitenübersicht | Suchen | Feedback | Kontakt   
ABBYY Software House

 ABBYY entwickelt OCR Software und Software für Formularverarbeitung und Linguistik 

Suchen
Home > Produkte > ABBYY FineReader XIX
Produkte
ABBYY FineReader XIX
Systemvoraussetzungen
Kontaktadressen
F.A.Q.
Erfolgsstories
 FineReader XIX
 Broschüre


Deutsch - English(UK) - Français - English(US)






ABBYY FineReader XIX für Fraktur

Omnifont OCR für Erkennung von Frakturschrift
ABBYY FineReader XIX ist eine spezielle Version der vielfach ausgezeichneten OCR Software FineReader für die Erkennung von Texten, die zwischen 1800 und 1938 in Frakturschrift gedruckt wurden. ABBYY FineReader XIX ist die erste Omnifont OCR Software am Markt für Frakturschrift.

Die Herausforderung: Digitalisierung alter Texte
Bis heute hatten noch nicht ausgereifte Technologien und die Einzigartigkeit von Texten, die in unterschied­lichen alten Schriftarten verfasst waren, die automati­sche Erfassung dieser Texte durch Computer erschwert wenn nicht gar unmöglich erscheinen lassen. Anspruchsvolle Wörterbücher und Sprachmodelle, die für die Analyse und Verifizierung der Texte verwendet werden können, gab es bis jetzt noch nicht. Computer­systeme, die diese Texte lesen konnten, mussten erst viele Stunden trainiert werden, um Schriftarten und Zei­chen zu erkennen, die heute gar nicht mehr verwendet werden.


Gebrochene Schriften entstanden erstmals im 12. Jahrhun­dert und entwickelten sich im Laufe der Jahrhunderte in vielen verschiedenen Variationen weiter. Die Frakturschrift, vorherrschend in Deutschland, wurde durch Kaiser Maxi­milian eingeführt und hat sich schnell in vielen Teilen Euro­pas etabliert. Die Besonderheiten dieser Schrift beinhalten das verlängerte "s" und Ligaturen oder zusammenhängen­de Buchstaben bei bestimmten Kombinationen. Die Erscheinungshäufigkeit dieser Eigenart ist entscheidend für das Verständnis von Frakturschrift, wenn man Erkennungs­technologien für Texte, die aus der Zeit zwischen 1800 und 1938 entstanden, entwickeln möchte.

Die ABBYY Lösung: Erste Omnifont OCR für Frakturschrift
ABBYY FineReader XIX ist die erste Omnifont OCR für Fraktur und somit eine Lösung für Anwender, die alte Texte mit wenig Aufwand scannen und umwandeln möchten. Dies wurde durch Kombination einer besonders intelligenten Erkennungs-Technologie und ausführlichen linguistischen Studien erreicht:

OCR Systeme analysieren Texte und stellen Hypothesen darüber auf, welcher Buchstabe oder welches Wort durch ein Bild dargestellt werden. Diese Hypothesen werden dar­aufhin im Kontext analysiert und durch den Einsatz anspruchsvoller OCR Wörterbücher, die aus Sprachmodel­len bestehen, verifiziert. Diese Sprachmodelle sind komplexe Datenbanken, die das Vokabular einer Sprache beschreiben. Moderne OCR Systeme verfügen jedoch über keine Sprachmodelle für ältere Schriftarten oder Schreib­weisen. Nach der ABBYY-eigenen Entwicklung von Modellen für fünf europäische Sprachen speziell für diese Zeit können auch derartige Texte nun verarbeitet werden.

Dabei wurden 10 verschiedene Wörterbücher und mehr als 105 Bücher, die zwischen 1808 und 1930 veröffentlicht wurden, analysiert. Linguisten überprüften Wort­stämme, identifizierten Wörter, die bei der Entwicklung der Sprache nicht weitergeführt wurden, und bestimmten die korrekten Paradigmen, um die Sprachmodelle mit der entsprechenden Grammatik jener Zeit abzugleichen.

Mehr als 500.000 Einträge wurden zusätzlich manuell mit bestehenden Wörterbüchern von FineReader ver­glichen. Grammatikalische Paradigmen und Wortentwicklungen wurden berücksichtigt, um 159 historische Grammatik-Paradigmen, die in den heutigen Sprachmo­dellen fehlen, hinzuzufügen. Diese Sprachmodelle wur­den dann zusammengestellt und an Dokumenten in Frak­turschrift getestet.

Um Frakturschrift zu erkennen, haben die Entwicklungs­teams von ABBYY spezielle Klassifizierer oder Alphabete erstellt, die Frakturzeichen erkennen können. Das bedeu­tet, dass für jedes Zeichen durchschnittlich 2.500 Varia­tionen hinterlegt, ein neues Muster-Alphabet angelegt und 31.000 Seiten aus verschiedenen Quellen gesammelt und getestet wurden. Mit einer Vielzahl von Beispieltex­ten bekam die Erkennungs-Engine die Feinabstimmung, um die Besonderheiten des Fraktur-Alphabets wie Ligatu­ren oder zusammenhängende Buchstaben zu erlernen. Das neue Alphabet wurde dann dem herkömmlichen FineReader System mit einer entsprechenden Oberfläche hinzugefügt und nochmals ausgiebig getestet.


Zusammenarbeit mit großen Archivierungsinstitutionen
Bei der Entwicklung von ABBYY FineReader XIX wurden auch die Bedürfnisse von Universitäten und Forschung­seinrichtungen berücksichtigt. Das Produkt wurde in Zusammenarbeit mit dem weltweiten METAe Projekt entwickelt. METAe ist ein Zusammenschluss von Biblio­theken und Digitalisierungsfirmen aus ganz Europa, die zusammen die so genannte METAe Engine entwickeln, um die Umwandlung und Archivierung von historischen Dokumenten wie Büchern, Journalen, Magazinen und Zeitungen mit Hilfe von Computern zu bewerkstelligen. ABBYY FineReader XIX ist dafür eine Hauptkomponente, um die unschätzbaren historischen Dokumente zu archivieren. Partner in dem METAe Projekt sind unter anderem die Universität von Innsbruck, die Universität von Florenz, die Nationalbibliothek von Frankreich, die Nationalbibliothek von Norwegen, die Friedrich-Ebert-Stiftung, CCS Compact Computer Systeme (Deutschland) und die Cornell Library University (USA).

Spezifikationen

Systemvoraussetzungen:

  • IBM-kompatibler PC mit Intel Pentium® 200 MHz-Prozessor oder höher
  • Microsoft Windows XP, Microsoft Windows® 2000, Microsoft Windows NT 4.0 (mit Service Pack 3 oder höher) oder Windows® ME/98/95
  • 32 MB RAM, 16 MB RAM für jeden weiteren PC (in einem Multi-Prozessor System)
  • 40 MB freier Festplattenspeicher (50 MB empfohlen)
  • Microsoft® Internet Explorer 4.0 oder höher (Microsoft® Internet Explorer 5.01 ist im Auslieferungspaket enthalten)
  • 100% TWAIN-kompatibler Scanner, Digitalkamera oder Faxmodem
  • VGA- bzw. anderer hochauflösender Monitor
  • CD-ROM-Laufwerk
  • Maus o.ä.
  • USB-Anschluss für Hardware-Key
Unterstützte Bildformate:
  • BMP: schwarzweiß, grau, Farbe
  • PCX, DCX: schwarzweiß, grau, Farbe
  • JPEG: grau, Farbe
  • TIFF: schwarzweiß, grau, Farbe, mehrseitig (Komprimierungsmethoden: unkomprimiert, CCITT Gruppe 3, CCITT Gruppe 4, Fax (2D), Packbits, JPEG)
  • PDF

Unterstützte Formate zum Abspeichern von Erkennungsergebnissen

  • Microsoft®Word XP, 2000, 97, 95
  • RTF
  • TXT
  • Unicode Text
  • Microsoft®Excel XP, 2000, 97, 95
  • HTML 3.2/4.0
  • Unicode HTML 3.2/4.0
  • DBF
  • CSV
  • PDF 3.0/4.0 (Text und Bild, Text über dem Bild, Text unter dem Bild, nur Bild)

Kontaktadressen

ABBYY Sales support: sales@abbyyeu.com


Sollten Sie Fragen haben, wenden Sie sich an uns:

Telefonnummern
Austria 0800 292 706
Germany 0800 2008800
Switzerland 0800 561 227
Belgium 0800 80967
Denmark 80200042
Finland 0800 9 5295
France 0805 770064
Greece 00800 441 45300
Ireland 1800 946794
Iceland 8008800
Italy 800920032
Luxemburg 800 221 33
Netherlands 0800 0200171
Norway 800 36970
Portugal 800 844 427
Spain 900 81 03 69
Sweden 0200 810345
United Kingdom 0800 028 4515
Impressum | Kontakt
© 1996-2004 ABBYY Software House