Seite 1 von 1

Wortliste nach OCR-Durchlauf

Verfasst: So, 13.05.2012 18:32
von rekem
Guten Tag,
habe nach Scannen eines älteres Buches einen OCR Durchlauf mit ABBYY Prof 9. gemacht.
Es sind aber noch viele Falscherkennunggen vorhanden, die schwer zu finden sind.
So würde ich gerne eine vollständige Liste aller vorkommenden Worte mit ihrer Häufigkeit haben.
Das Ergebnis soll so aussehen:
Adler 73
Adles 2
Adlet 1

Gibt es so etwas ?

Vielen Dank

Re: Wortliste nach OCR-Durchlauf

Verfasst: So, 13.05.2012 19:07
von lorbass
rekem hat geschrieben:Gibt es so etwas ?
OOo, LO: Nein
Abbyy: Weiß ich nicht.

Gruß
lorbass

Re: Wortliste nach OCR-Durchlauf

Verfasst: Mo, 14.05.2012 08:22
von bonzo

Re: Wortliste nach OCR-Durchlauf

Verfasst: Mo, 14.05.2012 09:39
von rekem
Großartig, genau das war's !
Vielen Dank und Gruß aus Brüssel

Re: Wortliste nach OCR-Durchlauf

Verfasst: Mo, 14.05.2012 18:55
von Constructus
Hallo,

ein Ansatz in LO/ OO wäre auch die Suchen & Ersetzen- Funktion. Dann käme bei Suchen und bei Ersetzen jeweils das gleiche Wort hinein; nach "Suche alle" wird die Anzahl der Ersetzungen angezeigt. Aber das findet natürlich keine auch nur in einem Zeichen anders geschriebenen Wörter.

Viel Erfolg

Constructus

P.s.: manche OCR- Programme sind auch "lernfähig". Dann kann man evtl. später ein besseres Ergebnis erzielen. Das beste Ergebnis erziele ich bei größtmöglicher Auflösung = Feinheit des Bildes und exakt paralleler Ausrichtung der Vorlage auf dem Bildschirm. Mein OCR- Programm ist nicht mehr ganz neu... (TextBridge Pro 8.0), die Ergebnisse sind aber für meinen Bedarf optimal.