Guten Tag,
habe nach Scannen eines älteres Buches einen OCR Durchlauf mit ABBYY Prof 9. gemacht.
Es sind aber noch viele Falscherkennunggen vorhanden, die schwer zu finden sind.
So würde ich gerne eine vollständige Liste aller vorkommenden Worte mit ihrer Häufigkeit haben.
Das Ergebnis soll so aussehen:
Adler 73
Adles 2
Adlet 1
Gibt es so etwas ?
Vielen Dank
Wortliste nach OCR-Durchlauf
Moderator: Moderatoren
Re: Wortliste nach OCR-Durchlauf
OOo, LO: Neinrekem hat geschrieben:Gibt es so etwas ?
Abbyy: Weiß ich nicht.
Gruß
lorbass
Re: Wortliste nach OCR-Durchlauf
Windows 7
LO 5.0.2
Oo 4.1.2
LO 5.0.2
Oo 4.1.2
Re: Wortliste nach OCR-Durchlauf
Großartig, genau das war's !
Vielen Dank und Gruß aus Brüssel
Vielen Dank und Gruß aus Brüssel
- Constructus
- *******
- Beiträge: 1610
- Registriert: Mo, 21.01.2008 18:08
- Wohnort: 20 Jahre Brilon - 40 Jahre Essen- Steele
Re: Wortliste nach OCR-Durchlauf
Hallo,
ein Ansatz in LO/ OO wäre auch die Suchen & Ersetzen- Funktion. Dann käme bei Suchen und bei Ersetzen jeweils das gleiche Wort hinein; nach "Suche alle" wird die Anzahl der Ersetzungen angezeigt. Aber das findet natürlich keine auch nur in einem Zeichen anders geschriebenen Wörter.
Viel Erfolg
Constructus
P.s.: manche OCR- Programme sind auch "lernfähig". Dann kann man evtl. später ein besseres Ergebnis erzielen. Das beste Ergebnis erziele ich bei größtmöglicher Auflösung = Feinheit des Bildes und exakt paralleler Ausrichtung der Vorlage auf dem Bildschirm. Mein OCR- Programm ist nicht mehr ganz neu... (TextBridge Pro 8.0), die Ergebnisse sind aber für meinen Bedarf optimal.
ein Ansatz in LO/ OO wäre auch die Suchen & Ersetzen- Funktion. Dann käme bei Suchen und bei Ersetzen jeweils das gleiche Wort hinein; nach "Suche alle" wird die Anzahl der Ersetzungen angezeigt. Aber das findet natürlich keine auch nur in einem Zeichen anders geschriebenen Wörter.
Viel Erfolg
Constructus
P.s.: manche OCR- Programme sind auch "lernfähig". Dann kann man evtl. später ein besseres Ergebnis erzielen. Das beste Ergebnis erziele ich bei größtmöglicher Auflösung = Feinheit des Bildes und exakt paralleler Ausrichtung der Vorlage auf dem Bildschirm. Mein OCR- Programm ist nicht mehr ganz neu... (TextBridge Pro 8.0), die Ergebnisse sind aber für meinen Bedarf optimal.
EDV ist wunderbar - o Wunder, wenn sie funktioniert! {°L*}
Freie Offices auf div. Linuxen + 3 VBoxen mit WIN2K
|| LibO + AOO, auf Linux und WIN2K; portable OO & Co. auf WIN
Genaue Typisierung unmöglich, alles ist "im Fluß"
Freie Offices auf div. Linuxen + 3 VBoxen mit WIN2K
|| LibO + AOO, auf Linux und WIN2K; portable OO & Co. auf WIN
Genaue Typisierung unmöglich, alles ist "im Fluß"