Wortliste nach OCR-Durchlauf

Das Textverarbeitungsprogramm

Moderator: Moderatoren

rekem
*
Beiträge: 13
Registriert: Mo, 09.06.2008 09:32

Wortliste nach OCR-Durchlauf

Beitrag von rekem »

Guten Tag,
habe nach Scannen eines älteres Buches einen OCR Durchlauf mit ABBYY Prof 9. gemacht.
Es sind aber noch viele Falscherkennunggen vorhanden, die schwer zu finden sind.
So würde ich gerne eine vollständige Liste aller vorkommenden Worte mit ihrer Häufigkeit haben.
Das Ergebnis soll so aussehen:
Adler 73
Adles 2
Adlet 1

Gibt es so etwas ?

Vielen Dank
Benutzeravatar
lorbass
********
Beiträge: 4116
Registriert: Mo, 01.05.2006 21:29
Wohnort: Bonn

Re: Wortliste nach OCR-Durchlauf

Beitrag von lorbass »

rekem hat geschrieben:Gibt es so etwas ?
OOo, LO: Nein
Abbyy: Weiß ich nicht.

Gruß
lorbass
bonzo
******
Beiträge: 994
Registriert: Do, 23.03.2006 17:41
Wohnort: Bietigheim-Bissingen

Re: Wortliste nach OCR-Durchlauf

Beitrag von bonzo »

Windows 7
LO 5.0.2
Oo 4.1.2
rekem
*
Beiträge: 13
Registriert: Mo, 09.06.2008 09:32

Re: Wortliste nach OCR-Durchlauf

Beitrag von rekem »

Großartig, genau das war's !
Vielen Dank und Gruß aus Brüssel
Benutzeravatar
Constructus
*******
Beiträge: 1610
Registriert: Mo, 21.01.2008 18:08
Wohnort: 20 Jahre Brilon - 40 Jahre Essen- Steele

Re: Wortliste nach OCR-Durchlauf

Beitrag von Constructus »

Hallo,

ein Ansatz in LO/ OO wäre auch die Suchen & Ersetzen- Funktion. Dann käme bei Suchen und bei Ersetzen jeweils das gleiche Wort hinein; nach "Suche alle" wird die Anzahl der Ersetzungen angezeigt. Aber das findet natürlich keine auch nur in einem Zeichen anders geschriebenen Wörter.

Viel Erfolg

Constructus

P.s.: manche OCR- Programme sind auch "lernfähig". Dann kann man evtl. später ein besseres Ergebnis erzielen. Das beste Ergebnis erziele ich bei größtmöglicher Auflösung = Feinheit des Bildes und exakt paralleler Ausrichtung der Vorlage auf dem Bildschirm. Mein OCR- Programm ist nicht mehr ganz neu... (TextBridge Pro 8.0), die Ergebnisse sind aber für meinen Bedarf optimal.
EDV ist wunderbar - o Wunder, wenn sie funktioniert! {°L*}

Freie Offices auf div. Linuxen + 3 VBoxen mit WIN2K
|| LibO + AOO, auf Linux und WIN2K; portable OO & Co. auf WIN
Genaue Typisierung unmöglich, alles ist "im Fluß"
Antworten