Zeichen "SHAPE" - wie suchen
Verfasst: So, 26.08.2012 12:36
Nach dem Einscannen von Texten (per Scanner) und der anschließenden OCR-Beabearbeitung (Ergebnisse im doc-Format) finden sich unter OpenOffice in den resultierenden Text-Dateien Zeichen, die als schmale graue Felder unter dem nächsten (!) Zeichen dargestellt werden; fährt man mit dem Cursor darüber, erscheint der Begriff "SHAPE". Diese Zeichen möchte ich nun per Suchen und Ersetzen löschen. Das scheint aber nicht zu funktionieren.
Befeglsweise habe ich aus der Textdatei per Archivmanager die Datei content.xml extrahiert. Dort finde ich folgende "Befehle:"
<text:user-field-decl office:value-type="string" office:string-value="" text:name="SHAPE"/></text:user-field-decls>
und:
<text:user-field-get text:name="SHAPE"/>
Entferne ich das zweite Code-Schnipsel durchgängig in content.xml und füge dann content.xml wieder per Archiv-Manager in die odt-Datei ein, sind die störenden Zeichen fort. Das ist aber ein ziemlich aufwändiger Workaround.
Befeglsweise habe ich aus der Textdatei per Archivmanager die Datei content.xml extrahiert. Dort finde ich folgende "Befehle:"
<text:user-field-decl office:value-type="string" office:string-value="" text:name="SHAPE"/></text:user-field-decls>
und:
<text:user-field-get text:name="SHAPE"/>
Entferne ich das zweite Code-Schnipsel durchgängig in content.xml und füge dann content.xml wieder per Archiv-Manager in die odt-Datei ein, sind die störenden Zeichen fort. Das ist aber ein ziemlich aufwändiger Workaround.