Seite 1 von 1

Textrahmen entfernen > Text erhalten

Verfasst: Di, 01.11.2016 14:13
von Delabarquera
Hallo! Ich stehe vor folgendem Problem: Ich scanne mit dem Fujitsu ScanSnap iX500 ziemlich große Seitenmengen. Die nächstliegende Exportmöglichkeit ist Word, eine spezielle Exportmöglichkeit direkt nach OO gibt es nicht. Wenn ich dann eine Word-Datei mit OO öffne, steht der Text jeder einzelnen Seite in einem Rahmen, die Seitenzahlen gesondert in sehr kleinen Rahmen darunter. Ich nehme an, das ist bei Word genauso; "isch abe aber gar kein Word". Das bedeutet bisher für mich: Text aus jedem Rahmen ausschneiden, Rahmen löschen, Text einsetzen und so normalen Fließtext erzeugen. Bei ein paar Einzelseiten ist das kein Problem, bei 250 Seiten nervt es irgendwann. Einen Weg, den Text in einem Rutsch als Fließtext, unter Erhaltung der Absatzgrenzen, aus den Rahmen rauszuholen, habe ich trotz einigen Probierens nicht gefunden. -- Frage also: Kennt jemand diesen Weg, wie man dieses Einzelseiten-Extrahieren umgehen kann? (P.S. Wenn man den Text in pdf exportiert, entstehen zwar keine Rahmen, dann wird aber jede einzelne Zeile mit einem festen Zeilenumbruch versehen. Das hilft auf dem Weg zum Fließtext unter OO auch nicht weiter.) -- Dank schon hier! D.

Re: Textrahmen entfernen > Text erhalten

Verfasst: Di, 01.11.2016 16:20
von Rocko
Delabarquera hat geschrieben:Wenn ich dann eine Word-Datei mit OO öffne, steht der Text jeder einzelnen Seite in einem Rahmen, die Seitenzahlen gesondert in sehr kleinen Rahmen darunter.
Ohne Beispieldatei mit zwei Seiten dürftest du schlechte Karten für eine Antwort haben.

Re: Textrahmen entfernen > Text erhalten

Verfasst: Di, 01.11.2016 18:15
von Delabarquera
Ok, Danke. Wie gewünscht! Datei: text_in_rahmen.odt

Grüße! D.

Re: Textrahmen entfernen > Text erhalten

Verfasst: Di, 01.11.2016 20:13
von miesepeter
Hallo:
  • Speichere die ODT-Datei als HTML.
  • Öffne diese mit Firefox.
  • Markiere den gesamten Text (STRG + A) und kopiere ihn (STRG + C).
  • Füge in ein neues Writer-Dokument ein - die Texte stehen außerhalb der Rahmen.
  • Lösche die Rahmen mit Hilfe des Navigators (F5) - ENTF-Taste mehrmals.
  • Entferne die manuellen Seitenumbrüche; markiere alles und wähle dann (alle Absätze) im Absatzformat manuelle Umbrüche ab; die sind dann weg, egal, auf welcher Absatzformatvorlage sie basieren.
Dann kannst du den Text korrigieren... z.B. solche OCR-Fehler wie >Resurrec- tion«.

Ciao

OS W10-64 pro | AOO 4.1.3

[edit]
Nachträgliche Änderungen farblich hervorgehoben.
[/edit]

Re: Textrahmen entfernen > Text erhalten

Verfasst: Mi, 02.11.2016 00:05
von Delabarquera
Vielen Dank! Ich probier es morgen aus. - D.

Re: Textrahmen entfernen > Text erhalten

Verfasst: Mi, 02.11.2016 10:11
von Delabarquera
Wie angekündigt, mein Kurzbericht: Das hat wirklich prima geklappt! Noch einmal Danke.

Ein paar Einzelheiten, falls jemand mal vor dem gleichen Problem steht: Ich habe nach dem HTML-Abspeichern mit Chrome geöffnet, weil ich keinen Firefox auf diesem Rechner habe. Ging aber auch. Nach dem Kopieren und Einfügen in das OO-Dokument standen die Textrahmen "aufeinandergeschichtet" mitten in der Seite. Sie ließen sich mit F5 > Textrahmen leicht beseitigen, weil man einfach mit dem Finger auf der Del-Taste alle wegnehmen kann. (Wie Miesepeter schon gesagt hat.) Geht ratzfatz. -- Das mit den Seitentrennungen mach ich eh händisch, weil ich da die Seitenzahlen nach diesem Muster <100> einfüge, um bei der Bearbeitung immer zu wissen, wo ich bin und ggf. in der Vorlage nachschlagen zu können. -- Der verbleibende Text ist natürlich noch ziemlich roh; aber das liegt an der OCR und nicht am vorausgehenden Verfahren.

D.