Textrahmen entfernen > Text erhalten

Das Textverarbeitungsprogramm

Moderator: Moderatoren

Delabarquera
*****
Beiträge: 420
Registriert: Do, 24.11.2005 19:17
Wohnort: München

Textrahmen entfernen > Text erhalten

Beitrag von Delabarquera »

Hallo! Ich stehe vor folgendem Problem: Ich scanne mit dem Fujitsu ScanSnap iX500 ziemlich große Seitenmengen. Die nächstliegende Exportmöglichkeit ist Word, eine spezielle Exportmöglichkeit direkt nach OO gibt es nicht. Wenn ich dann eine Word-Datei mit OO öffne, steht der Text jeder einzelnen Seite in einem Rahmen, die Seitenzahlen gesondert in sehr kleinen Rahmen darunter. Ich nehme an, das ist bei Word genauso; "isch abe aber gar kein Word". Das bedeutet bisher für mich: Text aus jedem Rahmen ausschneiden, Rahmen löschen, Text einsetzen und so normalen Fließtext erzeugen. Bei ein paar Einzelseiten ist das kein Problem, bei 250 Seiten nervt es irgendwann. Einen Weg, den Text in einem Rutsch als Fließtext, unter Erhaltung der Absatzgrenzen, aus den Rahmen rauszuholen, habe ich trotz einigen Probierens nicht gefunden. -- Frage also: Kennt jemand diesen Weg, wie man dieses Einzelseiten-Extrahieren umgehen kann? (P.S. Wenn man den Text in pdf exportiert, entstehen zwar keine Rahmen, dann wird aber jede einzelne Zeile mit einem festen Zeilenumbruch versehen. Das hilft auf dem Weg zum Fließtext unter OO auch nicht weiter.) -- Dank schon hier! D.
Rocko
*******
Beiträge: 1164
Registriert: Do, 11.10.2012 13:19

Re: Textrahmen entfernen > Text erhalten

Beitrag von Rocko »

Delabarquera hat geschrieben:Wenn ich dann eine Word-Datei mit OO öffne, steht der Text jeder einzelnen Seite in einem Rahmen, die Seitenzahlen gesondert in sehr kleinen Rahmen darunter.
Ohne Beispieldatei mit zwei Seiten dürftest du schlechte Karten für eine Antwort haben.
Hast du schon mal einen Blick in die Writer-FAQ und in die Calc-FAQ des Forums geworfen?
Für jeden vor dem Beginn seiner Seminararbeit ein unbedingtes MUSS: http://openoffice-uni.org/
Delabarquera
*****
Beiträge: 420
Registriert: Do, 24.11.2005 19:17
Wohnort: München

Re: Textrahmen entfernen > Text erhalten

Beitrag von Delabarquera »

Ok, Danke. Wie gewünscht! Datei: text_in_rahmen.odt

Grüße! D.
Dateianhänge
text_in_rahmen.odt
Texte in Rahmen
(21.89 KiB) 326-mal heruntergeladen
Benutzeravatar
miesepeter
********
Beiträge: 2110
Registriert: Sa, 10.05.2008 15:05
Wohnort: Bayern

Re: Textrahmen entfernen > Text erhalten

Beitrag von miesepeter »

Hallo:
  • Speichere die ODT-Datei als HTML.
  • Öffne diese mit Firefox.
  • Markiere den gesamten Text (STRG + A) und kopiere ihn (STRG + C).
  • Füge in ein neues Writer-Dokument ein - die Texte stehen außerhalb der Rahmen.
  • Lösche die Rahmen mit Hilfe des Navigators (F5) - ENTF-Taste mehrmals.
  • Entferne die manuellen Seitenumbrüche; markiere alles und wähle dann (alle Absätze) im Absatzformat manuelle Umbrüche ab; die sind dann weg, egal, auf welcher Absatzformatvorlage sie basieren.
Dann kannst du den Text korrigieren... z.B. solche OCR-Fehler wie >Resurrec- tion«.

Ciao

OS W10-64 pro | AOO 4.1.3

[edit]
Nachträgliche Änderungen farblich hervorgehoben.
[/edit]
Zuletzt geändert von miesepeter am Mi, 02.11.2016 18:28, insgesamt 1-mal geändert.
Delabarquera
*****
Beiträge: 420
Registriert: Do, 24.11.2005 19:17
Wohnort: München

Re: Textrahmen entfernen > Text erhalten

Beitrag von Delabarquera »

Vielen Dank! Ich probier es morgen aus. - D.
Delabarquera
*****
Beiträge: 420
Registriert: Do, 24.11.2005 19:17
Wohnort: München

Re: Textrahmen entfernen > Text erhalten

Beitrag von Delabarquera »

Wie angekündigt, mein Kurzbericht: Das hat wirklich prima geklappt! Noch einmal Danke.

Ein paar Einzelheiten, falls jemand mal vor dem gleichen Problem steht: Ich habe nach dem HTML-Abspeichern mit Chrome geöffnet, weil ich keinen Firefox auf diesem Rechner habe. Ging aber auch. Nach dem Kopieren und Einfügen in das OO-Dokument standen die Textrahmen "aufeinandergeschichtet" mitten in der Seite. Sie ließen sich mit F5 > Textrahmen leicht beseitigen, weil man einfach mit dem Finger auf der Del-Taste alle wegnehmen kann. (Wie Miesepeter schon gesagt hat.) Geht ratzfatz. -- Das mit den Seitentrennungen mach ich eh händisch, weil ich da die Seitenzahlen nach diesem Muster <100> einfüge, um bei der Bearbeitung immer zu wissen, wo ich bin und ggf. in der Vorlage nachschlagen zu können. -- Der verbleibende Text ist natürlich noch ziemlich roh; aber das liegt an der OCR und nicht am vorausgehenden Verfahren.

D.
Antworten