Textrahmen entfernen > Text erhalten
Moderator: Moderatoren
-
- *****
- Beiträge: 420
- Registriert: Do, 24.11.2005 19:17
- Wohnort: München
Textrahmen entfernen > Text erhalten
Hallo! Ich stehe vor folgendem Problem: Ich scanne mit dem Fujitsu ScanSnap iX500 ziemlich große Seitenmengen. Die nächstliegende Exportmöglichkeit ist Word, eine spezielle Exportmöglichkeit direkt nach OO gibt es nicht. Wenn ich dann eine Word-Datei mit OO öffne, steht der Text jeder einzelnen Seite in einem Rahmen, die Seitenzahlen gesondert in sehr kleinen Rahmen darunter. Ich nehme an, das ist bei Word genauso; "isch abe aber gar kein Word". Das bedeutet bisher für mich: Text aus jedem Rahmen ausschneiden, Rahmen löschen, Text einsetzen und so normalen Fließtext erzeugen. Bei ein paar Einzelseiten ist das kein Problem, bei 250 Seiten nervt es irgendwann. Einen Weg, den Text in einem Rutsch als Fließtext, unter Erhaltung der Absatzgrenzen, aus den Rahmen rauszuholen, habe ich trotz einigen Probierens nicht gefunden. -- Frage also: Kennt jemand diesen Weg, wie man dieses Einzelseiten-Extrahieren umgehen kann? (P.S. Wenn man den Text in pdf exportiert, entstehen zwar keine Rahmen, dann wird aber jede einzelne Zeile mit einem festen Zeilenumbruch versehen. Das hilft auf dem Weg zum Fließtext unter OO auch nicht weiter.) -- Dank schon hier! D.
Re: Textrahmen entfernen > Text erhalten
Ohne Beispieldatei mit zwei Seiten dürftest du schlechte Karten für eine Antwort haben.Delabarquera hat geschrieben:Wenn ich dann eine Word-Datei mit OO öffne, steht der Text jeder einzelnen Seite in einem Rahmen, die Seitenzahlen gesondert in sehr kleinen Rahmen darunter.
Hast du schon mal einen Blick in die Writer-FAQ und in die Calc-FAQ des Forums geworfen?
Für jeden vor dem Beginn seiner Seminararbeit ein unbedingtes MUSS: http://openoffice-uni.org/
Für jeden vor dem Beginn seiner Seminararbeit ein unbedingtes MUSS: http://openoffice-uni.org/
-
- *****
- Beiträge: 420
- Registriert: Do, 24.11.2005 19:17
- Wohnort: München
Re: Textrahmen entfernen > Text erhalten
Ok, Danke. Wie gewünscht! Datei: text_in_rahmen.odt
Grüße! D.
Grüße! D.
- Dateianhänge
-
- text_in_rahmen.odt
- Texte in Rahmen
- (21.89 KiB) 326-mal heruntergeladen
- miesepeter
- ********
- Beiträge: 2110
- Registriert: Sa, 10.05.2008 15:05
- Wohnort: Bayern
Re: Textrahmen entfernen > Text erhalten
Hallo:
Ciao
OS W10-64 pro | AOO 4.1.3
[edit]
Nachträgliche Änderungen farblich hervorgehoben.
[/edit]
- Speichere die ODT-Datei als HTML.
- Öffne diese mit Firefox.
- Markiere den gesamten Text (STRG + A) und kopiere ihn (STRG + C).
- Füge in ein neues Writer-Dokument ein - die Texte stehen außerhalb der Rahmen.
- Lösche die Rahmen mit Hilfe des Navigators (F5) - ENTF-Taste mehrmals.
- Entferne die manuellen Seitenumbrüche; markiere alles und wähle dann (alle Absätze) im Absatzformat manuelle Umbrüche ab; die sind dann weg, egal, auf welcher Absatzformatvorlage sie basieren.
Ciao
OS W10-64 pro | AOO 4.1.3
[edit]
Nachträgliche Änderungen farblich hervorgehoben.
[/edit]
Zuletzt geändert von miesepeter am Mi, 02.11.2016 18:28, insgesamt 1-mal geändert.
-
- *****
- Beiträge: 420
- Registriert: Do, 24.11.2005 19:17
- Wohnort: München
Re: Textrahmen entfernen > Text erhalten
Vielen Dank! Ich probier es morgen aus. - D.
-
- *****
- Beiträge: 420
- Registriert: Do, 24.11.2005 19:17
- Wohnort: München
Re: Textrahmen entfernen > Text erhalten
Wie angekündigt, mein Kurzbericht: Das hat wirklich prima geklappt! Noch einmal Danke.
Ein paar Einzelheiten, falls jemand mal vor dem gleichen Problem steht: Ich habe nach dem HTML-Abspeichern mit Chrome geöffnet, weil ich keinen Firefox auf diesem Rechner habe. Ging aber auch. Nach dem Kopieren und Einfügen in das OO-Dokument standen die Textrahmen "aufeinandergeschichtet" mitten in der Seite. Sie ließen sich mit F5 > Textrahmen leicht beseitigen, weil man einfach mit dem Finger auf der Del-Taste alle wegnehmen kann. (Wie Miesepeter schon gesagt hat.) Geht ratzfatz. -- Das mit den Seitentrennungen mach ich eh händisch, weil ich da die Seitenzahlen nach diesem Muster <100> einfüge, um bei der Bearbeitung immer zu wissen, wo ich bin und ggf. in der Vorlage nachschlagen zu können. -- Der verbleibende Text ist natürlich noch ziemlich roh; aber das liegt an der OCR und nicht am vorausgehenden Verfahren.
D.
Ein paar Einzelheiten, falls jemand mal vor dem gleichen Problem steht: Ich habe nach dem HTML-Abspeichern mit Chrome geöffnet, weil ich keinen Firefox auf diesem Rechner habe. Ging aber auch. Nach dem Kopieren und Einfügen in das OO-Dokument standen die Textrahmen "aufeinandergeschichtet" mitten in der Seite. Sie ließen sich mit F5 > Textrahmen leicht beseitigen, weil man einfach mit dem Finger auf der Del-Taste alle wegnehmen kann. (Wie Miesepeter schon gesagt hat.) Geht ratzfatz. -- Das mit den Seitentrennungen mach ich eh händisch, weil ich da die Seitenzahlen nach diesem Muster <100> einfüge, um bei der Bearbeitung immer zu wissen, wo ich bin und ggf. in der Vorlage nachschlagen zu können. -- Der verbleibende Text ist natürlich noch ziemlich roh; aber das liegt an der OCR und nicht am vorausgehenden Verfahren.
D.