Pdf zu komplex?

Zeichnungen erstellen

Moderator: Moderatoren

hylli
*******
Beiträge: 1672
Registriert: Mi, 22.02.2006 19:37

Re: Pdf zu komplex?

Beitrag von hylli »

Vermutlich weil es als Grafik (PDF) gescannt wurde und keine Texterkennung (OCR) genutzt wurde.

Hylli
Ein Dankeschön für eine Lösung tut nicht weh!
Wer eine Lösung selbst findet, sollte die für die Nachwelt auch posten!

Geschäftlich: LibreOffice 6.0.x ("Still") unter Windows 10 64bit
Privat: LibreOffice 6.0.x ("Still") unter Linux Mint 19.x Cinnamon 64bit
Thomas Mc Kie
******
Beiträge: 919
Registriert: Mo, 12.04.2010 00:37

Re: Pdf zu komplex?

Beitrag von Thomas Mc Kie »

Nur weil du mit deinem Drucker eine pdf drucken kannst und mit einem Scanner aus einem gedruckten Papier ein pdf erzeugen kannst sind darin nicht dieselben Daten enthalten, selbst wenn sie gleich aussehen. Was du brauchst, wäre das originale pdf (wenn es eins gibt), ansonsten musst du mit dem gescanten (das besteht nur aus "Fotos" (!) von den eingescanten Seiten, die in einem pdf abgelegt wurden) leben.

Grüße

Thomas
Benutzeravatar
Constructus
*******
Beiträge: 1610
Registriert: Mo, 21.01.2008 18:08
Wohnort: 20 Jahre Brilon - 40 Jahre Essen- Steele

Re: Pdf zu komplex?

Beitrag von Constructus »

Hallo Jezzi,

Scans, die irgenwie noch weiterbearbeitet werden sollen, als PDF abzuspeichern, ist nicht sehr sinnvoll.

Zwar läßt sich aus solchen PDF Text herauslesen, aber einzeln bearbeiten nicht. Eine Möglichkeit wäre, in einem Grafikprogramm (vielleicht auch schon im OODraw) das PDF in ein anderes Dateiformat zu verwandeln und die zu entfernenden Dinge einfach mit Rahmen abzudecken, die die Umgebungsfarbe haben; ansonsten gilt der Tipp von Thomas.
Es gibt auch die Möglichkeit, einen farbigen Radierer zu beutzen (auf dem Bildschirm...) und so das ungewünschte zu streichen, War eine der Aktionen erfolgreich, kannst Du das Dokument wieder in ein pdf verwandeln.

Leider sind die Tipps ungetestet, da ich pdf nur als Endprodukt betrachte

Viel Erfolg

Constructus
EDV ist wunderbar - o Wunder, wenn sie funktioniert! {°L*}

Freie Offices auf div. Linuxen + 3 VBoxen mit WIN2K
|| LibO + AOO, auf Linux und WIN2K; portable OO & Co. auf WIN
Genaue Typisierung unmöglich, alles ist "im Fluß"
Benutzeravatar
miesepeter
********
Beiträge: 2110
Registriert: Sa, 10.05.2008 15:05
Wohnort: Bayern

Re: Pdf zu komplex?

Beitrag von miesepeter »

Gast hat geschrieben:ich verstehe, aber wenn ich es als Text scanne, geht ja dabei die ursprüngliche Formatierung des Dokuments verloren und es wird nur der reine Text gescannt. So will ich das ja auch nicht haben.
Hallo,
da solltest du ein "gescheites" OCR-Programm benutzen, das kann auch Formatierungen aus Scans gewinnen, wenn auch nicht immer so, dass es ohne Nachbearbeitung unmittelbar weiterverarbeitet werden kann. Beispiele für bessere OCR-Programme sind Abbyy oder Caere, die kosten jedoch. Freie Software, die ich je testete, war hier einfach nicht leistungsfähig.

Wenn du solche kommerziellen OCR-Programme öfter oder in der Arbeit benutzt, dann kannst du in absehbarer Zeit sicher die Ausgaben wieder hereinspielen, für gelegentliche Arbeiten sind sie vermutlich zu teuer.

Ciao
hylli
*******
Beiträge: 1672
Registriert: Mi, 22.02.2006 19:37

Re: Pdf zu komplex?

Beitrag von hylli »

Naja, probieren geht über studieren, oder? Bevor man sich teure OCR-Software zulegt, sollte man vielleicht mal freie Alternativen testen, z.B.:

FreeOCR:
http://www.paperfile.net/

Cuneiform:
http://en.openocr.org/download/
http://www.cuneiform.ru/eng/

Hylli
Ein Dankeschön für eine Lösung tut nicht weh!
Wer eine Lösung selbst findet, sollte die für die Nachwelt auch posten!

Geschäftlich: LibreOffice 6.0.x ("Still") unter Windows 10 64bit
Privat: LibreOffice 6.0.x ("Still") unter Linux Mint 19.x Cinnamon 64bit
Antworten