Pdf zu komplex?

Antwort erstellen


BBCode ist eingeschaltet
[img] ist ausgeschaltet
[url] ist eingeschaltet
Smileys sind ausgeschaltet

Die letzten Beiträge des Themas
   

Ansicht erweitern Die letzten Beiträge des Themas: Pdf zu komplex?

Re: Pdf zu komplex?

von hylli » Mi, 20.10.2010 19:57

Naja, probieren geht über studieren, oder? Bevor man sich teure OCR-Software zulegt, sollte man vielleicht mal freie Alternativen testen, z.B.:

FreeOCR:
http://www.paperfile.net/

Cuneiform:
http://en.openocr.org/download/
http://www.cuneiform.ru/eng/

Hylli

Re: Pdf zu komplex?

von miesepeter » Mi, 20.10.2010 19:26

Gast hat geschrieben:ich verstehe, aber wenn ich es als Text scanne, geht ja dabei die ursprüngliche Formatierung des Dokuments verloren und es wird nur der reine Text gescannt. So will ich das ja auch nicht haben.
Hallo,
da solltest du ein "gescheites" OCR-Programm benutzen, das kann auch Formatierungen aus Scans gewinnen, wenn auch nicht immer so, dass es ohne Nachbearbeitung unmittelbar weiterverarbeitet werden kann. Beispiele für bessere OCR-Programme sind Abbyy oder Caere, die kosten jedoch. Freie Software, die ich je testete, war hier einfach nicht leistungsfähig.

Wenn du solche kommerziellen OCR-Programme öfter oder in der Arbeit benutzt, dann kannst du in absehbarer Zeit sicher die Ausgaben wieder hereinspielen, für gelegentliche Arbeiten sind sie vermutlich zu teuer.

Ciao

Re: Pdf zu komplex?

von Constructus » Mi, 20.10.2010 01:19

Hallo Jezzi,

Scans, die irgenwie noch weiterbearbeitet werden sollen, als PDF abzuspeichern, ist nicht sehr sinnvoll.

Zwar läßt sich aus solchen PDF Text herauslesen, aber einzeln bearbeiten nicht. Eine Möglichkeit wäre, in einem Grafikprogramm (vielleicht auch schon im OODraw) das PDF in ein anderes Dateiformat zu verwandeln und die zu entfernenden Dinge einfach mit Rahmen abzudecken, die die Umgebungsfarbe haben; ansonsten gilt der Tipp von Thomas.
Es gibt auch die Möglichkeit, einen farbigen Radierer zu beutzen (auf dem Bildschirm...) und so das ungewünschte zu streichen, War eine der Aktionen erfolgreich, kannst Du das Dokument wieder in ein pdf verwandeln.

Leider sind die Tipps ungetestet, da ich pdf nur als Endprodukt betrachte

Viel Erfolg

Constructus

Re: Pdf zu komplex?

von Thomas Mc Kie » Mi, 20.10.2010 00:09

Nur weil du mit deinem Drucker eine pdf drucken kannst und mit einem Scanner aus einem gedruckten Papier ein pdf erzeugen kannst sind darin nicht dieselben Daten enthalten, selbst wenn sie gleich aussehen. Was du brauchst, wäre das originale pdf (wenn es eins gibt), ansonsten musst du mit dem gescanten (das besteht nur aus "Fotos" (!) von den eingescanten Seiten, die in einem pdf abgelegt wurden) leben.

Grüße

Thomas

Re: Pdf zu komplex?

von hylli » Di, 19.10.2010 18:54

Vermutlich weil es als Grafik (PDF) gescannt wurde und keine Texterkennung (OCR) genutzt wurde.

Hylli

Nach oben