Zu viele Schriften in PDF-Ausgabe

Das Textverarbeitungsprogramm

Moderator: Moderatoren

vboehm
Beiträge: 6
Registriert: Fr, 11.01.2008 12:54

Zu viele Schriften in PDF-Ausgabe

Beitrag von vboehm »

Hallo,
ich hatte diese Frage Heute schon Mal in der PDF-Newsgroup (de.comp.text.pdf) gestellt, aber dort kam die Meinung, man könne da nachträglich an den PDFs nicht so gut schrauben; die Ausgangs-PDFs (erstellt mit OO-Writer) müssten erstmal ordentlich sein.

ich erstelle mit Hilfe von OpenOffice aus Vorlagen (.ott) verschiedene Dokumente (Anschreiben, Formulare, ...) als PDF. Anschließend fasse ich einen Satz PDFs zu einem PDF zusammen mittels pdfjoin, pdftk oder pdcat und optimiere sie nochmals mit ps2pdf.
Die entstehen PDFs (4 - 10 Seiten, bis auf ein paar kleine (5 KB) Logos nur Text) haben dann so 350 -700 KB Größe, obwohl (laut pdftotext) nur 30 - 50 KB Text enthalten sind. Diese Größe möchte ich auf das nötige Maß (vielleicht 100 - 200 KB) reduzieren.

Obwohl ich noch kein Tool (Linux oder Windows) gefunden habe, dass mir über den Speicherverbrauch innerhalb eines PDFs Auskunft geben kann, lässt mich pdffonts ahnen, dass da einiges im Argen liegt:

Code: Alles auswählen

name                                 type              emb sub uni object ID
------------------------------------ ----------------- --- --- --- ---------
BAAAAA+TimesNewRomanPS-BoldMT        TrueType          yes yes yes      9  0
CAAAAA+OpenSymbol                    TrueType          yes yes yes     10  0
DAAAAA+TimesNewRomanPSMT             TrueType          yes yes yes     11  0
EAAAAA+TimesNewRomanPS-ItalicMT      TrueType          yes yes yes     12  0
BAAAAA+TimesNewRomanPSMT             TrueType          yes yes yes     37  0
QGZAYA+NimbusMonL-Regu               Type 1            yes yes yes     40  0
QGZAYA+NimbusMonL-Regu               Type 1            yes yes yes     42  0
EAAAAA+TimesNewRomanPS-BoldMT        TrueType          yes yes yes     43  0
BAAAAA+TimesNewRomanPSMT             TrueType          yes yes yes     69  0
QGZAYA+NimbusMonL-Regu               Type 1            yes yes yes     71  0
QGZAYA+NimbusMonL-Regu               Type 1            yes yes yes     73  0
EAAAAA+TimesNewRomanPS-BoldMT        TrueType          yes yes yes     74  0
BAAAAA+TimesNewRomanPSMT             TrueType          yes yes yes     99  0
QGZAYA+NimbusMonL-Regu               Type 1            yes yes yes    101  0
QGZAYA+NimbusMonL-Regu               Type 1            yes yes yes    103  0
EAAAAA+TimesNewRomanPS-BoldMT        TrueType          yes yes yes    104  0
FAAAAA+OpenSymbol                    TrueType          yes yes yes    105  0
GAAAAA+TheMixOffice                  TrueType          yes yes yes    106  0
BAAAAA+TimesNewRomanPSMT             TrueType          yes yes yes    137  0
CAAAAA+TimesNewRomanPS-BoldMT        TrueType          yes yes yes    138  0
DAAAAA+TheMixOffice                  TrueType          yes yes yes    139  0
EAAAAA+TheMixOffice-Bold             TrueType          yes yes yes    140  0
In den OO-Dokumenten kommen nur TimesNewRoman und Courier vor und ich hätte eigentlich erwartet, dass TimesNewRoman in einem PDF automatisch durch TimesRoman ersetzt wird, und damit überhaupt keine Schriften im resultierenden PDF enthalten sein müssen, da Courier und TimesRoman ja Standardschriften sind.

Deshalb meine Fragen:
Wie kann ich OpenOffice dazu bewegen, nur die Schriften in ein PDF zu packen, die auch tatsächlich benutzt werden bzw. statt TimesNewRoman die Standard-Schrift TimesRoman und nicht statt Courier die Numbus-Schrift?

Außerdem müssten die Schriften so abgelegt werden, dass ein externer PDF-Zusammenpacker (wie pdfjoin) in der Lage ist, in dem Gesamt-Dokument gleiche Schriften zu erkennen und zusammenzufassen.

Ich habe bisher in OO noch überhaupt keine Stelle gefunden, an der man den Inhalt von PDFs sinnvoll beeinflussen kann; nur nach der Start-Ansicht, Verschlüsselung und anderen unnützen Sachen :-) wird man direkt vor dem Export gefragt.

mfg Volker
Stephan
********
Beiträge: 12368
Registriert: Mi, 30.06.2004 19:36
Wohnort: nahe Berlin

Re: Zu viele Schriften in PDF-Ausgabe

Beitrag von Stephan »

Ich fürchte ich kann Dir dazu auch nichts Konkretes sagen, aber die Situation hinsichtlich ein Einstellbarkeit der Dinge die du nachfragst ist womöglich so schlecht wie Du vermutest.

Ich würde dir deshalb raten mal ExtendedPDF zu versuchen:
http://www.3bview.com/index.php?option= ... &Itemid=77

das ist eine speziell für OOo gemachte Extension, die auf Ghostscript aufsetzt und mit der daher letztlich alle Features von Ghostscript nutzbar sind. Du kannst natürlich auch Ghostscript direkt nehmen plus irgendeine der diversen 'GUI-Programme' die es dafür gibt, nur Extended PDF übernimmt auch Bookmarks etc.
Wie Du was an Ghostscript konfigurieren kannst mußt Du wohl auch selbst herausfinden, eine gute Seite dafür dürfte:
www.rumborak.de

sein, dort gibts diverse Tutorials und auch ein Forum: http://www.rumborak.de/dialog.html.




Gruß
Stephan
vboehm
Beiträge: 6
Registriert: Fr, 11.01.2008 12:54

Re: Zu viele Schriften in PDF-Ausgabe

Beitrag von vboehm »

So,
ich hab' noch mal ein bisschen weiter geforscht und dabei festgestellt, dass die Fragen und Kommentare zur PDF-Erstellung unter OO von 'nicht so prall' über 'katastrophal' bis zu 'total besch*****' gehen. Allerdings attestieren selbst nur 12 Monate alte Äußerungen wesentlich schlimmere Ergebnisse, als ich sie jetzt feststellen konnte. Also scheint sich was zu tun; aber es fehlen noch etliche Feinheiten.

Es ist mir immerhin gelungen, ein Dokument zu erstellen, das nur die Schrift Courier enthält und in dessen PDF-Ausgabe ebenfalls nur die Schrift Courier benutzt wird, die dann korrekterweise (weil Standardschrift) nicht eingebunden wird. Mit einer Schriftart Times Roman ist mir das allerdings nicht gelungen.

Deshalb erst mal die vereinfachte Version meiner Frage:
Was muss ich tun, damit in der PDF-Ausgabe eines Dokumentes nur die Schriftarten Courier und Times Roman benutzt werden und damit keine Schriften eingebettet werden?

Oder ist jemanden ein Umweg bekannt (à la als PS-Dokument ausgeben und anschließend mit ps2pdf in ein PDF wandeln), der zu benutzbaren Ergebnissen führt?

Noch geb' ich die Hoffnung nicht auf :-)

mfg Volker
Stephan
********
Beiträge: 12368
Registriert: Mi, 30.06.2004 19:36
Wohnort: nahe Berlin

Re: Zu viele Schriften in PDF-Ausgabe

Beitrag von Stephan »

Deshalb erst mal die vereinfachte Version meiner Frage:
Was muss ich tun, damit in der PDF-Ausgabe eines Dokumentes nur die Schriftarten Courier und Times Roman benutzt werden und damit keine Schriften eingebettet werden?

Oder ist jemanden ein Umweg bekannt (à la als PS-Dokument ausgeben und anschließend mit ps2pdf in ein PDF wandeln), der zu benutzbaren Ergebnissen führt?

Beides sollte ExtendedPDF können (siehe meine erste Antwort), da es sich um Dinge handelt welche in Ghostskript einstellen lassen.



Gruß
Stephan
vboehm
Beiträge: 6
Registriert: Fr, 11.01.2008 12:54

Re: Zu viele Schriften in PDF-Ausgabe

Beitrag von vboehm »

Stephan hat geschrieben: Beides sollte ExtendedPDF können (siehe meine erste Antwort), da es sich um Dinge handelt welche in Ghostskript einstellen lassen.
Tja,
nun habe auch die Geschichte mit dem ExtendedPDF ausprobiert und der Erfolg war umwerfend:

Ich habe ein Testdokument, dass nur eine Schriftart (Helvetica (nicht installiert) bzw. Arial) in normal und fett benutzt, und lasse dieses in ein PDF wandeln.
  • Benutze ich im Dokument Helvetica, bastelt mir OO eine ArialBold, zweimal eine NimbusSans und eine OpenSymbol in das PDF.
  • Benutze ich im Dokument Helvetica, bastelt mir ExtendedPDF eine ArialBold, eine LiberationSans und eine OpenSymbol in das PDF.
  • Benutze ich im Dokument Helvetica, bastelt mir ExtendedPDF mit eingeschalteter Schrift-Ersetzung eine LiberationSans, eine LiberationSansBold und eine OpenSymbol in das PDF.
  • Benutze ich im Dokument Arial, bastelt mir OO eine Arial, eine ArialBold und eine OpenSymbol in das PDF.
  • Benutze ich im Dokument Arial, bastelt mir ExtendedPDF eine Arial, eine ArialBold und eine OpenSymbol in das PDF, das dann zusätzlich noch ca. 1 KB größer ist, als die vorige Variante.
  • Benutze ich im Dokument Arial, bastelt mir ExtendedPDF mit eingeschalteter Schrift-Ersetzung eine LiberationSans, eine LiberationSansBold und eine OpenSymbol in das PDF.
Das Ziel der Übung war, ein PDF mit dem vermerkten Schrifttyp Helvetica ohne jeden eingebetten Font zu generieren.
Damit habe ich also wunderschön den Teufel mit dem Beelzebub ausgetrieben!

Bei der Gelegenheit fiel mir dann ein, dass ich ja auch noch mal den Postscript-Output für diesen PS-Standard-Drucker in eine Datei laufen lassen könnte. Und siehe da: Bereits in dieser Postscriptdatei sind alle diese kranken Schriften - sogar mit allen Glyphen der Subfonts - enthalten. Was soll also das arme Ghostscript machen, wenn ihm das dämliche OpenOffice schon die falschen Informationen vorgibt?

Also kommt als weiterer Lösungsansatz noch hinzu: Wie kann man OpenOffice dazu bringen, keine Fonts in den PostScript-Output zu schreiben?

mfg Volker

PS: Irgendwie habe ich immer wieder den Verdacht, dass Herr Gates bezahlte Saboteure in verschiedene Open-Source-Projekte einschleust, um deren Benutzbarkeit zu verhindern :-(
Stephan
********
Beiträge: 12368
Registriert: Mi, 30.06.2004 19:36
Wohnort: nahe Berlin

Re: Zu viele Schriften in PDF-Ausgabe

Beitrag von Stephan »

Ich habe ein Testdokument, dass nur eine Schriftart (Helvetica (nicht installiert) bzw. Arial) in normal und fett benutzt, und lasse dieses in ein PDF wandeln.
Und welche Einstellungen für Ghostskript verwendest Du - mit Standardeinstellungen bzw. Einstellungen über die GUI von ExtendedPDF dürftest Du m.E. kaum sehr weit kommen. Das ist doch der Kern der Sache und weil die Einstellungen dafür garnicht so einfach sind hatte ich gleich eingangs auf die sehr kompetente SEite www.rumborak.de verwiesen.

Warum?
1.
Sorry, ich verstehe recht viel von OOo, aber weniger von Ghostskript, weil ich es einfach (mangels Notwendigkeit) kaum mehr benutze und deshalb nicht geübt bzw. auf dem Laufenden über aktuelle Entwicklungen bin.
2.
Ich war allerdings früher mal aus Kostengründen auf Ghostskript angewiesen (inzwischen benutze ich Acrobat) und weiß deshalb das sich Ghostskript äußerst detailliert einstellen lässt und selbst Acrobat nur wenig nachsteht was die Qualität betrifft (das bestätigen u.a. auch Tests der C't), allein es ist schwer zu bedienen.

Bei der Gelegenheit fiel mir dann ein, dass ich ja auch noch mal den Postscript-Output für diesen PS-Standard-Drucker in eine Datei laufen lassen könnte.
Das plus die automatische Wandelung mittels Ghostskript in PDF automatisiert ExtendedPDF.
Was soll also das arme Ghostscript machen, wenn ihm das dämliche OpenOffice schon die falschen Informationen vorgibt?
Je nach entsprechender Einstellung von Ghostskript die Fonts entweder durch andere ersetzen oder Fonts einbetten oder Fonts nicht einbetten - zumindestens kenne ich es nicht anders, auch bei Acrobat Distiller nicht, überall wo ich PS nachj PDF wandle richten sich die Fonts nach den Einstellungen des PDF-erzeugenden Programms, bei Acrobat also nach den *.joboptions Konfigurationsdateien.
Aber ich bin, wie angedeutet, kein PDF-Experte sondern nur Benutzer verschiedener Programme zur PDF-Erzeugung mit ein wenig Erfahrungen über die Jahre.
Das Ziel der Übung war, ein PDF mit dem vermerkten Schrifttyp Helvetica ohne jeden eingebetten Font zu generieren.
Tja, kann sein, wobei ich bisher dachte es ginge darum das:
[...] nur die Schriftarten Courier und Times Roman benutzt werden und damit keine Schriften eingebettet werden?


Obiges ist das was ich sagen kann und ich habe mich damit bemüht Dir zu helfen, da ich einerseits nun eigentlich auch nicht viel mehr sagen kann, weil ich nun mal kein PDF-Experte bin, und andererseits merke das die Diskussion von der inhaltlichen Ebene beginnt wieder in Vorwürfen ('dämliches OpenOffice') zu münden, möchte ich mich hier ausblenden.



Gruß
Stephan

Irgendwie habe ich immer wieder den Verdacht, dass Herr Gates bezahlte Saboteure in verschiedene Open-Source-Projekte einschleust, um deren Benutzbarkeit zu verhindern


Diesen Eindruck habe ich im Generellen eher nicht - es verstieße für mein Verständnis in vielen Fällen gegen seine eigenen Interessen die MS ja schon seit einiger Zeit so beschreibt das man sich über jede Verbesserung unterstützender Software freut, da man Plattformanbieter (Begriff den MS selbst dafür geprägt hat) sei. Gerade vor Kurzem hat MS diese Strategie auch erst wieder bestätigt und konkretisiert, siehe z.B. Kommentar von Heise:
http://www.heise.de/open/Die-Woche-Micr ... kel/135289
Für mich sind viele Probleme von OpenSource eher hausgemacht.
Antworten