© saicle/Shutterstock.com
Vergleich gängiger PDF Libraries

Mächtig unter Druck


Einsatzgebiete für die dynamische Erzeugung von PDF-Dateien gibt es viele. Sei es eine Rechnung in einem Onlineshop zu erstellen oder Tabellendaten in ordentlicher Form aufs Papier zu bringen. Es sind inzwischen eine Vielzahl mehr oder weniger guter Bibliotheken und Erweiterungen verfügbar, kostenpflichtige wie kostenlose. Einige werden in diesem Artikel unter die Lupe genommen und hinsichtlich der vielen möglichen Einsatzgebiete beurteilt, sodass der Leser eine auf dem jeweiligen Einsatzgebiet basierende Entscheidungsgrundlage erhält.

Zunächst möchte ich hier einige typische Einsatzgebiete vorstellen, die die Basis der Recherche bilden. Es geht hierbei nicht darum, die Grenzen des Machbaren auszuloten oder mit irgendwelchen unnötigen Features zu protzen, sondern Beispiele aus dem Alltag zu finden, mit denen wir Entwickler tagtäglich konfrontiert werden. Ausgangspunkt einer jeden folgenden Betrachtung wird immer die Basis-Library sein beziehungsweise das jeweils als Paket herunterladbare Stück Software.

Bewertungskriterien

Zum Ersten ist das wohl bekannteste Kriterium zu nennen, nämlich aus Shops und ähnlichen Systemen Onlinerechnungen exportieren zu können. Hier ist es absolut wichtig, die Rechnungsdaten übersichtlich und verständlich zu präsentieren. Der zweite Fall beschreibt die Erstellung von druckfähigen Daten. Hierunter ist nicht der Druck auf dem heimischen Tintenstrahldrucker zu verstehen, sondern die Erzeugung von standardkonformen Daten für die Erstellung von hochwertigen Druckerzeugnissen. Besonderes Augenmerk muss hier auf die Einhaltung von Standards gelegt werden (PDF/X, ICC Profile etc.) sowie auf die Möglichkeit, geeignete Grafiken wie beispielsweise TIFF oder EPS einsetzen zu können. Als drittes Einsatzgebiet ist die Anzeige tabellarischer Daten sowie die Erzeugung von Diagrammen und Grafiken zu nennen, beispielsweise um große Datenmengen übersichtlich darzustellen und in für den Schlipsträger tauglichen Diagrammen leicht verständlich zu präsentieren. Als vierter Punkt werden die Möglichkeiten zur Erstellung von PDF-Dateien mit großen Textmengen, wie zum Beispiel Handbücher oder ähnliches, betrachtet. Besonders wichtig ist es, Text möglichst automatisiert auf viele Seiten verteilen sowie um Grafiken herumfließen lassen zu können. Als Fünftes wird auf nachfolgend erläuterte Einzelthemen eingegangen, die zwar alle auch innerhalb der zuvor aufgeführten Bereiche denkbar und sinnvoll wären, aber aufgrund der jeweiligen Bedeutsamkeit doch einer gesonderten Betrachtung bedürfen.

Zugriffsbeschränkung und Verschlüsselung

Manchmal möchte man auf die Zugriffsmöglichkeiten des erstellten PDF-Dokumentes Einfluss nehmen. Das PDF-Format stellt hier folgende Beschränkungen zur Verfügung, eine Übersicht dazu finden Sie in Tabelle 1.

Beschränkung

Beschreibung

noprint

Das Dokument darf nicht gedruckt werden.

nohiresprint

Das Dokument darf nur in niedriger Auflösung gedruckt werden.

nomodify

Das Dokument darf weder bearbeitet noch beschnitten werden, ebenso dürfen keine Formularfelder erstellt oder bearbeitet werden.

noassemble

Neben den Einschränkungen von nomodify wird hier zusätzlich noch das Einfügen, Löschen oder Drehen von Seiten sowie die Erstellung von Lesezeichen und Vorschaubildern unterbunden.

noannots

Das Erstellen oder Ändern von Bemerkungen und Formularfeldern wird verhindert.

noforms

Zusätzlich zu nomodify und noannots können Formularfelder nicht mehr ausgefüllt werden.

nocopy

Text und Grafiken können nun nicht mehr kopiert oder extrahiert werden, die Zugänglichkeit für Screenreader oder Ähnliches bleibt jedoch erhalten.

noaccessible

Die Zugriffsmöglichkeiten auf Texte und Grafiken werden auch für Screenreader und ähnliche Programme unterbunden.

plainmetadata

XMP-Metadaten bleiben selbst für verschlüsselte Dokumente unverschlüsselt.

Tabelle 1: Beschränkungen im PDF-Format

Weiterhin können PDF-Dokumente durch Passwörter geschützt werden. In diesem Fall greift je nach Wunsch eine 40- oder 128-Bit-Verschlüsselung. Mit dem Master-Passwort hat der Besitzer jedoch immer vollen Zugriff auf das Dokument mit all seinen Funktionen, ungeachtet der eingestellten Beschränkungen.

Barrierefreiheit

Um die Inhalte des PDF-Dokumentes auch anderweitig verfügbar zu machen, steht das so genannte „Tagging“ zur Verfügung. Das Dokument wird somit in eine logische, semantische Struktur überführt; umfangreiche Metadaten, wie zum Beispiel Alternativtexte für Grafiken, beinhalten weitere wichtige Informationen. In diese Struktur überführt, können beispielsweise Screenreader ein PDF öffnen und es dem Benutzer vorlesen. Allerdings ist es so auch möglich, das Dokument zum Beispiel in ein E-Book für Amazons Kindle umzuwandeln, da das Tagging auch umfangreiche Informationen zur Textflusskontrolle erhält.

UTF-8

Dass wir in der heutigen Zeit Dokumente in einer Vielzahl von Sprachen und somit in vielen unterschiedlichen Zeichensätzen anbieten können müssen, ist selbstverständlich. Um dies problemlos bewerkstelligen zu können, ist es nötig, die Daten in UTF-8 ausgeben zu können.

PDF/X

Die mittlerweile am weitesten verbreitete Norm, PDF/X-3:2002, ISO-Standard 15930-3, wurde im Jahr 2002 verabschiedet. Der Standard stellt ein Regelwerk bereit, um einen zuverlässigen Datenaustausch für die Druckvorstufe gewährleisten zu können. Das Hauptaugenmerk liegt also vollständig auf hervorragenden Druckergebnissen. Um diese zu erreichen, werden PDF-Elemente untersagt, die nicht gedruckt werden können, beispielsweise JavaScript und Audio- oder Videoelemente. Weiterhin gibt es klare Regeln, wie mit den verwendeten Schriften, Farbprofilen und Grafiken zu verfahren ist. Inzwischen gibt es noch viele weitere Normen, jede mit ihren eigenen spezifischen Besonderheiten. Bei Interesse sei hier auf den entsprechenden Artikel in Wikipedia verwiesen.

Langzeitarchivierung: PDF/A

Vergleichbar zu PDF/X gibt es die Normreihe PDF/A, die sich mit Regeln zur Langzeitarchivierung elektronischer Dokumente beschäftigt. Auch hier wird festgelegt, welche Elemente nicht zulässig sind beziehungsweise wie zulässige Elemente verwendet werden müssen.

FPDF

Der Methusalem unter den (kostenlosen) PDF-Bibliotheken (Release 1 erschien am 17.09.2001) ist das noch immer in PHP 4 geschriebene FPDF [1]: Bestandteil vieler anderer Softwarepakete, gerühmt und verflucht. Dem Code liegt hier eine proprietäre, permissive Lizenz zugrunde. Anders ausgedrückt: Je...

Neugierig geworden? Wir haben diese Angebote für dich:

Angebote für Teams

Für Firmen haben wir individuelle Teamlizenzen. Wir erstellen Ihnen gerne ein passendes Angebot.

Das Library-Modell:
IP-Zugang

Das Company-Modell:
Domain-Zugang