Samstag, Oktober 23, 2004

PDF in HTML umwandeln.

Das Programm PDF2HTML wandelt einfach und schnell Dateien im Format PDF in Webseiten um, macht z.B. aus unserer Bierkarte (PDF) die Webseite Bierkarte (HTML). Genauer gesagt: aus einer PDF werden wenigstens zwei Dateien erzeugt wird, eine JPG-Datei, welche die graphischen Elemente enthält, und eine oder mehrere HTML-Seiten mit den Textinformationen.

Das Ergebnis überzeugt nicht ganz, da einige Tabulatoren nicht korrekt umgesetzt worden sind. Das liegt aber vermutlich eher daran, dass die PDF selbst aus einer Word-Datei erzeugt worden ist und ich diese Word-Datei möglicherweise schlampig geschrieben habe (direkt formatiert und nicht mit Druckformatvorlage), halt gerade so, daß auf dem Papierausdruck keine Fehler mehr zu erkennen sind.

Wozu das gut ist? Der Nutzer spart Zeit. Er muß nicht mehr eigens den Acrobat Reader (oder ein Ersatzprogramm) zum Lesen der PDF starten und die Downloadzeit bzw. das Downloadvolumen verringert sich, im konkreten Fall reduziert sich der Dateiumfang von 111 KB auf 53 KB, also knapp die Hälfte.

Für wenig umfangreiche PDFs mit begrenzter Nutzungsdauer (wie Tageskarten) werde ich dieses Tool wohl nicht nutzen. Aber bei umfangreichen PDFs ist die Möglichkeit recht nützlich, das Dokument per Knopfdruck seitenweise so in Webseiten zu erlegen, daß sie per Index zugänglich sind.