© Excellent backgrounds/Shutterstock.com
Java Magazin
Microsoft-Office-Dokumente mit Apache POI erzeugen

Kaffee in Zellen

Allen Alternativen zum Trotz werden in der großen und weiten Unternehmenswelt Daten, Dokumente und Dateien mit Microsoft Office erstellt, gespeichert, bearbeitet und ausgetauscht. Seien es nun lange Texte und Analysen als Word-Dokument, PowerPoint-Präsentationen oder ver-Excelte Zahlen und Datenkolonnen. Gerade Excel dient oft als Quelle für weitere Analysen oder Statistik. Apache POI ist eine Java-Bibliothek, die dem Entwickler hilft, Daten in MS-Office-Dokumente zu schreiben, Dokumente zu bearbeiten oder auszulesen.

Andreas Monschau


Ein kurzer Meinungsaustausch im Kollegenkreis während einer internen Weiterbildung ergab, dass Apache POI eine scheinbar eher ungeliebte Bibliothek ist. Ist das wirklich der Fall, oder ist es an der Zeit, eine Lanze dafür zu brechen? Bei Apache POI handelt es sich um ein Apache-Top-Level-Projekt. Auf der Projektseite [1] wird das Missionsziel der Bibliothek passend beschrieben mit der Bereitstellung eines Java APIs zwecks Manipulation verschiedener, auf dem Office-Open-XML-Standard (OOXML) und OLE2 von Microsoft basierender Dateien. Manipulation meint hier das Lesen, Verändern und Anlegen dieser Dateien. OLE2 umfasst die meisten Office-Dateiformate wie .xls, .doc oder .ppt. Der Office-Open-XML-Standard (Kasten: „Office Open XML (OOXML)“) enthält jene Formate, die ab Microsoft Office 2007 und 2008 verwendet werden, namentlich .xlsx, .docx oder .pptx. Apache POI liefert für jede Office-Anwendung eine Komponente, die sowohl für OOXML als auch für OLE2 ein API bereitstellt.

Office Open XML (OOXML)Office Open XML ist ein XML-basiertes Format für Office-Dokumente. Dieses Format ist eine von Microsoft entwickelte Spezifikation und wurde von ECMA International 2006 erstmalig standardisiert [2]. Hierbei sei jedoch der Hinweis gestattet, dass Office Open XML nicht mit Open Office bzw. dem Open-Document-Format zu verwechseln ist. Der Standard enthält ebenfalls die von Microsoft definierten Auszeichnungssprachen WordprocessingML und PresentationML.

Mit Microsoft Office erstellte und bearbeitete Dokumente stellen gefühlt immer noch den Großteil aller Unternehmensdokumentation dar, allen Installationen von Confluence oder MediaWiki zum Trotz. Manager wünschen sich ihre Leistungskennzahlen im Excel-Format, Architekten präsentieren ihre Arbeiten mit PowerPoint, ganze Projekte werden mit Office-Produkten gar geplant und durchgeführt – im schlimmsten Fall eben auch mit MS Excel: Im Umfeld der Softwaretests haben wir sehr häufig Testpläne und Testdurchführungsdokumentationen live in Zellen und Spalten erleben dürfen. In der .NET-Welt ist die Arbeit mit Office-Komponenten sehr einfach, es existieren viele Tutorials und Beispiele, um mit C# oder vb.net Excel-Dateien zu manipulieren. Dieser Artikel zeigt, ob das mit Java und Apache POI ebenso einfach geht.

Die Projektseite von Apache POI listet einige Case Studies auf [3]. Sie zeigt auf, dass sich Apache POI vielfältig einsetzen lässt. Interessant ist die dieses Jahr veröffentlichte Studie. Sie bescheinigt, dass die Bibliothek ...

Java Magazin
Microsoft-Office-Dokumente mit Apache POI erzeugen

Kaffee in Zellen

Allen Alternativen zum Trotz werden in der großen und weiten Unternehmenswelt Daten, Dokumente und Dateien mit Microsoft Office erstellt, gespeichert, bearbeitet und ausgetauscht. Seien es nun lange Texte und Analysen als Word-Dokument, PowerPoint-Präsentationen oder ver-Excelte Zahlen und Datenkolonnen. Gerade Excel dient oft als Quelle für weitere Analysen oder Statistik. Apache POI ist eine Java-Bibliothek, die dem Entwickler hilft, Daten in MS-Office-Dokumente zu schreiben, Dokumente zu bearbeiten oder auszulesen.

Andreas Monschau


Ein kurzer Meinungsaustausch im Kollegenkreis während einer internen Weiterbildung ergab, dass Apache POI eine scheinbar eher ungeliebte Bibliothek ist. Ist das wirklich der Fall, oder ist es an der Zeit, eine Lanze dafür zu brechen? Bei Apache POI handelt es sich um ein Apache-Top-Level-Projekt. Auf der Projektseite [1] wird das Missionsziel der Bibliothek passend beschrieben mit der Bereitstellung eines Java APIs zwecks Manipulation verschiedener, auf dem Office-Open-XML-Standard (OOXML) und OLE2 von Microsoft basierender Dateien. Manipulation meint hier das Lesen, Verändern und Anlegen dieser Dateien. OLE2 umfasst die meisten Office-Dateiformate wie .xls, .doc oder .ppt. Der Office-Open-XML-Standard (Kasten: „Office Open XML (OOXML)“) enthält jene Formate, die ab Microsoft Office 2007 und 2008 verwendet werden, namentlich .xlsx, .docx oder .pptx. Apache POI liefert für jede Office-Anwendung eine Komponente, die sowohl für OOXML als auch für OLE2 ein API bereitstellt.

Office Open XML (OOXML)Office Open XML ist ein XML-basiertes Format für Office-Dokumente. Dieses Format ist eine von Microsoft entwickelte Spezifikation und wurde von ECMA International 2006 erstmalig standardisiert [2]. Hierbei sei jedoch der Hinweis gestattet, dass Office Open XML nicht mit Open Office bzw. dem Open-Document-Format zu verwechseln ist. Der Standard enthält ebenfalls die von Microsoft definierten Auszeichnungssprachen WordprocessingML und PresentationML.

Mit Microsoft Office erstellte und bearbeitete Dokumente stellen gefühlt immer noch den Großteil aller Unternehmensdokumentation dar, allen Installationen von Confluence oder MediaWiki zum Trotz. Manager wünschen sich ihre Leistungskennzahlen im Excel-Format, Architekten präsentieren ihre Arbeiten mit PowerPoint, ganze Projekte werden mit Office-Produkten gar geplant und durchgeführt – im schlimmsten Fall eben auch mit MS Excel: Im Umfeld der Softwaretests haben wir sehr häufig Testpläne und Testdurchführungsdokumentationen live in Zellen und Spalten erleben dürfen. In der .NET-Welt ist die Arbeit mit Office-Komponenten sehr einfach, es existieren viele Tutorials und Beispiele, um mit C# oder vb.net Excel-Dateien zu manipulieren. Dieser Artikel zeigt, ob das mit Java und Apache POI ebenso einfach geht.

Die Projektseite von Apache POI listet einige Case Studies auf [3]. Sie zeigt auf, dass sich Apache POI vielfältig einsetzen lässt. Interessant ist die dieses Jahr veröffentlichte Studie. Sie bescheinigt, dass die Bibliothek ...

Neugierig geworden?


    
Loading...

Angebote für Teams

Für Firmen haben wir individuelle Teamlizenzen. Wir erstellen Ihnen gerne ein passendes Angebot.

Das Library-Modell:
IP-Zugang

Das Company-Modell:
Domain-Zugang