事象
以下のExcelファイルをApache POIで読み込んだ際に発生。
pom.xml。POIは2019/04リリースの最新4.1.0。
(snip)
<properties>
<java.version>11</java.version>
<project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
</properties>
<dependencies>
<!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi</artifactId>
<version>4.1.0</version>
</dependency>
<!-- https://mvnrepository.com/artifact/org.apache.poi/poi-ooxml -->
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>4.1.0</version>
</dependency>
<dependency>
<groupId>junit</groupId>
<artifactId>junit</artifactId>
<version>3.8.1</version>
<scope>test</scope>
</dependency>
</dependencies>
</project>
こんな感じでxlsx読み込み。
package com.example;
import java.io.File;
import java.io.IOException;
import java.util.Iterator;
import org.apache.poi.EncryptedDocumentException;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.ss.usermodel.WorkbookFactory;
public class Hoge {
public static void main(String[] args) throws EncryptedDocumentException, IOException {
Workbook workbook = WorkbookFactory.create(new File("mji.00601.xlsx"));
Sheet sheet = workbook.getSheetAt(0);
Iterator<Row> rows = sheet.rowIterator();
while (rows.hasNext()) {
Row row = rows.next();
Cell cell = row.getCell(7);
if (cell != null) {
String kosekiNumber = cell.getStringCellValue();
System.out.println("kosekinum = " + kosekiNumber);
}
}
}
Excelを読み込むと実行時例外発生。
Exception in thread "main" org.apache.poi.ooxml.POIXMLException: Strict OOXML isn't currently supported, please see bug #57699
at org.apache.poi.ooxml.POIXMLDocumentPart.getPartFromOPCPackage(POIXMLDocumentPart.java:750)
at org.apache.poi.ooxml.POIXMLDocumentPart.<init>(POIXMLDocumentPart.java:148)
at org.apache.poi.ooxml.POIXMLDocumentPart.<init>(POIXMLDocumentPart.java:138)
at org.apache.poi.ooxml.POIXMLDocument.<init>(POIXMLDocument.java:61)
at org.apache.poi.xssf.usermodel.XSSFWorkbook.<init>(XSSFWorkbook.java:276)
at org.apache.poi.xssf.usermodel.XSSFWorkbookFactory.createWorkbook(XSSFWorkbookFactory.java:88)
at org.apache.poi.xssf.usermodel.XSSFWorkbookFactory.createWorkbook(XSSFWorkbookFactory.java:116)
at java.base/jdk.internal.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at java.base/jdk.internal.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
at java.base/jdk.internal.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.base/java.lang.reflect.Method.invoke(Method.java:566)
at org.apache.poi.ss.usermodel.WorkbookFactory.createWorkbook(WorkbookFactory.java:339)
at org.apache.poi.ss.usermodel.WorkbookFactory.createXSSFWorkbook(WorkbookFactory.java:314)
(snip)
原因
MS Office2013から実装されたOffice Open XMLのstrict仕様をPOIが実装していないらしいです。例外に出てくるバグ#57699を見てみると先月2019/5月にやり取りしている人達が居ました。
2019-05-20 14:26:49 UTC
Over two years have passed – has there been any work done on this / any milestone?(最後のメッセージから)2年が経ちました。この件に関してなにかしらのマイルストーンのもと開発はされていますか?
2019-05-20 14:56:34 UTC
No, it seems none of the contributors needs it urgently enough to warrant spending time on it. As this is a purely community supported project without commercial backing, your best bet to get progress on this will be to provide patches/time yourself if you can contribute in any way.いいえ。これに対して喫緊に時間を費やせる貢献者は居ないようです。純粋に資金的サポートの無いプロジェクトなので、もしあなたが貢献できるとしたらあなた自身がパッチを提供することがこの件の進捗を得るベストな方法です。
oh…Apache POIの開発ってかなり切羽詰まってたんですね。。。この件まで手が回っていないようです。だから例外時にバグ番号まで出してるんでしょうか。
対処
MS Office2013以上で保存されたことにより、POIが対応していないStrict OOXML形式で保存されていることが問題っぽいです。
MS Office 2010でもLibreOfficeでも良いので、一回開いて保存し直すことでApache POIで読み込むことが出来ました。
まとめ
ただただOSSのお世話になってる身としては何も文句は言えないです。
今現在OSS提供してる側の人達はほぼほぼ無償で世界中に貢献している訳ですし、もっと報われて欲しいところです。github sponsorshipが正式に始まれば改善されたりするのかな・・・。
開発者の自己犠牲という薄氷の上でOSSが成り立ってるのを感じることが出来るバグかも。