Spire.PDF for Java 4.10.2 已发布。本次更新支持了从PDF中提取表格的新功能,增强了转换PDF到Excel/PDFA2A的功能。此外,该版本还修复了无法删除keyword属性的值等问题。详情请阅以下内容。
新功能:
- 支持从PDF中提取表格
PdfDocument pdf = new PdfDocument();
pdf.loadFromFile(inputFile);
StringBuilder builder = new StringBuilder();
//抽取表格
PdfTableExtractor extractor = new PdfTableExtractor(pdf);
PdfTable[] tableLists = null;
for (int pageIndex = 0; pageIndex < pdf.getPages().getCount(); pageIndex++) {
    tableLists = extractor.extractTable(pageIndex);
    if (tableLists != null && tableLists.length > 0) {
        for (PdfTable table : tableLists) {
            int row = table.getRowCount();
            int column = table.getColumnCount();
            for (int i = 0; i < row; i++) {
                for (int j = 0; j < column; j++) {
                    if (j == 0) {
                        builder.append(table.getText(i, j));
                    } else {
                        String text = table.getText(i, j);
                        builder.append(text + " ");
                    }
                }
                builder.append("\r\n");
            }
        }
    }
}
FileWriter fileWriter = new FileWriter(outputFile);
fileWriter.write(builder.toString());
fileWriter.flush();
fileWriter.close();问题修复:
- 修复了转换PDF到Excel,字体大小改变的问题
- 修复了转换PDF到PDFA2A内容不正确的问题
- 修复了无法删除keyword属性的值的问题
- 修复了setColorSpace方法无法设置参数的问题
获取Spire.PDF for Java 4.10.2请点击:
 
    


 
        



