Spire.PDF for Java 4.10.2 支持从 PDF 中提取表格

sales@e-iceblue.com

028-81705109

2790765778

微信扫一扫

论坛

Spire.Cloud 纯前端文档控件

Spire.PDF for Java 4.10.2 支持从 PDF 中提取表格

Spire.PDF for Java 4.10.2 已发布。本次更新支持了从PDF中提取表格的新功能，增强了转换PDF到Excel/PDFA2A的功能。此外，该版本还修复了无法删除keyword属性的值等问题。详情请阅以下内容。

新功能:

支持从PDF中提取表格

PdfDocument pdf = new PdfDocument();
pdf.loadFromFile(inputFile);
StringBuilder builder = new StringBuilder();
//抽取表格
PdfTableExtractor extractor = new PdfTableExtractor(pdf);
PdfTable[] tableLists = null;
for (int pageIndex = 0; pageIndex < pdf.getPages().getCount(); pageIndex++) {
    tableLists = extractor.extractTable(pageIndex);
    if (tableLists != null && tableLists.length > 0) {
        for (PdfTable table : tableLists) {
            int row = table.getRowCount();
            int column = table.getColumnCount();
            for (int i = 0; i < row; i++) {
                for (int j = 0; j < column; j++) {
                    if (j == 0) {
                        builder.append(table.getText(i, j));
                    } else {
                        String text = table.getText(i, j);
                        builder.append(text + " ");
                    }
                }
                builder.append("\r\n");
            }
        }
    }
}
FileWriter fileWriter = new FileWriter(outputFile);
fileWriter.write(builder.toString());
fileWriter.flush();
fileWriter.close();

问题修复:

修复了转换PDF到Excel，字体大小改变的问题
修复了转换PDF到PDFA2A内容不正确的问题
修复了无法删除keyword属性的值的问题
修复了setColorSpace方法无法设置参数的问题

获取Spire.PDF for Java 4.10.2请点击：

https://www.e-iceblue.cn/Downloads/Spire-PDF-JAVA.html

返回顶部

Spire.PDF for Java 4.10.2 支持从 PDF 中提取表格

新闻类别