Spire.PDF for Java 4.10.2 已发布。本次更新支持了从PDF中提取表格的新功能,增强了转换PDF到Excel/PDFA2A的功能。此外,该版本还修复了无法删除keyword属性的值等问题。详情请阅以下内容。
新功能:
- 支持从PDF中提取表格
PdfDocument pdf = new PdfDocument();
pdf.loadFromFile(inputFile);
StringBuilder builder = new StringBuilder();
//抽取表格
PdfTableExtractor extractor = new PdfTableExtractor(pdf);
PdfTable[] tableLists = null;
for (int pageIndex = 0; pageIndex < pdf.getPages().getCount(); pageIndex++) {
tableLists = extractor.extractTable(pageIndex);
if (tableLists != null && tableLists.length > 0) {
for (PdfTable table : tableLists) {
int row = table.getRowCount();
int column = table.getColumnCount();
for (int i = 0; i < row; i++) {
for (int j = 0; j < column; j++) {
if (j == 0) {
builder.append(table.getText(i, j));
} else {
String text = table.getText(i, j);
builder.append(text + " ");
}
}
builder.append("\r\n");
}
}
}
}
FileWriter fileWriter = new FileWriter(outputFile);
fileWriter.write(builder.toString());
fileWriter.flush();
fileWriter.close();
问题修复:
- 修复了转换PDF到Excel,字体大小改变的问题
- 修复了转换PDF到PDFA2A内容不正确的问题
- 修复了无法删除keyword属性的值的问题
- 修复了setColorSpace方法无法设置参数的问题
获取Spire.PDF for Java 4.10.2请点击: