便携式文档格式 (.pdf) 文件是在各行业中广泛使用的电子文档,但该格式的内容不易编辑,特别是对于文档中存在的表格数据,如果需要分析或者编辑其中的表格数据,Excel 格式的表格是一种更优于 PDF 的选择。当表格数据以 PDF 格式存在时,我们可以通过格式转换的方式将其转换为 Excel 来实现数据分析、编辑、提取或保存等操作。本文,我们将使用 Spire.PDF for Java 来介绍实现转换的具体方法及步骤。
安装 Spire.PDF for Java
首先,您需要在 Java 程序中添加 Spire.Pdf.jar 文件作为依赖项。JAR 文件可以从此链接下载。如果您使用 Maven,则可以将以下代码添加到项目的 pom.xml 文件中,从而在应用程序中导入 JAR 文件。
<repositories>
<repository>
<id>com.e-iceblue</id>
<name>e-iceblue</name>
<url>https://repo.e-iceblue.cn/repository/maven-public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.pdf</artifactId>
<version>10.9.0</version>
</dependency>
</dependencies>
将 PDF 转为 Excel
转换时,可参考如下步骤:
- 创建 PdfDocument 类的对象。
- 调用 PdfDocument.loadFromFile(String fileName) 方法加载 PDF 文件。
- 通过 PdfDocument.saveToFile(String fileName, FileFormat fileFormat) 方法保存为 Excel 格式。
- Java
import com.spire.pdf.*;
public class PDFtoExcel {
public static void main(String[] args) {
//创建PdfDocument实例
PdfDocument pdf = new PdfDocument();
//加载PDF文档
pdf.loadFromFile("test.pdf");
//保存为Excel
pdf.saveToFile("PDFToXLS.xlsx", FileFormat.XLSX);
}
}
申请临时 License
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该Email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用JavaScript。获取有效期 30 天的临时许可证。