现今,将 PDF 文档转换为 Word 文件已经相对容易。然而,如果您需要在转换过程中保留原始的布局和字体格式,那么并非所有的软件都能够胜任这项任务。在此方面,Spire.PDF for Java 表现得十分出色,它在用 Java 将 PDF 转换为 Word 时为用户提供了以下两种转换模式,以便更好地满足用户的需求:
固定布局模式转换速度快,有利于最大程度保持 PDF 文件的原貌。但是,生成的文档的可编辑性将受到限制,因为 PDF 中的每一行文本将在生成的 Word 文档中显示在单独的框架中。
流动形态是一种完整的识别模式。转换后的内容不会以框架形式呈现,并且生成的文档的结构是可流动的。生成的 Word 文档很容易重新编辑,但看起来可能与原始 PDF 文件不同。
安装 Spire.PDF for Java
首先,您需要在 Java 程序中添加 Spire.Pdf.jar 文件作为依赖项。JAR 文件可以从此链接下载。 如果您使用 Maven,则可以将以下代码添加到项目的 pom.xml 文件中,从而在应用程序中导入 JAR 文件。
<repositories>
<repository>
<id>com.e-iceblue</id>
<name>e-iceblue</name>
<url>https://repo.e-iceblue.cn/repository/maven-public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.pdf</artifactId>
<version>10.12.10</version>
</dependency>
</dependencies>
将 PDF 转换为固定布局的 Doc/Docx 文档
Spire.PDF for Java 拥有强大的文档转换功能,仅需三步即可实现将 PDF 转换为固定布局的 Doc/Docx 文档。详细步骤如下:
- 创建 PdfDocument 对象。
- 使用 PdfDocument.loadFromFile() 方法加载 PDF 文件。
- 使用 PdfDocument.saveToFile(String fileName, FileFormat fileFormat) 方法将 PDF 文档转换为 Doc 或 Docx 格式的文件。
- Java
import com.spire.pdf.FileFormat;
import com.spire.pdf.PdfDocument;
public class ConvertPdfToWordWithFixedLayout {
public static void main(String[] args) {
//创建PdfDocument对象
PdfDocument doc = new PdfDocument();
//加载PDF文件
doc.loadFromFile("C:\\Users\\Administrator\\Desktop\\示例文档.pdf");
//将PDF转换为Doc文档并保存到指定的路径
doc.saveToFile("ToDoc.doc", FileFormat.DOC);
//将PDF转换为Docx文档并保存到指定的路径
doc.saveToFile("ToDocx.docx", FileFormat.DOCX);
doc.close();
}
}
将 PDF 转换为流动形态的 Doc/Docx 文档
Spire.PDF for Java 提供了 PdfDocument.getConvertOptions().setConvertToWordUsingFlow() 方法,可以将 PDF 文档转换为流动形态的 Doc/Docx 文档。详细步骤如下:
- 创建 PdfDocument 对象。
- 使用 PdfDocument.loadFromFile() 方法加载 PDF 文件。
- 使用 PdfDocument. getConvertOptions().setConvertToWordUsingFlow() 方法将转换模式设置为流。
- 使用 PdfDocument.saveToFile(String fileName, FileFormat fileFormat) 方法将 PDF 文档转换为 Doc/Docx 格式的文件。
- Java
import com.spire.pdf.FileFormat;
import com.spire.pdf.PdfDocument;
public class ConvertPdfToWordWithFlowableStructure {
public static void main(String[] args) {
//创建PdfDocument对象
PdfDocument doc = new PdfDocument();
//加载PDF文件
doc.loadFromFile("示例文档.pdf");
//将PDF转换为具有流动结构的Word
doc.getConvertOptions().setConvertToWordUsingFlow(true);
//将PDF转换为Doc格式文件并保存
doc.saveToFile("ToDoc.doc", FileFormat.DOC);
//将PDF转换为Docx格式文件并保存
doc.saveToFile("ToDocx.docx", FileFormat.DOCX);
doc.close();
}
}
使用 PdfToWordConverter 直接转换 PDF 到 Word
Spire.PDF for Java 还提供了 PdfToWordConverter 类来直接进行 PDF 到 Word 文档的转换。开发者可以直接使用文件路径或 Stream 实例作为参数创建 PdfToWordConverter 实例,然后使用 PdfToWordConverter.saveToDocx() 方法直接将 PDF 文件转换为 Word 文档并保存为文件或 Stream 实例。以下是操作步骤:
- 使用文件路径或 Stream 对象作为参数创建 PdfToWordConverter 实例。
- 使用 PdfToWordConverter.saveToDocx() 方法直接将 PDF 文件转换为 Word 文档并保存到文件或流。
- 释放资源。
- Java
import com.spire.pdf.conversion.PdfToWordConverter;
public class Test {
public static void main(String[] args) throws Exception {
// 使用PDF文件路径或流创建一个PdfToWordConverter实例
PdfToWordConverter converter = new PdfToWordConverter("Sample.pdf");
// 将PDF文件转换为Word文档,并保存到文件或流中
converter.saveToDocx("output/PDFToWord.docx");
// 释放资源
converter.dispose();
}
}
转换结果:
申请临时 License
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该Email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用JavaScript。获取有效期 30 天的临时许可证。