如果你想将 PDF 文档中包含的图片用在其他地方,可以将图片提取出来保存为图片后使用。本文将展示如何使用 Spire.PDF for Java 以编程的方式提取 PDF 文档中的图片。
安装 Spire.PDF for Java
首先,您需要在 Java 程序中添加 Spire.Pdf.jar 文件作为依赖项。JAR文件可以从此链接下载。 如果您使用 Maven,则可以将以下代码添加到项目的 pom.xml 文件中,从而轻松地在应用程序中导入 JAR 文件。
<repositories>
<repository>
<id>com.e-iceblue</id>
<name>e-iceblue</name>
<url>https://repo.e-iceblue.cn/repository/maven-public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.pdf</artifactId>
<version>10.3.1</version>
</dependency>
</dependencies>
从 PDF 文档中提取图片
Spire.PDF for Java 提供了 PdfPageBase.extractImages() 方法,用于提取 PDF 文件中的图片。下面是详细操作步骤:
- 创建 PdfDocument 类的对象。
- 用 PdfDocument.loadFromFile() 方法载入 PDF 文档。
- 循环遍历文档所有页面,并用 PdfPageBase.extractImages() 方法提取页面中的图片。
- 指定文件路径和名称。
- 将图片保存为 PNG 文件。
- Java
import com.spire.pdf.PdfDocument;
import com.spire.pdf.PdfPageBase;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import javax.imageio.ImageIO;
public class extractImage {
public static void main(String[] args) throws IOException {
//创建 PdfDocument 类的对象
PdfDocument doc = new PdfDocument();
//载入PDF文档
doc.loadFromFile("C:/示例.pdf");
//声明一个int变量
int index = 0;
//循环遍历所有页面
for (PdfPageBase page : (Iterable<PdfPageBase>) doc.getPages()) {
//从页面中提取图片
for (BufferedImage image : page.extractImages()) {
//指定文件路径和文件名
File output = new File("C:/提取的图片/" + String.format("图片-%d.png", index++));
//将图片保存为PNG文件
ImageIO.write(image, "PNG", output);
}
}
}
}
申请临时 License
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该Email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用JavaScript。获取有效期 30 天的临时许可证。