在日常工作中,我们经常会需要传送 PDF 文件。当 PDF 文件太大时,会导致传输或者下载的速度太慢,也会增加传输失败的风险。相比大的 PDF 文档,较小的文档更便于传输和存储,因此我们需要对 PDF 文档进行压缩。除了压缩 PDF 文档内容以外,压缩图片是减小文档大小最有效的途径之一。本文将从以下两方面介绍如何使用 Spire.PDF for Java 在 Java 中对 PDF 文档进行压缩。
安装 Spire.PDF for Java
首先,您需要在 Java 程序中添加 Spire.Pdf.jar 文件作为依赖项。JAR 文件可以从此链接下载。如果您使用 Maven,则可以将以下代码添加到项目的 pom.xml 文件中,从而在应用程序中导入 JAR 文件。
<repositories>
<repository>
<id>com.e-iceblue</id>
<name>e-iceblue</name>
<url>https://repo.e-iceblue.cn/repository/maven-public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.pdf</artifactId>
<version>10.10.0</version>
</dependency>
</dependencies>
压缩 PDF 文档中的文字和图片
Spire.PDF for Java 拥有强大的压缩功能,可对 PDF 文档中的内容和图像同时进行压缩。详细步骤如下:
- 创建 PdfDocument 类的对象。
- 使用 PdfDocument.loadFromFile() 方法加载 PDF 文档。
- 使用 PdfDocument.getFileInfo().setIncrementalUpdate() 方法将 IncrementalUpdate 设置为 false。
- 使用 PdfDocument.setCompressionLevel() 方法将压缩级别设置为最佳,以压缩文档中的内容。您可以从 PdfCompressionLevel 枚举中选择其他一些级别。
- 循环遍历文档中的页面,使用 PdfPageBase.getImagesInfo() 方法获取每个页面的图像信息集合。
- 遍历集合中的所有项目,并使用 PdfBitmap.setQuality() 方法压缩所有图像的质量。
- 使用 PdfPageBase.replaceImage() 方法将原始图像替换为压缩图像。
- 使用 PdfDocument.saveToFile() 方法将文档保存到另一个 PDF 文件。
- Java
import com.spire.pdf.PdfCompressionLevel;
import com.spire.pdf.PdfDocument;
import com.spire.pdf.PdfPageBase;
import com.spire.pdf.exporting.PdfImageInfo;
import com.spire.pdf.graphics.PdfBitmap;
public class CompressPdfDocument {
public static void main(String[] args) {
//创建 PdfDocument 类的对象
PdfDocument doc = new PdfDocument();
//加载 PDF 文档
doc.loadFromFile("示例文档.pdf");
//将IncrementalUpdate设置为false
doc.getFileInfo().setIncrementalUpdate(false);
//将压缩级别设置为最佳
doc.setCompressionLevel(PdfCompressionLevel.Best);
//循环遍历文档中的页面
for (int i = 0; i < doc.getPages().getCount(); i++) {
//获取指定页面
PdfPageBase page = doc.getPages().get(i);
//获取每个页面的图像信息集合
PdfImageInfo[] images = page.getImagesInfo();
//遍历集合中的项目
if (images != null && images.length > 0)
for (int j = 0; j < images.length; j++) {
//获取特定图片
PdfImageInfo image = images[j];
PdfBitmap bp = new PdfBitmap(image.getImage());
//设置压缩质量
bp.setQuality(20);
//将原始图像替换为压缩图像
page.replaceImage(j, bp);
}
//保存文件
doc.saveToFile("压缩PDF文档.pdf");
doc.close();
}
}
}
压缩 PDF 文档中的高分辨率图像
Spire.PDF for Java 提供了 page.tryCompressImage(info.Index) 方法,采用 zip 压缩方式对高分辨率图片进行无损压缩,而低分辨率的图像将不再被压缩。详细步骤如下:
- 创建 PdfDocument 类的对象。
- 使用 PdfDocument.loadFromFile() 方法加载 PDF 文档。
- 使用 PdfDocument.getFileInfo().setIncrementalUpdate() 方法将 IncrementalUpdate 设置为 false。
- 声明一个 PdfPageBase 变量。
- 循环遍历页面并使用 PdfDocument.getPages().get() 方法获取特定页面。
- 循环遍历页面中的图像。并使用 page.tryCompressImage(info.Index) 方法压缩高分辨率图像。
- 使用 PdfDocument.saveToFile() 方法将文档保存到另一个 PDF 文件。
- Java
import com.spire.pdf.PdfDocument;
import com.spire.pdf.PdfPageBase;
import com.spire.pdf.exporting.PdfImageInfo;
public class CompressPDFImage {
public static void main(String[] args) {
//创建 PdfDocument 类的对象
PdfDocument doc = new PdfDocument
//加载 PDF 文档
doc.loadFromFile("测试文档.pdf");
//将IncrementalUpdate设置为false
doc.getFileInfo().setIncrementalUpdate(false);
//声明一个 PdfPageBase 变量
PdfPageBase page;
//循环遍历页面
for (int i = 0; i < doc.getPages().getCount(); i++) {
//获取指定页面
page = doc.getPages().get(i);
if (page != null) {
if(page.getImagesInfo() != null){
//循环遍历页面中的图像
for (PdfImageInfo info: page.getImagesInfo()) {
//使用tryCompressImage方法压缩高分辨率图像
page.tryCompressImage(info.getIndex());
}
}
}
}
//保存文件
doc.saveToFile("压缩高分辨率图像.pdf");
}
}
申请临时 License
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该Email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用JavaScript。获取有效期 30 天的临时许可证。