使用 OCR 技术扫描识别是获取图片上文字的主要方式。Spire.OCR for Java 能够帮助开发者在 Java 项目中快速批量识别并提取图片上的文字,实现高效的文字提取功能。本文将介绍如何使用 Spire.OCR for Java 在 Java 项目中识别并提取图片上的文本。
获取 Spire.OCR for Java
使用 Spire.OCR for Java 扫描识别图片上的文字需要先在 Java 项目中引入 Spire.OCR.jar 以及相关的其他依赖文件。
Spire.OCR.jar 文件可从 Spire.OCR for Java 下载页获取。如果您使用 Maven,可以将以下代码添加到项目的 pom.xml 文件中,从而在应用程序中导入 JAR 文件。
<repositories>
<repository>
<id>com.e-iceblue</id>
<name>e-iceblue</name>
<url>https://repo.e-iceblue.cn/repository/maven-public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.ocr</artifactId>
<version>1.9.0</version>
</dependency>
</dependencies>
其他依赖文件请根据您所使用的操作系统选择下载:
安装依赖项
步骤 1、在 IntelliJ IDEA 中创建 Java 项目。
步骤 2、在菜单中的:文件 > 项目结构 > 模块 > 依赖中,添加 Spire.OCR.jar 作为项目依赖。
步骤 3、下载并解压其他依赖文件,将解压出的 dependencies 文件夹中的所有文件复制到项目目录中。
扫描识别本地图像中的文字
- Java
import com.spire.ocr.OcrScanner;
import java.io.*;
public class ScanLocalImage {
public static void main(String[] args) throws Exception {
// 指定依赖文件的路径
String dependencies = "dependencies/";
// 指定要扫描的图像文件的路径
String imageFile = "data/Sample.png";
// 指定输出文件的路径
String outputFile = "ScanLocalImage_out.txt";
// 创建一个 OcrScanner 对象
OcrScanner scanner = new OcrScanner();
// 设置 OcrScanner 对象的依赖文件路径
scanner.setDependencies(dependencies);
// 使用 OcrScanner 对象扫描指定的图像文件
scanner.scan(imageFile);
// 获取扫描的文本内容
String scannedText = scanner.getText().toString();
// 创建一个输出文件对象
File output = new File(outputFile);
// 如果输出文件已经存在,则删除它
if (output.exists()) {
output.delete();
}
// 创建一个 BufferedWriter 对象用于向输出文件写入内容
BufferedWriter writer = new BufferedWriter(new FileWriter(outputFile));
// 将扫描的文本内容写入输出文件中
writer.write(scannedText);
// 关闭 BufferedWriter 对象以释放资源
writer.close();
}
}
指定语言文件扫描识别图像中的文字
- Java
import com.spire.ocr.OcrScanner;
import java.io.*;
public class ScanImageWithLanguageSelection {
public static void main(String[] args) throws Exception {
// 指定依赖文件的路径
String dependencies = "dependencies/";
// 指定语言文件的路径
String languageFile = "data/japandata";
// 指定要扫描的图像文件的路径
String imageFile = "data/JapaneseSample.png";
// 指定输出文件的路径
String outputFile = "ScanImageWithLanguageSelection_out.txt";
// 创建一个 OcrScanner 对象
OcrScanner scanner = new OcrScanner();
// 设置 OcrScanner 对象的依赖文件路径
scanner.setDependencies(dependencies);
// 加载指定的语言文件
scanner.loadLanguageFile(languageFile);
// 使用 OcrScanner 对象扫描指定的图像文件
scanner.scan(imageFile);
// 获取扫描的文本内容
String scannedText = scanner.getText().toString();
// 创建一个输出文件对象
File output = new File(outputFile);
// 如果输出文件已经存在,则删除它
if (output.exists()) {
output.delete();
}
// 创建一个 BufferedWriter 对象用于向输出文件写入内容
BufferedWriter writer = new BufferedWriter(new FileWriter(outputFile));
// 将扫描的文本内容写入输出文件中
writer.write(scannedText);
// 关闭 BufferedWriter 对象以释放资源
writer.close();
}
}
申请临时 License
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该Email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用JavaScript。获取有效期 30 天的临时许可证。