本文介绍使用Spire.Doc for Java来获取Word中设置的标题内容。如果文档的目录选项中将“有效样式”和“目录级别”进行了相应设置(如下图),则获取标题的方法也可以用作获取目录内容。
用于测试的Word文档如下图所示:
import com.spire.doc.*;
import com.spire.doc.documents.Paragraph;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
public class GetTitle {
public static void main(String[] args)throws IOException {
//加载Word测试文档
Document doc = new Document();
doc.loadFromFile("input.docx");
//保存标题内容到.txt文档
File file = new File("GetTitle.txt");
if (file.exists())
{
file.delete();
}
file.createNewFile();
FileWriter fw = new FileWriter(file, true);
BufferedWriter bw = new BufferedWriter(fw);
//遍历section
for (int i = 0; i < doc.getSections().getCount(); i++)
{
Section section = doc.getSections().get(i);
//遍历Paragraph
for (int j = 0; j < section.getParagraphs().getCount(); j++)
{
Paragraph paragraph = section.getParagraphs().get(j);
//获取标题
if ( paragraph.getStyleName().matches("1"))//段落为“标题1”的内容
{
//获取段落标题内容
String text = paragraph.getText();
//写入文本到txt文档
bw.write("标题1: "+ text + "\r");
}
//获取标题
if ( paragraph.getStyleName().matches("2"))//段落为“标题2”的内容
{
//获取段落标题内容
String text = paragraph.getText();
//写入文本到txt文档
bw.write("标题2: " + text + "\r");
}
//获取标题
if ( paragraph.getStyleName().matches("3"))//段落为“标题3”的内容
{
//获取段落标题内容
String text = paragraph.getText();
//写入文本到txt文档
bw.write("标题3: " + text+"\r");
}
//获取标题
if ( paragraph.getStyleName().matches("4"))//段落为“标题4”的内容
{
//获取段落标题内容
String text = paragraph.getText();
//写入文本到txt文档
bw.write("标题4: " + text+"\r");
}
bw.write("\n");
}
}
bw.flush();
bw.close();
fw.close();
}
}
标题(目录)获取结果: