问题描述:用POI读取docx doc文档样式时,当文档用标题(一级标题.....),其全篇字体都会变成-1,请教大神原因。

预想效果:能获取含标题文档的样式(字体 字号 颜色等)

代码:import java.io.FileInputStream;

import java.io.InputStream;

import java.util.List;

import org.apache.poi.xwpf.usermodel.XWPFDocument;

import org.apache.poi.xwpf.usermodel.XWPFParagraph;

import org.apache.poi.xwpf.usermodel.XWPFRun;

public class XwpfTest{

public static void main(String[] args)throws Exception {

InputStream is = new FileInputStream("D:\\test.docx");

@SuppressWarnings("resource")

XWPFDocument doc = new XWPFDocument(is);

List paras = doc.getParagraphs();//将得到包含段落列表

System.out.println("all data :" + paras.size());

for(XWPFParagraph para : paras) {

//当前段落的属性

//CTPPr pr = para.getCTP().getPPr();

//System.out.println(para.getText());

List runsLists = para.getRuns();//获取段楼中的句列表

for(XWPFRun runsList : runsLists ){

String c = runsList.getColor();//获取句的字体颜色

float f = runsList.getFontSize();//获取句中字的大小

String s = runsList.getText(0);//获取文本内容

if(s != null) // 如果读取为非空,则对其进行判断

{

if(s.contains("摘要"))// 识别摘要

{

System.out.println("right!");

runsList.setBold(true);

}

if(s.equals("摘要:")){

System.out.println("ddddddddddddddddddd");

}

if(s.contains("第一章")){

if(f != 16){

System.out.println("一级标题格式不是三号字体!");

}

System.out.println("一级标题!!!!!");

}

}

test.docx文档图片

7d077f76f88e33175fc53511e9b09209.png

运行图片:

0f36bfaeb324e23cfcd181b9a607a6a0.png

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐