Java 如何使用ApachePOI从ppt、pptx文件(页脚、幻灯片编号除外)中提取文本?
我知道如何像这样使用ApachePOI从ppt文件中提取文本Java 如何使用ApachePOI从ppt、pptx文件(页脚、幻灯片编号除外)中提取文本?,java,apache-poi,powerpoint,extract,Java,Apache Poi,Powerpoint,Extract,我知道如何像这样使用ApachePOI从ppt文件中提取文本 InputStream fis=new FileInputStream("abcd.ppt"); HSLFSlideShow show=new HSLFSlideShow(fis); SlideShow ss=new SlideShow(show); Slide[] slides=ss.getSlides(); StringBuilder builder
InputStream fis=new FileInputStream("abcd.ppt");
HSLFSlideShow show=new HSLFSlideShow(fis);
SlideShow ss=new SlideShow(show);
Slide[] slides=ss.getSlides();
StringBuilder builder = new StringBuilder();
for(int x=0; x < slides.length; x++)
{
TextRun[] runs = slides[x].getTextRuns();
for(int j=0; j<runs.length; j++) {
TextRun run = runs[j];
if(run != null) {
String text = run.getText();
builder.append(text);
}
}
}
InputStream fis=新文件InputStream(“abcd.ppt”);
HSLFSlideShow show=新的HSLFSlideShow(fis);
SlideShow ss=新幻灯片(显示);
Slide[]slides=ss.getSlides();
StringBuilder=新的StringBuilder();
对于(int x=0;x 对于(int j=0;j我建议您查看JP演示文稿。其中一个示例演示了如何从所有幻灯片中提取所有图像和文本:
API接缝看起来非常简单。我建议您查看JP表示。其中一个示例演示了如何从所有幻灯片中提取所有图像和文本:
API将变得非常简单。为什么不跳过您不感兴趣的文本运行?@Gagravarr的问题不是如何通过编程确定他们想要跳过哪些?我也有同样的问题。为什么不跳过您不感兴趣的文本运行?@Gagravarr的问题不是如何通过编程确定w他们想跳过哪些?我有同样的问题。我不知道这如何省略页眉和页脚文本,但形状和文本运行也都在POI中,所以想必有一种方法可以做到这一点,而不用求助于有问题的商业软件?我不知道这如何省略页眉和页脚文本,但形状和文本运行也都在POI中l、 所以,想必有一种方法可以做到这一点,而不用求助于有问题的商业软件?