Java 如何使用ApachePOI从ppt、pptx文件(页脚、幻灯片编号除外)中提取文本?

Java 如何使用ApachePOI从ppt、pptx文件(页脚、幻灯片编号除外)中提取文本?,java,apache-poi,powerpoint,extract,Java,Apache Poi,Powerpoint,Extract,我知道如何像这样使用ApachePOI从ppt文件中提取文本 InputStream fis=new FileInputStream("abcd.ppt"); HSLFSlideShow show=new HSLFSlideShow(fis); SlideShow ss=new SlideShow(show); Slide[] slides=ss.getSlides(); StringBuilder builder

我知道如何像这样使用ApachePOI从ppt文件中提取文本

        InputStream fis=new FileInputStream("abcd.ppt");
        HSLFSlideShow show=new HSLFSlideShow(fis);
        SlideShow ss=new SlideShow(show);
        Slide[] slides=ss.getSlides();
        StringBuilder builder = new StringBuilder();
        for(int x=0; x < slides.length; x++)
        {
            TextRun[] runs = slides[x].getTextRuns();
            for(int j=0; j<runs.length; j++) {
                TextRun run = runs[j];
                if(run != null) {
                    String text = run.getText();
                    builder.append(text);
                }
            }
        }
InputStream fis=新文件InputStream(“abcd.ppt”);
HSLFSlideShow show=新的HSLFSlideShow(fis);
SlideShow ss=新幻灯片(显示);
Slide[]slides=ss.getSlides();
StringBuilder=新的StringBuilder();
对于(int x=0;x对于(int j=0;j我建议您查看JP演示文稿。其中一个示例演示了如何从所有幻灯片中提取所有图像和文本:


API接缝看起来非常简单。

我建议您查看JP表示。其中一个示例演示了如何从所有幻灯片中提取所有图像和文本:


API将变得非常简单。

为什么不跳过您不感兴趣的文本运行?@Gagravarr的问题不是如何通过编程确定他们想要跳过哪些?我也有同样的问题。为什么不跳过您不感兴趣的文本运行?@Gagravarr的问题不是如何通过编程确定w他们想跳过哪些?我有同样的问题。我不知道这如何省略页眉和页脚文本,但形状和文本运行也都在POI中,所以想必有一种方法可以做到这一点,而不用求助于有问题的商业软件?我不知道这如何省略页眉和页脚文本,但形状和文本运行也都在POI中l、 所以,想必有一种方法可以做到这一点,而不用求助于有问题的商业软件?