Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/335.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 如何在网页中总结文章的主要内容?_Java_Jsoup_Summarization_Boilerpipe_Classifier4j - Fatal编程技术网

Java 如何在网页中总结文章的主要内容?

Java 如何在网页中总结文章的主要内容?,java,jsoup,summarization,boilerpipe,classifier4j,Java,Jsoup,Summarization,Boilerpipe,Classifier4j,我正在尝试为HTML页面编写一个文章摘要。到目前为止,我已经使用和 但大多数时候,代码并没有产生预期的结果,因为句子结构没有正确完成 我正在尝试实现一些尽可能简洁的东西 有人知道有哪个java库可以为您实现这一点吗?那么为什么不使用smmry API呢@弗雷德里克林:我不想依赖外部电话。我正在构建的服务已经包含了大量的处理。我不想进行任何其他外部调用,也不想依赖外部API。 //url can be any url in String public String getArticleSummar

我正在尝试为HTML页面编写一个文章摘要。到目前为止,我已经使用和

但大多数时候,代码并没有产生预期的结果,因为句子结构没有正确完成

我正在尝试实现一些尽可能简洁的东西


有人知道有哪个java库可以为您实现这一点吗?

那么为什么不使用smmry API呢@弗雷德里克林:我不想依赖外部电话。我正在构建的服务已经包含了大量的处理。我不想进行任何其他外部调用,也不想依赖外部API。
//url can be any url in String
public String getArticleSummaryFromUrl() {
    private Document doc = Jsoup.connect(url).get();;
    String summary = "";
    String article = "";    
    try {
        article = ArticleExtractor.INSTANCE.getText(doc.html());    
        System.out.println("Article ++++ >>" + article);
        SimpleSummariser ss = new SimpleSummariser();       
        summary = ss.summarise(article, 4);
        } catch (BoilerpipeProcessingException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }       
        return summary;
}