Java 如何从网页中提取句子

Java 如何从网页中提取句子,java,html-parsing,jsoup,Java,Html Parsing,Jsoup,我想从网页中提取句子(而不仅仅是html文本)。我想知道流行的HTML解析库(如Jsoup)是否支持这种功能 谢谢 编辑: 如果帖子不清楚,很抱歉。我需要自然语言句子,所以不必用点分隔 谢谢大家。我刚刚找到了这个库,它似乎正是我想要的。JSoup确实为提取和操作数据提供了非常方便的API,简言之。。。是的,它确实提供了这个功能…您可以使用jquery来实现这个功能 var t=$('p').text() var语句=t.split('.'); 更精确一些。举一个HTML内容的例子,告诉我们你想

我想从网页中提取句子(而不仅仅是html文本)。我想知道流行的HTML解析库(如Jsoup)是否支持这种功能

谢谢

编辑

如果帖子不清楚,很抱歉。我需要自然语言句子,所以不必用点分隔


谢谢大家。我刚刚找到了这个库,它似乎正是我想要的。

JSoup
确实为提取操作
数据提供了非常方便的
API
,简言之。。。是的,它确实提供了这个功能…

您可以使用jquery来实现这个功能


var t=$('p').text()
var语句=t.split('.');

更精确一些。举一个HTML内容的例子,告诉我们你想提取什么。你是在谈论“自然语言处理”还是一个句子有一个点分隔的单词列表?看看,他们在云端做的可能很简单。。这取决于你的具体需要。