Nlp 确定课文中最重要的句子

Nlp 确定课文中最重要的句子,nlp,text-processing,levenshtein-distance,summarization,Nlp,Text Processing,Levenshtein Distance,Summarization,我正在开发一个工具,允许用户总结选定的文本 我想通过确定文本中最重要的句子的数量x(由用户决定/根据文本长度计算),然后对于每个“核心句子”,我想用与该核心句子最相关/相似的句子的数量x来伴随该句子。这样,我希望在几行中涵盖一篇文章的多个重要部分,而不是一大块(主题)。我知道并非每一篇文章都有多个主题,足以包含多个核心句子,核心句子和相关句子的数量将取决于文本本身 为了确定这些重要的句子,我目前以的例子为基础,它使用句子之间的交叉得分对文本中的每个句子进行排序。到目前为止,这已经导致了不错的结果

我正在开发一个工具,允许用户总结选定的文本

我想通过确定文本中最重要的句子的数量x(由用户决定/根据文本长度计算),然后对于每个“核心句子”,我想用与该核心句子最相关/相似的句子的数量x来伴随该句子。这样,我希望在几行中涵盖一篇文章的多个重要部分,而不是一大块(主题)。我知道并非每一篇文章都有多个主题,足以包含多个核心句子,核心句子和相关句子的数量将取决于文本本身

为了确定这些重要的句子,我目前以的例子为基础,它使用句子之间的交叉得分对文本中的每个句子进行排序。到目前为止,这已经导致了不错的结果,但有时结果并不像定性的那样

因此,我正在寻找其他方法来提取最重要的句子。经过一段时间的搜索后,该字符串多次弹出,作为比较字符串的一种方式

我是否可以使用Levenshtein距离计算每个句子之间的LD,并将每个句子的LD总量相加,返回具有最低聚合Levenshtein距离数的x个句子量-这会导致文本中最重要句子的代表性排名

如果不是,我应该坚持交叉方法还是应该考虑另一种选择?< /P> 我还考虑使用“预处理”一个句子,以便在文本的句子中只保留有价值的单词