Machine learning 关于自动、基于学习的文档摘要,有哪些好的资源可以学习?

Machine learning 关于自动、基于学习的文档摘要,有哪些好的资源可以学习?,machine-learning,nlp,Machine Learning,Nlp,文档摘要可以通过从源文档中提取文本来完成,也可以使用学习算法来解密文档所传达的内容,然后使用语言生成技术生成摘要(与人类的做法非常相似) 后一种方法是否有算法或现有的研究工作?一般来说,关于文档摘要技术,有哪些好的资源可以学习?您正在寻找的主题是“计算机科学社区” 自动摘要是使用计算机程序缩减文本文档的过程,目的是创建保留原始文档最重要点的摘要 自动摘要的方法包括基于抽取、基于抽象、基于最大熵和辅助摘要 这是一篇关于这个话题的好论文。你可能想看看另外两份文件:以及 希望能有帮助 自动文本摘要通常

文档摘要可以通过从源文档中提取文本来完成,也可以使用学习算法来解密文档所传达的内容,然后使用语言生成技术生成摘要(与人类的做法非常相似)


后一种方法是否有算法或现有的研究工作?一般来说,关于文档摘要技术,有哪些好的资源可以学习?

您正在寻找的主题是“计算机科学社区”

自动摘要是使用计算机程序缩减文本文档的过程,目的是创建保留原始文档最重要点的摘要

自动摘要的方法包括基于抽取、基于抽象、基于最大熵和辅助摘要

这是一篇关于这个话题的好论文。你可能想看看另外两份文件:以及


希望能有帮助

自动文本摘要通常分为两种类型:抽象和提取。抽象方法比提取方法有点复杂。第一种是从句子中提取重要特征和关键信息。使用自然语言生成技术,使用这些特征生成新句子

然而,在后一种方法中,所有句子都使用词汇排序、词汇链接等方法进行排序。相似的句子使用余弦相似性、模糊匹配等方法进行聚类。聚类中最重要的句子用于生成给定文档的摘要

从各种来源编译的一些现有自动文档文本摘要工作和技术:


  • 是的,我特别寻找基于抽象的摘要算法(不是基于提取的)。谢谢你提供的这些资源,我会浏览一下。但是,关于基于抽象的摘要的研究工作似乎很少,网上的帮助也不多。@sanjeevmk你有没有找到更多关于抽象摘要的信息?我也对寻找工具来辅助这项工作感兴趣,到目前为止,这项研究还很薄弱。