Nlp 文本挖掘的基本算法是什么?

Nlp 文本挖掘的基本算法是什么?,nlp,information-retrieval,text-mining,Nlp,Information Retrieval,Text Mining,我正在尝试做一个从网络上挖掘一些文本的应用程序,但我不确定执行文本挖掘的最佳方法是什么 关于这个问题,我想知道在文档中执行文本挖掘和进行一些信息检索(不用于索引)最常用的技术/算法是什么 我认为这是最常用的技术。文本挖掘是一个相当宽泛的术语,它大致上意味着机器学习应用于文本。常用的技术包括k-均值聚类、朴素贝叶斯和线性支持向量机分类、tf-idf矢量化(应用于文本时称为tf-idf)、潜在Dirichlet分配。因此,执行“一些文本挖掘”可能意味着什么,就像执行“一些信息检索”一样 有关该领域的

我正在尝试做一个从网络上挖掘一些文本的应用程序,但我不确定执行文本挖掘的最佳方法是什么

关于这个问题,我想知道在文档中执行文本挖掘和进行一些信息检索(不用于索引)最常用的技术/算法是什么

我认为这是最常用的技术。

文本挖掘是一个相当宽泛的术语,它大致上意味着机器学习应用于文本。常用的技术包括k-均值聚类、朴素贝叶斯和线性支持向量机分类、tf-idf矢量化(应用于文本时称为tf-idf)、潜在Dirichlet分配。因此,执行“一些文本挖掘”可能意味着什么,就像执行“一些信息检索”一样


有关该领域的详细介绍,请参阅刘冰的书Web数据挖掘。

最基本的文本挖掘技术是