Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/ssis/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Lucene 与文本文件中的主题相关的内容_Lucene_Nlp_Text Mining - Fatal编程技术网

Lucene 与文本文件中的主题相关的内容

Lucene 与文本文件中的主题相关的内容,lucene,nlp,text-mining,Lucene,Nlp,Text Mining,我们是否有任何API可以识别与特定主题相关的文本文件中的内容 例如,我有一个文本文件,其中有5000行文本 我想提取与主题ABC相关的文本。lucene或任何其他api都能做到这一点吗?有什么想法吗 我使用Lucene来识别包含特定单词的文档,但我想知道我们是否有任何api可以从与特定主题相关的文件中提取内容。这是一个相当广泛的问题,但从您提供的信息来看,显然您有两个选择 选项1:使用API 你可以使用汤森路透,这是我见过的最适合开发者使用的。然而,我可以想象,随着时间的推移,它会变得昂贵。他们

我们是否有任何API可以识别与特定主题相关的文本文件中的内容

例如,我有一个文本文件,其中有5000行文本

我想提取与主题ABC相关的文本。lucene或任何其他api都能做到这一点吗?有什么想法吗


我使用Lucene来识别包含特定
单词的文档,但我想知道我们是否有任何api可以从与特定主题相关的文件中提取内容。

这是一个相当广泛的问题,但从您提供的信息来看,显然您有两个选择

选项1:使用API

你可以使用汤森路透,这是我见过的最适合开发者使用的。然而,我可以想象,随着时间的推移,它会变得昂贵。他们在他们的网站上提供了一个值得一看的网站

选项2:扩展Lucene的VSM

当我说扩展Lucene时,我不是说你需要。有很多开源项目可以利用。例如,它允许对潜在Dirichlet分配(LDA)进行查询。这个特殊的项目已经有3/4年没有更新了,所以它可能想要分叉或者构建自己的项目