Java 使用多布尔查询对是或否意见进行分类

Java 使用多布尔查询对是或否意见进行分类,java,lucene,information-retrieval,booleanquery,Java,Lucene,Information Retrieval,Booleanquery,我收集了一些推特,表达了对公投的赞成或反对意见。我也有两组支持是和否的政客。同样,我有两组表达是和否观点的词。这些词是通过图形分析提取的 现在我必须决定某条推特是属于“是”意见还是“否”意见。我怎样才能提出一个问题 我考虑了以下返回Yes文档的方法: (Yes_Politician1 OR Yes_Politician2 OR Yes_Politician3 OR...) AND (Yes_Word1 OR Yes_Word2 OR Yes_Word3....) 您认为上述查询是否可行?我还

我收集了一些推特,表达了对公投的赞成或反对意见。我也有两组支持是和否的政客。同样,我有两组表达是和否观点的词。这些词是通过图形分析提取的

现在我必须决定某条推特是属于“是”意见还是“否”意见。我怎样才能提出一个问题

我考虑了以下返回Yes文档的方法:

(Yes_Politician1 OR Yes_Politician2 OR Yes_Politician3 OR...) AND (Yes_Word1 OR Yes_Word2 OR Yes_Word3....) 
您认为上述查询是否可行?我还应该指出,有些词可能同时属于Yes和No词集

“我还应该指出,有些词可能同时属于是和否词集。”


好吧,那么不,如果,让我们说“是的政治家”他的“不”字与其他人的“是的”字重叠,那么上述说法就行不通了。那么,你的if语句是否会将他的语句归为错误的组?或者你们的意思是“属于两组”之类的词吗?

是的,你们是对的。也许我可以添加一些启发,比如计算一个赞成的政客在推特上被提及多少次?或者推特中提到了一个Yes_词?@siddhantandon好吧,只要你对一组政客和一组词进行分类,那么如果这些词可以同时出现在这两组词中,那么它就不可能真正起作用。要么明确地说出这些话,要么对一位政治家和他的话进行分类,然后为所有人这样做。我不知道你在做什么,所以我可能错了,但至少对我来说,这就是我对类似情况的看法。幸运的是,我不能这么做。这些词是通过一些图形分析提取出来的。所以我没有为每个政治家列出的词汇列表,我只是用整个推特数据集提取了一大串词汇。由于图表分析可以给我返回许多“是”和“否”两组共有的单词,所以我不能按照你的建议去做。