Algorithm 实现自动标记的问题分析器

Algorithm 实现自动标记的问题分析器,algorithm,bayesian,analyzer,Algorithm,Bayesian,Analyzer,实现问题分析器的好资源是什么 我试图找出如何自动标记问题,使非技术用户更容易提问。我发现使用贝叶斯定理我可以做到这一点,但我不知道如何实现它 任何关于这方面的开源库或研究论文?朴素贝叶斯概率分类器通常用于文本分类。其基本思想是使用单词和类别的联合概率来估计给定文档中类别的概率。这种模型最天真的部分是单词独立性的假设。这种假设的简单性使得朴素贝叶斯分类器的计算效率远远高于非朴素贝叶斯方法的指数复杂度,因为它不使用单词组合作为预测器。 如果任务是将测试文档分类为单个类,则选择后验概率最高的类 这里有

实现问题分析器的好资源是什么

我试图找出如何自动标记问题,使非技术用户更容易提问。我发现使用贝叶斯定理我可以做到这一点,但我不知道如何实现它


任何关于这方面的开源库或研究论文?

朴素贝叶斯概率分类器通常用于文本分类。其基本思想是使用单词和类别的联合概率来估计给定文档中类别的概率。这种模型最天真的部分是单词独立性的假设。这种假设的简单性使得朴素贝叶斯分类器的计算效率远远高于非朴素贝叶斯方法的指数复杂度,因为它不使用单词组合作为预测器。 如果任务是将测试文档分类为单个类,则选择后验概率最高的类

这里有一个参考: [1] 汤姆·米切尔,“机器学习”,麦格劳·希尔,1997年。(第6.10节)

如果假设每个问题类别都是文本类型,则可以使用文本分类

朴素贝叶斯分类器基于贝叶斯定理,假设所有特征(或属性)都是独立的

它很容易实现。您可以找到许多带有实现的软件包。R中的e1071包实现了它。下面是R中使用朴素贝叶斯分类器的示例代码:



N您的算法必须维护一个表(或类似的东西)

根据此表分析语句时(忽略填充词后)


当您使用所选算法不断学习时,您的表会不断更新,并不断获得更好的结果。

您是否在寻找开源贝叶斯分类器?你在寻找有监督/无监督的学习吗?开源贝叶斯分类器会很好。我正在寻找实现这一点的最佳方法。我相信无监督的学习将允许系统成长,而不是由一个人提供。这可能会奏效,但创建一个单词标记对表需要很长时间。你如何在这篇文章中发现“研究论文”?

N <- nrow(data)
Ntrain <- round(N*0.7)
data <- data[sample(1:N),]
train <- data[1:Ntrain,]
test <- data[(Ntrain+1):N,]
y<-as.factor(train[,13])
x<-train[,3:12]
y_test <- as.factor(test[,13])
x_test <- test[,3:12]
library(e1071)
m <- naiveBayes(x, y) 
pred_test <- predict(m,x_test, type = "class")
pred <- predict(m,x, type = "class")
Word            Category
-------------------------------------
algo            algorithm
design          algorithm
...
...
libraries       library
open            open-source
open-source     open-source
paper           research-paper
research        research-paper
source          source-code
...
1. "Any open source libraries or research papers on this?"

2. open source libraries research papers

3. 
open            open-source
source          source-code
open-source     open-source
libraries       library
research        research-paper
paper           research-paper
research-paper  research-paper

4. by a simple majority, (you can also use a more complex algorithm here,
   like assigning weights to the Categories)
selected category = research paper