Math 在scikit学习文档中,对于朴素贝叶斯,这个arg max表示法意味着什么?
我指的是Naive Bayes的以下页面: 特别是从y-hat开始的方程。我想在那之前我基本上理解了方程,但是我不理解这行上的“arg max y”符号。这是什么意思?来自: 在数学中,极大值的自变量(缩写为arg max或argmax)是某些函数的域中函数值最大化的点。与全局最大值不同,arg max指的是函数的最大输出,arg max指的是函数输出尽可能大的输入或参数 换句话说,Math 在scikit学习文档中,对于朴素贝叶斯,这个arg max表示法意味着什么?,math,machine-learning,scikit-learn,probability,naivebayes,Math,Machine Learning,Scikit Learn,Probability,Naivebayes,我指的是Naive Bayes的以下页面: 特别是从y-hat开始的方程。我想在那之前我基本上理解了方程,但是我不理解这行上的“arg max y”符号。这是什么意思?来自: 在数学中,极大值的自变量(缩写为arg max或argmax)是某些函数的域中函数值最大化的点。与全局最大值不同,arg max指的是函数的最大输出,arg max指的是函数输出尽可能大的输入或参数 换句话说,argmax f(x)表示使f(x)最大化的x(参数)的值;可以理解,它经常出现在优化问题中(这是大多数机器学习
argmax f(x)
表示使f(x)
最大化的x
(参数)的值;可以理解,它经常出现在优化问题中(这是大多数机器学习算法的基础)
非正式地说,是Numpy数组的类似函数(即非函数);它给出了数组值最大的位置:
将numpy导入为np
x=np.数组([3,1,8])#位置2处的最大参数
np.argmax(x)
# 2
来自:
在数学中,极大值的自变量(缩写为arg max或argmax)是某些函数的域中函数值最大化的点。与全局最大值不同,arg max指的是函数的最大输出,arg max指的是函数输出尽可能大的输入或参数
换句话说,argmax f(x)
表示使f(x)
最大化的x
(参数)的值;可以理解,它经常出现在优化问题中(这是大多数机器学习算法的基础)
非正式地说,是Numpy数组的类似函数(即非函数);它给出了数组值最大的位置:
将numpy导入为np
x=np.数组([3,1,8])#位置2处的最大参数
np.argmax(x)
# 2
函数的max
是最大输出值,而函数的argmax
是最大输入值,即“参数”
在您示例中的等式中:
y\u hat
是y
的值,即类标签,最大化右侧表达式
这里p(y)
通常是训练集中类y
的比例,也称为“先验”,而p(x|i | y)
是观察特征值x|i
的概率,如果真实类确实是y
,也称为“可能性”
为了更好地理解产品<代码> p(xi i> y)<代码>,请考虑一个例子,你试图对硬币翻转序列进行分类,它来自硬币<代码> <代码>,其标题为“代码>50%”/代码>训练示例,或硬币<代码> b>代码>,其标题为“代码>66.7%”/代码>训练示例。这里每个个体P(x|i|y|j)
是硬币y|j
(其中j
是a
或b
)落地x|i
(其中x|i
是正面或反面)的概率
因此序列HHT
具有0.667*0.667*0.333=0.148
给定硬币B
的可能性,但只有0.5*0.5=0.125
给定硬币a
的可能性。然而,我们估计硬币a
的57%
先验值,因为a
出现在4/7
训练示例中,所以我们最终会预测该序列来自硬币a
,因为0.57*0.125>0.43*0.148
。这是因为我们更可能从coinA
开始,因此coinA
有更多机会产生一些不太可能的序列
如果硬币
A
和B
的先验值分别为50%
,那么我们自然会预测HHT
的硬币B
,因为这个序列显然具有给定硬币B
的最高可能性,而函数的max
是最大输出值,函数的argmax
是输入的最大值,即“参数”
在您示例中的等式中:
y\u hat
是y
的值,即类标签,最大化右侧表达式
这里p(y)
通常是训练集中类y
的比例,也称为“先验”,而p(x|i | y)
是观察特征值x|i
的概率,如果真实类确实是y
,也称为“可能性”
为了更好地理解产品<代码> p(xi i> y)<代码>,请考虑一个例子,你试图对硬币翻转序列进行分类,它来自硬币<代码> <代码>,其标题为“代码>50%”/代码>训练示例,或硬币<代码> b>代码>,其标题为“代码>66.7%”/代码>训练示例。这里每个个体P(x|i|y|j)
是硬币y|j
(其中j
是a
或b
)落地x|i
(其中x|i
是正面或反面)的概率
因此序列HHT
具有0.667*0.667*0.333=0.148
给定硬币B
的可能性,但只有0.5*0.5=0.125
给定硬币a
的可能性。然而,我们估计硬币a
的57%
先验值,因为a
出现在4/7
训练示例中,所以我们最终会预测该序列来自硬币a
,因为0.57*0.125>0.43*0.148
。这是因为我们更像
Training set:
THH A
HTT A
HTH A
TTH A
HHH B
HTH B
TTH B
Test set:
HHT ?