Math 在scikit学习文档中,对于朴素贝叶斯,这个arg max表示法意味着什么?

Math 在scikit学习文档中,对于朴素贝叶斯,这个arg max表示法意味着什么?,math,machine-learning,scikit-learn,probability,naivebayes,Math,Machine Learning,Scikit Learn,Probability,Naivebayes,我指的是Naive Bayes的以下页面: 特别是从y-hat开始的方程。我想在那之前我基本上理解了方程,但是我不理解这行上的“arg max y”符号。这是什么意思?来自: 在数学中,极大值的自变量(缩写为arg max或argmax)是某些函数的域中函数值最大化的点。与全局最大值不同,arg max指的是函数的最大输出,arg max指的是函数输出尽可能大的输入或参数 换句话说,argmax f(x)表示使f(x)最大化的x(参数)的值;可以理解,它经常出现在优化问题中(这是大多数机器学习

我指的是Naive Bayes的以下页面:

特别是从y-hat开始的方程。我想在那之前我基本上理解了方程,但是我不理解这行上的“arg max y”符号。这是什么意思?

来自:

在数学中,极大值的自变量(缩写为arg maxargmax)是某些函数的域中函数值最大化的点。与全局最大值不同,arg max指的是函数的最大输出,arg max指的是函数输出尽可能大的输入或参数

换句话说,
argmax f(x)
表示使
f(x)
最大化的
x
(参数)的值;可以理解,它经常出现在优化问题中(这是大多数机器学习算法的基础)

非正式地说,是Numpy数组的类似函数(即非函数);它给出了数组值最大的位置:

将numpy导入为np
x=np.数组([3,1,8])#位置2处的最大参数
np.argmax(x)
# 2
来自:

在数学中,极大值的自变量(缩写为arg maxargmax)是某些函数的域中函数值最大化的点。与全局最大值不同,arg max指的是函数的最大输出,arg max指的是函数输出尽可能大的输入或参数

换句话说,
argmax f(x)
表示使
f(x)
最大化的
x
(参数)的值;可以理解,它经常出现在优化问题中(这是大多数机器学习算法的基础)

非正式地说,是Numpy数组的类似函数(即非函数);它给出了数组值最大的位置:

将numpy导入为np
x=np.数组([3,1,8])#位置2处的最大参数
np.argmax(x)
# 2

函数的
max
是最大输出值,而函数的
argmax
是最大输入值,即“参数”

在您示例中的等式中:

y\u hat
y
的值,即类标签,最大化右侧表达式

这里
p(y)
通常是训练集中类
y
的比例,也称为“先验”,而
p(x|i | y)
是观察特征值
x|i
的概率,如果真实类确实是
y
,也称为“可能性”

为了更好地理解产品<代码> p(xi i> y)<代码>,请考虑一个例子,你试图对硬币翻转序列进行分类,它来自硬币<代码> <代码>,其标题为“代码>50%”/代码>训练示例,或硬币<代码> b>代码>,其标题为“代码>66.7%”/代码>训练示例。这里每个个体
P(x|i|y|j)
是硬币
y|j
(其中
j
a
b
)落地
x|i
(其中
x|i
是正面或反面)的概率

因此序列
HHT
具有
0.667*0.667*0.333=0.148
给定硬币
B
的可能性,但只有
0.5*0.5=0.125
给定硬币
a
的可能性。然而,我们估计硬币
a
57%
先验值,因为
a
出现在
4/7
训练示例中,所以我们最终会预测该序列来自硬币
a
,因为
0.57*0.125>0.43*0.148
。这是因为我们更可能从coin
A
开始,因此coin
A
有更多机会产生一些不太可能的序列


如果硬币
A
B
的先验值分别为
50%
,那么我们自然会预测
HHT
的硬币
B
,因为这个序列显然具有给定硬币
B
的最高可能性,而函数的
max
是最大输出值,函数的
argmax
是输入的最大值,即“参数”

在您示例中的等式中:

y\u hat
y
的值,即类标签,最大化右侧表达式

这里
p(y)
通常是训练集中类
y
的比例,也称为“先验”,而
p(x|i | y)
是观察特征值
x|i
的概率,如果真实类确实是
y
,也称为“可能性”

为了更好地理解产品<代码> p(xi i> y)<代码>,请考虑一个例子,你试图对硬币翻转序列进行分类,它来自硬币<代码> <代码>,其标题为“代码>50%”/代码>训练示例,或硬币<代码> b>代码>,其标题为“代码>66.7%”/代码>训练示例。这里每个个体
P(x|i|y|j)
是硬币
y|j
(其中
j
a
b
)落地
x|i
(其中
x|i
是正面或反面)的概率

因此序列
HHT
具有
0.667*0.667*0.333=0.148
给定硬币
B
的可能性,但只有
0.5*0.5=0.125
给定硬币
a
的可能性。然而,我们估计硬币
a
57%
先验值,因为
a
出现在
4/7
训练示例中,所以我们最终会预测该序列来自硬币
a
,因为
0.57*0.125>0.43*0.148
。这是因为我们更像
Training set:

THH    A
HTT    A
HTH    A
TTH    A
HHH    B
HTH    B
TTH    B

Test set:

HHT    ?