Math 在scikit学习文档中，对于朴素贝叶斯，这个arg max表示法意味着什么？_Math_Machine Learning_Scikit Learn_Probability_Naivebayes

Math 在scikit学习文档中，对于朴素贝叶斯，这个arg max表示法意味着什么？

math machine-learning scikit-learn

Math 在scikit学习文档中，对于朴素贝叶斯，这个arg max表示法意味着什么？,math,machine-learning,scikit-learn,probability,naivebayes,Math,Machine Learning,Scikit Learn,Probability,Naivebayes,我指的是Naive Bayes的以下页面：特别是从y-hat开始的方程。我想在那之前我基本上理解了方程，但是我不理解这行上的“arg max y”符号。这是什么意思？来自：在数学中，极大值的自变量（缩写为arg max或argmax）是某些函数的域中函数值最大化的点。与全局最大值不同，arg max指的是函数的最大输出，arg max指的是函数输出尽可能大的输入或参数换句话说，argmax f（x）表示使f（x）最大化的x（参数）的值；可以理解，它经常出现在优化问题中（这是大多数机器学习

我指的是Naive Bayes的以下页面：

特别是从y-hat开始的方程。我想在那之前我基本上理解了方程，但是我不理解这行上的“arg max y”符号。这是什么意思？

来自：

在数学中，极大值的自变量（缩写为arg max或argmax）是某些函数的域中函数值最大化的点。与全局最大值不同，arg max指的是函数的最大输出，arg max指的是函数输出尽可能大的输入或参数
换句话说，
argmax f（x）
表示使
f（x）
最大化的
x
（参数）的值；可以理解，它经常出现在优化问题中（这是大多数机器学习算法的基础）
非正式地说，是Numpy数组的类似函数（即非函数）；它给出了数组值最大的位置：

将numpy导入为np x=np.数组（[3,1,8]）#位置2处的最大参数 np.argmax（x） # 2
来自：
在数学中，极大值的自变量（缩写为arg max或argmax）是某些函数的域中函数值最大化的点。与全局最大值不同，arg max指的是函数的最大输出，arg max指的是函数输出尽可能大的输入或参数
换句话说，
argmax f（x）
表示使
f（x）
最大化的
x
（参数）的值；可以理解，它经常出现在优化问题中（这是大多数机器学习算法的基础）
非正式地说，是Numpy数组的类似函数（即非函数）；它给出了数组值最大的位置：

将numpy导入为np x=np.数组（[3,1,8]）#位置2处的最大参数 np.argmax（x） # 2
函数的
max
是最大输出值，而函数的
argmax
是最大输入值，即“参数”

在您示例中的等式中：

y\u hat
是
y
的值，即类标签，最大化右侧表达式
这里
p（y）
通常是训练集中类
y
的比例，也称为“先验”，而
p（x|i | y）
是观察特征值
x|i
的概率，如果真实类确实是
y
，也称为“可能性”
为了更好地理解产品<代码> p（xi i> y）<代码>，请考虑一个例子，你试图对硬币翻转序列进行分类，它来自硬币<代码> <代码>，其标题为“代码＞50%”/代码>训练示例，或硬币<代码> b>代码>，其标题为“代码＞66.7%”/代码>训练示例。这里每个个体
P（x|i|y|j）
是硬币
y|j
（其中
j
是
a
或
b
）落地
x|i
（其中
x|i
是正面或反面）的概率
因此序列
HHT
具有
0.667*0.667*0.333=0.148
给定硬币
B
的可能性，但只有
0.5*0.5=0.125
给定硬币
a
的可能性。然而，我们估计硬币
a
的
57%
先验值，因为
a
出现在
4/7
训练示例中，所以我们最终会预测该序列来自硬币
a
，因为
0.57*0.125>0.43*0.148
。这是因为我们更可能从coin
A
开始，因此coin
A
有更多机会产生一些不太可能的序列

如果硬币
A
和
B
的先验值分别为
50%
，那么我们自然会预测
HHT
的硬币
B
，因为这个序列显然具有给定硬币
B
的最高可能性，而函数的
max
是最大输出值，函数的
argmax
是输入的最大值，即“参数”

在您示例中的等式中：

y\u hat
是
y
的值，即类标签，最大化右侧表达式
这里
p（y）
通常是训练集中类
y
的比例，也称为“先验”，而
p（x|i | y）
是观察特征值
x|i
的概率，如果真实类确实是
y
，也称为“可能性”
为了更好地理解产品<代码> p（xi i> y）<代码>，请考虑一个例子，你试图对硬币翻转序列进行分类，它来自硬币<代码> <代码>，其标题为“代码＞50%”/代码>训练示例，或硬币<代码> b>代码>，其标题为“代码＞66.7%”/代码>训练示例。这里每个个体
P（x|i|y|j）
是硬币
y|j
（其中
j
是
a
或
b
）落地
x|i
（其中
x|i
是正面或反面）的概率
因此序列
HHT
具有
0.667*0.667*0.333=0.148
给定硬币
B
的可能性，但只有
0.5*0.5=0.125
给定硬币
a
的可能性。然而，我们估计硬币
a
的
57%
先验值，因为
a
出现在
4/7
训练示例中，所以我们最终会预测该序列来自硬币
a
，因为
0.57*0.125>0.43*0.148
。这是因为我们更像
Training set: THH A HTT A HTH A TTH A HHH B HTH B TTH B Test set: HHT ?