Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/google-cloud-platform/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Machine learning 机器学习模型能提供关于训练数据的平均值和标准偏差的信息吗?_Machine Learning_Classification_Data Science - Fatal编程技术网

Machine learning 机器学习模型能提供关于训练数据的平均值和标准偏差的信息吗?

Machine learning 机器学习模型能提供关于训练数据的平均值和标准偏差的信息吗?,machine-learning,classification,data-science,Machine Learning,Classification,Data Science,考虑在数据集上训练的参数二元分类器(如逻辑回归、支持向量机等)(例如包含两个特征,例如血压和胆固醇水平)数据集被丢弃,经过训练的模型只能用作黑盒(无法从经过训练的模型中收集调整和内部信息)。只能提供一组数据点并预测其标签 是否有可能获得关于该模型训练数据集特征的平均值和/或标准偏差和/或范围的信息?若有,原因为何?如果没有,为什么我们不能 谢谢您的回复!:) SVM不提供任何关于数据统计的信息,它是一个最大边距分类器,它在特征空间中寻找两个数据集之间的最佳分离超平面,作为“支持向量”的线性组合。

考虑在数据集上训练的参数二元分类器(如逻辑回归、支持向量机等)(例如包含两个特征,例如血压和胆固醇水平)数据集被丢弃,经过训练的模型只能用作黑盒(无法从经过训练的模型中收集调整和内部信息)。只能提供一组数据点并预测其标签

是否有可能获得关于该模型训练数据集特征的平均值和/或标准偏差和/或范围的信息?若有,原因为何?如果没有,为什么我们不能


谢谢您的回复!:)

SVM不提供任何关于数据统计的信息,它是一个最大边距分类器,它在特征空间中寻找两个数据集之间的最佳分离超平面,作为“支持向量”的线性组合。如果使用内核函数,那么这种组合是在内核空间中,甚至不是在原始特征空间中。SVM没有一个简单的概率解释

逻辑回归是一种判别分类法,它对条件概率p(y | x,w)进行建模,其中y是你的标签,x是你的数据,w是特征。在最大似然训练之后,你只剩下w,它又是特征空间中的一个鉴别器(超平面),所以你不再有特征了


可以考虑以下几点。使用高斯分类器。假设你的类是由前一类概率p(y)产生的。然后类条件密度p(x | y,w)生成数据。然后根据贝叶斯规则,你将得到:p(y | x,w)=(p(y)p(x | y,w))/p(x)。如果将类条件密度p(x | y,w)定义为高斯,则其参数集w将由平均向量m和x的协方差矩阵C组成,假设它是由类y生成的。但是请记住,这将只在当前数据向量属于特定类的假设下起作用。以w为条件,更好的选择是平均向量:E[x | w]。这是x对p(x | w)的期望。它归结为类y=0和y=1的平均向量相对于其先前类概率的加权平均值。同样的方法也适用于协方差,但需要正确推导,我现在不是100%确定。

这个问题不是关于编程,而是应该在感谢时提出,我将尝试考虑贝叶斯规则和高斯分布,以了解如何处理这个问题。:)