Python:如何为给定的特征向量找到最相似的标签?
我正在寻找一种机器学习方法来为给定的特征向量找到最可能的类标签(具有概率值)。我有一个n类的训练集,大多数特征向量由布尔值组成。到目前为止,我一直在考虑计算特征的真值数量,并对其进行规范化(例如m=特征值为真的训练样本数量,n=训练样本数量。feat_val=m/n),以创建类的代表性特征向量。一旦创建,类表示向量和给定特征向量之间的相似性度量,如余弦距离或欧氏距离。Python:如何为给定的特征向量找到最相似的标签?,python,machine-learning,Python,Machine Learning,我正在寻找一种机器学习方法来为给定的特征向量找到最可能的类标签(具有概率值)。我有一个n类的训练集,大多数特征向量由布尔值组成。到目前为止,我一直在考虑计算特征的真值数量,并对其进行规范化(例如m=特征值为真的训练样本数量,n=训练样本数量。feat_val=m/n),以创建类的代表性特征向量。一旦创建,类表示向量和给定特征向量之间的相似性度量,如余弦距离或欧氏距离。 有人能建议这种方法是否值得实施吗?您试图解决的问题称为分类,是监督学习的主要部分。一个名为scikit learn及其文档(tr
有人能建议这种方法是否值得实施吗?您试图解决的问题称为分类,是监督学习的主要部分。一个名为scikit learn及其文档(try)的开源库是一个很好的起点 有很多分类模型可用,但一旦你选择了一个特定的模型并对其进行训练,那么你只需使用predict_probaba方法来获得给定特征向量或矩阵的概率