Python Logistic回归中的混淆矩阵

Python Logistic回归中的混淆矩阵,python,logistic-regression,Python,Logistic Regression,在二元分类的逻辑回归中,当使用predict()时,分类器如何决定类(1/0) 是否基于概率阈值,如果大于0.5,则为1,否则为0?如果是,是否可以手动更改此阈值 我知道我们从predict\u prob()中得到概率,但我对predict()函数很好奇 逻辑回归与其他分类模型一样,返回每个类别的概率。作为一个二进制预测器,它只有两个类 从中,predict()返回类概率最高的类 def predict(self, X): """Predict class labels for samp

在二元分类的逻辑回归中,当使用
predict()
时,分类器如何决定类(1/0)

是否基于概率阈值,如果大于0.5,则为1,否则为0?如果是,是否可以手动更改此阈值


我知道我们从
predict\u prob()
中得到概率,但我对
predict()
函数很好奇

逻辑回归与其他分类模型一样,返回每个类别的概率。作为一个二进制预测器,它只有两个类

从中,
predict()
返回类概率最高的类

def predict(self, X):
    """Predict class labels for samples in X.
    Parameters
    ----------
    X : {array-like, sparse matrix}, shape = [n_samples, n_features]
        Samples.
    Returns
    -------
    C : array, shape = [n_samples]
        Predicted class label per sample.
    """
    scores = self.decision_function(X)
    if len(scores.shape) == 1:
        indices = (scores > 0).astype(np.int)
    else:
        indices = scores.argmax(axis=1)
    return self.classes_[indices]

是的,在这种情况下,它返回的类的概率大于50%,因为类概率之和=1。

它选择概率最高的类。好的,谢谢。那么,最大似然估计从何而来?对不起,如果这和它完全无关的话。这是一个更适合数学的问题。以下是.MLE在尝试根据一些训练数据计算模型系数时的相关信息。然后使用模型系数对新数据进行预测。