Machine learning 输入为(X*θ)时写入sigmoid函数

Machine learning 输入为(X*θ)时写入sigmoid函数,machine-learning,octave,logistic-regression,Machine Learning,Octave,Logistic Regression,在机器学习课程中,我无法想象下面的输入 在逻辑回归中,我们有以下等式: 我们可以在sigmoid.m中用八度音阶写出它,如下所示: g = (1 ./ ( 1 + e.^(-z))); 现在,为了计算costFUnction.m,我们得到的概率为: h = sigmoid(X*theta); 从上面的图片来看,它不应该是: h = sigmoid(theta'*X); 我错过了什么。我是ML的新手,所以如果我在这里遗漏了什么,请原谅。如果你提到,你可以看到 我们想从h(x)中得到的是:

在机器学习课程中,我无法想象下面的输入

在逻辑回归中,我们有以下等式:

我们可以在
sigmoid.m
中用八度音阶写出它,如下所示:

g = (1 ./ ( 1 + e.^(-z)));
现在,为了计算
costFUnction.m
,我们得到的概率为:

h = sigmoid(X*theta);
从上面的图片来看,它不应该是:

h = sigmoid(theta'*X);
我错过了什么。我是ML的新手,所以如果我在这里遗漏了什么,请原谅。

如果你提到,你可以看到

我们想从
h(x)
中得到的是:

要将其可视化:

X =  [ 1 x1 ; 1 x2 ; 1 x3;]
theta = [ t0 t1;]
X * theta
% will give  [ t0+(x1*t1) ; t0+(x2*t1) ; t0+(x3*t1) ; ] 

其中,上述矩阵的每一行表示单独的假设

最重要的是理解每个向量的含义。在大多数课程中,他们谈论

    h = theta'* x
但这里他们使用了柱向量,所以h是一个标量,用于一个训练示例。 矢量化符号告诉你

    h = X * theta
其中X是一个矩阵,所有训练示例,其中每个示例是一行,特征是列。所以m x n,有m个训练示例和n个特征。您希望h为每个训练示例提供一个输出,因此您需要一个m x 1矩阵。你知道θ将是一个nx1矩阵,因为它是每个特征的θ,你有一个模型。如果你使用我在顶部写下的第二个公式,你会得到一个更喜欢的矩阵h a m x 1。

大小(x)和大小(θ)是多少?