Python Sklearn,高斯过程:XA和XB必须具有相同的列数
我是python新手,对高斯回归很感兴趣。 我在py3.6和SKlearn 0.19下 我有一个简单的代码,我得到了一个关于cdist中向量维数的错误,这个错误被predict调用。我知道我的输入有问题。但我不明白为什么 我以高斯过程回归器为例,但它似乎不是最常用的工具 提前感谢你的帮助 干杯 以下是我的代码示例:Python Sklearn,高斯过程:XA和XB必须具有相同的列数,python,pandas,numpy,machine-learning,scikit-learn,Python,Pandas,Numpy,Machine Learning,Scikit Learn,我是python新手,对高斯回归很感兴趣。 我在py3.6和SKlearn 0.19下 我有一个简单的代码,我得到了一个关于cdist中向量维数的错误,这个错误被predict调用。我知道我的输入有问题。但我不明白为什么 我以高斯过程回归器为例,但它似乎不是最常用的工具 提前感谢你的帮助 干杯 以下是我的代码示例: import pandas as pd import numpy as np import numpy as np from sklearn.gaussian_process imp
import pandas as pd
import numpy as np
import numpy as np
from sklearn.gaussian_process import GaussianProcessRegressor as gpr
from sklearn.gaussian_process.kernels import RBF, ConstantKernel as C
....
#X_train are the training samples
X_train= np.column_stack((xc,yc,zc))
print('X_train')
print(X_train.shape)
print(X_train)
这是X_列车的打印件:
X_train (4576, 3)
[[ 0.71958336 -1.12719598 0.47889958]
[ 0.71958336 -1.12719598 0.47889958]
[ 0.71958336 -1.12719598 0.34285071]
...
[ 0.55255508 -1.18817547 -1.63666023]
[ 0.55255508 -1.18817547 -1.70468466]
[ 0.55255508 -1.18817547 -1.77270909]]
以下是培训的目标功能:
print('v1')
print(v1.shape)
print(v1)
它的印刷品
v1
(4576,)
0 10.0
1 14.0
2 13.0
3 19.0
....
4573 39.0
4574 16.0
4575 12.0
以下是要预测的样本:
x = np.column_stack((xp,
yp,
zp))
print('x')
print(x.shape)
print(x)
这是印刷品:
下面是拟合和预测
v1 = v1.ravel()
#default kernel
kernel = C(1.0, (1e-3, 1e3)) * RBF(10, (1e-2, 1e2))
X_train, v1 = make_regression()
model = gpr(kernel=kernel, n_restarts_optimizer=9)
model.fit(X_train,v1)
#Predict v1
v1_pred = model.predict(x)
运行时,我收到以下错误:
文件“test.py”,第189行,在测试中
v1_pred=model.predict(x)文件“/usr/local/lib/python3.6/site packages/sklearn/gaussian_process/gpr.py”,
第315行,在预测中
K_trans=self.kernel_ux(self.X_utrain_ux)文件“/usr/local/lib/python3.6/site packages/sklearn/gaussian_process/kernels.py”,
第758行,在呼叫中
返回self.k1(X,Y)*self.k2(X,Y)文件“/usr/local/lib/python3.6/site packages/sklearn/gaussian_process/kernels.py”,
第1215行,在调用中
metric='sqeuclidean')文件“/usr/local/lib/python3.6/site packages/scipy/space/distance.py”,
第2373行,在cdist中
raise VALUERROR('XA和XB必须具有相同的列数'VALUERROR:XA和XB必须具有相同的列数(即。
特征尺寸。)
我只是简单地复制粘贴了一个代码,然后做了一些愚蠢的事情:
X_train, v1 = make_regression()
只是必须删除它。什么是
xp
、yp
和zp
?抱歉,可能不清楚。为了解释我的情况,我对三维空间中的一个组件进行了化学分析。xc、yc、zc是我训练样本上的变量,我知道三维空间中xc、yc、zc位置的化学分析值。xp,yp,zp是相同的,但在数据中我想预测未知的化学分析。所以简而言之,这些是卡特尔坐标,应该链接到化学分析xp,yp,zp和xc,yc,zx是:类型
X_train, v1 = make_regression()