Python Sklearn，高斯过程：XA和XB必须具有相同的列数_Python_Pandas_Numpy_Machine Learning_Scikit Learn

Python Sklearn，高斯过程：XA和XB必须具有相同的列数

python pandas numpy machine-learning scikit-learn

Python Sklearn，高斯过程：XA和XB必须具有相同的列数,python,pandas,numpy,machine-learning,scikit-learn,Python,Pandas,Numpy,Machine Learning,Scikit Learn,我是python新手，对高斯回归很感兴趣。我在py3.6和SKlearn 0.19下我有一个简单的代码，我得到了一个关于cdist中向量维数的错误，这个错误被predict调用。我知道我的输入有问题。但我不明白为什么我以高斯过程回归器为例，但它似乎不是最常用的工具提前感谢你的帮助干杯以下是我的代码示例： import pandas as pd import numpy as np import numpy as np from sklearn.gaussian_process imp

我是python新手，对高斯回归很感兴趣。我在py3.6和SKlearn 0.19下

我有一个简单的代码，我得到了一个关于cdist中向量维数的错误，这个错误被predict调用。我知道我的输入有问题。但我不明白为什么

我以高斯过程回归器为例，但它似乎不是最常用的工具

提前感谢你的帮助

干杯

以下是我的代码示例：

import pandas as pd
import numpy as np
import numpy as np
from sklearn.gaussian_process import GaussianProcessRegressor as gpr
from sklearn.gaussian_process.kernels import RBF, ConstantKernel as C

....

#X_train are the training samples
X_train= np.column_stack((xc,yc,zc))
print('X_train')
print(X_train.shape)
print(X_train)

这是X_列车的打印件：

  X_train  (4576, 3) 
      [[ 0.71958336 -1.12719598  0.47889958]
       [ 0.71958336 -1.12719598  0.47889958] 
      [ 0.71958336 -1.12719598  0.34285071]
       ...   
      [ 0.55255508 -1.18817547 -1.63666023] 
      [ 0.55255508 -1.18817547 -1.70468466]


     [ 0.55255508 -1.18817547 -1.77270909]]

以下是培训的目标功能：

print('v1')
print(v1.shape)
print(v1)

它的印刷品

v1
(4576,)

0       10.0
1       14.0
2       13.0
3       19.0
....
4573    39.0
4574    16.0
4575    12.0

以下是要预测的样本：

x = np.column_stack((xp,
                     yp,
                     zp))


print('x')
print(x.shape)
print(x)

这是印刷品：

下面是拟合和预测

v1 = v1.ravel()
#default kernel
kernel = C(1.0, (1e-3, 1e3)) * RBF(10, (1e-2, 1e2))

X_train, v1 = make_regression()
model = gpr(kernel=kernel, n_restarts_optimizer=9)
model.fit(X_train,v1)

#Predict v1 
v1_pred = model.predict(x)

运行时，我收到以下错误：

文件“test.py”，第189行，在测试中 v1_pred=model.predict（x）文件“/usr/local/lib/python3.6/site packages/sklearn/gaussian_process/gpr.py”，第315行，在预测中 K_trans=self.kernel_ux（self.X_utrain_ux）文件“/usr/local/lib/python3.6/site packages/sklearn/gaussian_process/kernels.py”，第758行，在呼叫中返回self.k1（X，Y）*self.k2（X，Y）文件“/usr/local/lib/python3.6/site packages/sklearn/gaussian_process/kernels.py”，第1215行，在调用中 metric='sqeuclidean'）文件“/usr/local/lib/python3.6/site packages/scipy/space/distance.py”，第2373行，在cdist中 raise VALUERROR（'XA和XB必须具有相同的列数'VALUERROR:XA和XB必须具有相同的列数（即。特征尺寸。）

我只是简单地复制粘贴了一个代码，然后做了一些愚蠢的事情：

X_train, v1 = make_regression()

只是必须删除它。
什么是
xp
、
yp
和
zp
？抱歉，可能不清楚。为了解释我的情况，我对三维空间中的一个组件进行了化学分析。xc、yc、zc是我训练样本上的变量，我知道三维空间中xc、yc、zc位置的化学分析值。xp，yp，zp是相同的，但在数据中我想预测未知的化学分析。所以简而言之，这些是卡特尔坐标，应该链接到化学分析xp，yp，zp和xc，yc，zx是：
类型

X_train, v1 = make_regression()