在Python中使用机器学习加载自定义数据集?

在Python中使用机器学习加载自定义数据集?,python,machine-learning,scikit-learn,machine-learning-model,Python,Machine Learning,Scikit Learn,Machine Learning Model,问题是: 它需要2个变量输入,并预测结果 例如:价格和成交量作为输入和作为结果的买卖决定 我尝试使用K-neights实现此功能,但没有成功。你会怎么做 X = cleanedData['ES1 End Price'] #only accounts for 1 variable, don't know how to use input another. y = cleanedData["Result"] print(X.shape, y.shape) kmm = KNeighborsClass

问题是: 它需要2个变量输入,并预测结果

例如
价格
成交量
作为输入和作为
结果的买卖决定

我尝试使用
K-neights
实现此功能,但没有成功。你会怎么做

X = cleanedData['ES1 End Price'] #only accounts for 1 variable, don't know how to use input another. 
y = cleanedData["Result"]
print(X.shape, y.shape)
kmm = KNeighborsClassifier(n_neighbors = 5)
kmm.fit(X,y) #ValueError for size inconsistency, but both are same size. 

谢谢

X
需要是一个,其中每列代表一个功能,这在代码中似乎不正确,请尝试使用
X[:,无]
X
重塑为二维:

kmm.fit(X[:,None], y)

或者在不采用重塑的情况下,最好始终使用列表从数据帧中提取特征:

X = cleanedData[['ES1 End Price']]
或具有多个列:

X = cleanedData[['ES1 End Price', 'volume']]
那么X将是一个2d数组,可以直接用于
fit

kmm.fit(X, y)

请给出
cleanedData
的定义,问题是自定义数据,还是如何从分类器中获取预测?这是相同的原始计数?有什么错误?大家好,我正在声明excel文件中的cleanedData。我想知道我将如何使用两个变量作为输入:即,如何声明它们。
cleanedData
的类型是什么?它是数据帧吗?如果是这样,那么您可以在其中传递列名列表以访问它们。这有助于避免错误,但我想知道如何将X声明为两列。到目前为止,我所拥有的只是X=cleanedData['ES1 End Price'],但我还需要包括数量。有什么想法吗?如果你有一个数据框,你可以做
cleanedData[['ES1 End Price','volume']]]
,而且这次不需要重塑。感谢你的回复-刚刚实现了上面的建议,但是现在我得到了一个TypeError:unhable type,在kmm.fit(X[:,None],y)行上。建议?