Python Scikit学习支持向量机-输入类型
为什么我开始学习Scikit learn,但我对这些教程中使用的iris date或orlando real estate price不感兴趣。这对我来说没有任何意义。我想使用我自己的日期,但我不知道应该使用什么输入格式 这就是我的代码的外观:Python Scikit学习支持向量机-输入类型,python,scikit-learn,svm,Python,Scikit Learn,Svm,为什么我开始学习Scikit learn,但我对这些教程中使用的iris date或orlando real estate price不感兴趣。这对我来说没有任何意义。我想使用我自己的日期,但我不知道应该使用什么输入格式 这就是我的代码的外观: import matplotlib.pyplot as plt from sklearn import svm clf = svm.SVC(gamma=0.001, C=100) x,y = [[1,2], [2,4]] clf.fit(x,y)
import matplotlib.pyplot as plt
from sklearn import svm
clf = svm.SVC(gamma=0.001, C=100)
x,y = [[1,2], [2,4]]
clf.fit(x,y)
我总是想传达这样的信息:
ValueError:找到的输入变量的数量不一致
样本:[1,2]
我尝试了许多其他格式,如[[1]、[1]]或1,1
我的简单问题是,我必须用巫婆的形式写这个吗
“x,y=[[1,2],[2,4]]”作为我的数据
此外,我如何训练一个模型来进行预测,例如:我在一次比赛中有10支运动队
在我的表格中,我有:
第一队|第二队|结果|位置
所以我想计算一下,如果两支球队互相比赛,谁会赢,但是位置当然是一个因素
我想预测A队是否在主场对阵B队,谁更有可能获胜。如何输入数据: 您输入数据的方式
x
只包含一个样本和两个特征,而y
提供了两个标签
使用此符号可获得两个样本,每个样本具有一个特征:x,y=[[1],[4],[2,4]
或者,为了让它更明显:
x = [[1],[4]]
y = [2,4]
顺便说一句:鉴于您对Scikit还不熟悉,您肯定应该尝试对阵列进行同样的学习
分类:
如果你想预测谁获胜,你需要遵循以下几个步骤:
- -分割您的数据,使您的功能(“teamA”、“teamB”和“location”)包含在您的培训数据中,并且结果表示标签,例如:
x = [[teamA1,teamB1,Loc1],[teamA2,teamB2,Loc2],[teamA3,teamB3,Loc3],...]
y = [result1,result2,result3,...]
- -与以前一样适合您的型号
- -根据您的测试数据进行预测,例如:
x_test = [teamX,teamY,locX] # data for which you want the forecast
clf.predict(x_test) # this returns the estimated result
如何输入数据: 您输入数据的方式
x
只包含一个样本和两个特征,而y
提供了两个标签
使用此符号可获得两个样本,每个样本具有一个特征:x,y=[[1],[4],[2,4]
或者,为了让它更明显:
x = [[1],[4]]
y = [2,4]
顺便说一句:鉴于您对Scikit还不熟悉,您肯定应该尝试对阵列进行同样的学习
分类:
如果你想预测谁获胜,你需要遵循以下几个步骤:
- -分割您的数据,使您的功能(“teamA”、“teamB”和“location”)包含在您的培训数据中,并且结果表示标签,例如:
x = [[teamA1,teamB1,Loc1],[teamA2,teamB2,Loc2],[teamA3,teamB3,Loc3],...]
y = [result1,result2,result3,...]
- -与以前一样适合您的型号
- -根据您的测试数据进行预测,例如:
x_test = [teamX,teamY,locX] # data for which you want the forecast
clf.predict(x_test) # this returns the estimated result
好的,这很有效,谢谢。但有没有一种方法可以解决ad 2或更多的功能?你说的解决方案是什么意思?你想根据这些数据做出预测吗?顺便说一句:如果有帮助,请随时接受我的回答;-)例如:我有10个运动队在一个乐团。在我的表格中,我有:1队| 2队|结果|位置。所以我想知道如果两支球队互相比赛谁会赢,但是位置当然是一个因素。请你相应地编辑你的问题,然后我会尝试编辑我的回答谢谢你。这给了我:NameError:name'teamA1'没有定义好了,这很有效,谢谢。但有没有一种方法可以解决ad 2或更多的功能?你说的解决方案是什么意思?你想根据这些数据做出预测吗?顺便说一句:如果有帮助,请随时接受我的回答;-)例如:我有10个运动队在一个乐团。在我的表格中,我有:1队| 2队|结果|位置。所以我想知道如果两支球队互相比赛谁会赢,但是位置当然是一个因素。请你相应地编辑你的问题,然后我会尝试编辑我的回答谢谢你。这给了我:name错误:未定义名称“teamA1”