Scikit learn 如何使用scikit learn指定随机林分类器中输入和输出数据的格式
我已经使用python和scikit构建了一个随机林分类器,学习从各种大小属性预测“页面”值,我想指定输入和输出数据的格式。我想从csv文件中输入数据,并将输出数据保存在json文件中。我已附上csv文件中数据的图像: 我想使用'size2'、'size3'、'size4'列中的值作为输入,并将该值作为json文件以以下格式输出:Scikit learn 如何使用scikit learn指定随机林分类器中输入和输出数据的格式,scikit-learn,random-forest,Scikit Learn,Random Forest,我已经使用python和scikit构建了一个随机林分类器,学习从各种大小属性预测“页面”值,我想指定输入和输出数据的格式。我想从csv文件中输入数据,并将输出数据保存在json文件中。我已附上csv文件中数据的图像: 我想使用'size2'、'size3'、'size4'列中的值作为输入,并将该值作为json文件以以下格式输出: { seconds: #the seconds value for those size values, value: pages, untitled:
{
seconds: #the seconds value for those size values,
value: pages,
untitled: "untitled"
}
我相信我的模型现在只输出预测的“页面”值。非常感谢你的帮助!
我已经附上我的随机森林分类器的一些代码,谢谢
X = dataset.iloc[:, 0:50].values
y = dataset["pages"]
from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2,random_state=0)
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)
from sklearn.ensemble import RandomForestClassifier
classifier = RandomForestClassifier(n_estimators=20, random_state = 0)
classifier = classifier.fit(X_train,y_train)
y_pred = classifier.predict(X_test)
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score
你试过什么,你能贴出来吗?什么是无标题的?您还说您只输出“谓词页面”,您可以共享该代码吗?@AO untitled只是行号。我在输入数据时遇到问题,因此我不知道如何查看其输出格式。您需要将数据输入到什么函数?@AO我相信它是分类器。您尝试了什么,可以发布吗?什么是
无标题的?您还说您只输出“谓词页面”,您可以共享该代码吗?@AO untitled只是行号。我在输入数据时遇到问题,因此我不知道如何查看其输出格式。您需要将数据输入到什么函数中?@AO我相信它是分类器。预测