Scikit learn 如何使用scikit learn指定随机林分类器中输入和输出数据的格式

Scikit learn 如何使用scikit learn指定随机林分类器中输入和输出数据的格式,scikit-learn,random-forest,Scikit Learn,Random Forest,我已经使用python和scikit构建了一个随机林分类器,学习从各种大小属性预测“页面”值,我想指定输入和输出数据的格式。我想从csv文件中输入数据,并将输出数据保存在json文件中。我已附上csv文件中数据的图像: 我想使用'size2'、'size3'、'size4'列中的值作为输入,并将该值作为json文件以以下格式输出: { seconds: #the seconds value for those size values, value: pages, untitled:

我已经使用python和scikit构建了一个随机林分类器,学习从各种大小属性预测“页面”值,我想指定输入和输出数据的格式。我想从csv文件中输入数据,并将输出数据保存在json文件中。我已附上csv文件中数据的图像:

我想使用'size2'、'size3'、'size4'列中的值作为输入,并将该值作为json文件以以下格式输出:

{
  seconds: #the seconds value for those size values,
  value: pages, 
  untitled: "untitled"
}
我相信我的模型现在只输出预测的“页面”值。非常感谢你的帮助! 我已经附上我的随机森林分类器的一些代码,谢谢

 X = dataset.iloc[:, 0:50].values
    y = dataset["pages"]
    from sklearn.model_selection import train_test_split
    X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2,random_state=0)
    from sklearn.preprocessing import StandardScaler
    sc = StandardScaler()
    X_train = sc.fit_transform(X_train)
    X_test = sc.transform(X_test)
    from sklearn.ensemble import RandomForestClassifier
    classifier = RandomForestClassifier(n_estimators=20, random_state = 0)
    classifier = classifier.fit(X_train,y_train)
    y_pred = classifier.predict(X_test)
    from sklearn.metrics import classification_report, confusion_matrix, accuracy_score

你试过什么,你能贴出来吗?什么是无标题的?您还说您只输出“谓词页面”,您可以共享该代码吗?@AO untitled只是行号。我在输入数据时遇到问题,因此我不知道如何查看其输出格式。您需要将数据输入到什么函数?@AO我相信它是分类器。您尝试了什么,可以发布吗?什么是
无标题的
?您还说您只输出“谓词页面”,您可以共享该代码吗?@AO untitled只是行号。我在输入数据时遇到问题,因此我不知道如何查看其输出格式。您需要将数据输入到什么函数中?@AO我相信它是分类器。预测