Python 如何解决这个问题；不能被视为有效的集合"；_Python_Django_Scikit Learn

Python 如何解决这个问题；不能被视为有效的集合"；

python django scikit-learn

Python 如何解决这个问题；不能被视为有效的集合"；,python,django,scikit-learn,Python,Django,Scikit Learn,我正在运行下面的代码，但我得到一个可能来自这行代码的错误 X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=random_state, test_size=test_size) 我在这个平台上发现了类似的问题，但提供的解决方案与我的问题不符。显示的错误是： Singleton array array(0) cannot be considered a valid collection 请帮助我 @pe

我正在运行下面的代码，但我得到一个可能来自这行代码的错误

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=random_state, test_size=test_size)

我在这个平台上发现了类似的问题，但提供的解决方案与我的问题不符。显示的错误是：

Singleton array array(0) cannot be considered a valid collection

请帮助我

@permission_required('admin.can_add_log_entry')
def upload_file(request):
    template='upload_file.html'
    if request.method == 'GET':
        return render(request, template)
    CSV_file=request.FILES['csv_file']
    if not CSV_file.name.endswith('.csv'):
        messages.error(request, 'This is not a CSV file')
        # return HttpResponseRedirect(reverse('add_pull_requests'))
    data_set=CSV_file.read().decode('UTF-8')
    io_string=StringIO(data_set)
    next(io_string)
    dataset=csv.reader(io_string, skipinitialspace=True, delimiter=',')
    csv_list=list(dataset)

    # prediction_dataset=[]
    for row in csv_list:
        if row[11]=='Non-Reopened':
            row[11]=0
        else:
            row[11] = 1
        if row[9]=='Rejected':
            row[9]=0
        else:
            row[9]=1
    prediction_dataset = [row[3], row[4], row[5], row[6], row[7], row[8], row[9], row[10]]
    X = [prediction_dataset]
    y = row[11]
    print(X)
    print(y)
    test_size = 0.2
    random_state = 5
    clf = tree.DecisionTreeClassifier()
    X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=random_state, test_size=test_size)
    # clf = tree.DecisionTreeClassifier()
    clf = clf.fit(X_train, y_train)
    # y_pred = clf.predict(X_test)

    print(accuracy= accuracy_score(y_test,y_pred)*100)


    return render(request, template,{"csv_list": csv_list})

我首先解决了这个问题，

import pandas as pd

，然后替换这行代码

dataset=csv.reader（io\u字符串，skipinitialspace=True，delimiter='，'）

dataset=pd.read\u csv（csv\u文件）

。因此，它现在正在发挥作用

谢谢

显示错误的完整堆栈跟踪。问题似乎出在

X=[prediction\u dataset]

中。你认为这里发生了什么？执行打印（X）和打印（y）时会得到什么？单例数组（0）不能被视为有效集合。这就是我得到的错误。很抱歉，忘记显示错误的完整堆栈跟踪。@Vivek Kumar，请问有什么进展吗？@Vivek Kumar，y是我的数据集预测的目标列，X是我的数据集剩余列的列表。因此，打印这两个列表只是为了确保它们不是空的。

prediction\u数据集

是在for循环之外分配的。因此将只包含一个条目（for循环中的最后一个条目）。您使用它生成X，因此

只有一个样本。您不能在单行上执行

列车测试\u拆分

。