Python 我们如何将显式测试数据和训练数据提供给支持向量机，而不是使用训练测试分割函数？_Python_Scikit Learn_Svm

Python 我们如何将显式测试数据和训练数据提供给支持向量机，而不是使用训练测试分割函数？

python scikit-learn

Python 我们如何将显式测试数据和训练数据提供给支持向量机，而不是使用训练测试分割函数？,python,scikit-learn,svm,Python,Scikit Learn,Svm,我计划将测试和训练数据集显式地提供给算法，而不是使用train_test_split方法将数据随机分为test和train 我希望在测试和培训模型时，将评论和标签数据保存在同一个文件中你们谁能给我推荐一下同样的我的代码： Test.txt Train.txt：你想干什么就干什么。解决方案非常简单： X_train = reviews_tokens[:number_of_rows_of_train_data] X_test = reviews_tokens[number_of_rows_of

我计划将测试和训练数据集显式地提供给算法，而不是使用train_test_split方法将数据随机分为test和train

我希望在测试和培训模型时，将评论和标签数据保存在同一个文件中

你们谁能给我推荐一下同样的

我的代码： Test.txt Train.txt：

你想干什么就干什么。解决方案非常简单：

X_train = reviews_tokens[:number_of_rows_of_train_data]
X_test = reviews_tokens[number_of_rows_of_train_data:]

对y_训练和y_测试也要这样做

当然，您需要知道文件中的哪些行用于培训，哪些行用于测试

如果要将要素和标签保留在同一个文件中，这没有问题。您将需要另外一个步骤来将标签与要素分开。和熊猫在一起会容易得多

编辑

有了您提供的文件，您可以像这样得到您想要的：

def load_data(filename):

    X = list()
    y = list()
    with open(filename) as file:
        file.readline()
        for line in file:
            line = line.strip().split(',')
            y.append(line[1])
            X.append(line[0].split())

    return X, y

X_train, y_train = load_data('train.txt')
X_test, y_test = load_data('test.txt')

实际上，我的训练数据是amazon数据集，而我的测试数据是不同的。这不是亚马逊的数据。因此，我必须提供两个单独的文件用于测试和培训。“我们怎么能做到这一点？”不可避免地一步一步地。1-加载训练数据集。两列火车。3-负载测试数据集。4-测试。您已经用代码完成了所有这些步骤，只需根据您的需要对其进行少量修改。实际上，这里我使用了一个数据集，我将其中的数据分别拆分为test和tain。此要求不同。但在我的另一个需求中，我有两个数据集，一个用于测试数据，另一个用于培训data@Inevitable这些变体之间没有实际差异。这只是如何存储数据的问题。不是你怎么用的。你能提供到你的数据集或它们的例子的链接吗？嗨@Poolka，请找到编辑过的test.txt和train.txt文件

review,label
The picture is clear and beautiful,positive
Picture is not clear,negative

X_train = reviews_tokens[:number_of_rows_of_train_data]
X_test = reviews_tokens[number_of_rows_of_train_data:]

def load_data(filename):

    X = list()
    y = list()
    with open(filename) as file:
        file.readline()
        for line in file:
            line = line.strip().split(',')
            y.append(line[1])
            X.append(line[0].split())

    return X, y

X_train, y_train = load_data('train.txt')
X_test, y_test = load_data('test.txt')