Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/shell/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 我们如何将显式测试数据和训练数据提供给支持向量机,而不是使用训练测试分割函数?_Python_Scikit Learn_Svm - Fatal编程技术网

Python 我们如何将显式测试数据和训练数据提供给支持向量机,而不是使用训练测试分割函数?

Python 我们如何将显式测试数据和训练数据提供给支持向量机,而不是使用训练测试分割函数?,python,scikit-learn,svm,Python,Scikit Learn,Svm,我计划将测试和训练数据集显式地提供给算法,而不是使用train_test_split方法将数据随机分为test和train 我希望在测试和培训模型时,将评论和标签数据保存在同一个文件中 你们谁能给我推荐一下同样的 我的代码: Test.txt Train.txt: 你想干什么就干什么。解决方案非常简单: X_train = reviews_tokens[:number_of_rows_of_train_data] X_test = reviews_tokens[number_of_rows_of

我计划将测试和训练数据集显式地提供给算法,而不是使用train_test_split方法将数据随机分为test和train

我希望在测试和培训模型时,将评论和标签数据保存在同一个文件中

你们谁能给我推荐一下同样的

我的代码: Test.txt Train.txt:
你想干什么就干什么。解决方案非常简单:

X_train = reviews_tokens[:number_of_rows_of_train_data]
X_test = reviews_tokens[number_of_rows_of_train_data:]
对y_训练和y_测试也要这样做

当然,您需要知道文件中的哪些行用于培训,哪些行用于测试

如果要将要素和标签保留在同一个文件中,这没有问题。您将需要另外一个步骤来将标签与要素分开。和熊猫在一起会容易得多

编辑

有了您提供的文件,您可以像这样得到您想要的:

def load_data(filename):

    X = list()
    y = list()
    with open(filename) as file:
        file.readline()
        for line in file:
            line = line.strip().split(',')
            y.append(line[1])
            X.append(line[0].split())

    return X, y

X_train, y_train = load_data('train.txt')
X_test, y_test = load_data('test.txt')

实际上,我的训练数据是amazon数据集,而我的测试数据是不同的。这不是亚马逊的数据。因此,我必须提供两个单独的文件用于测试和培训。“我们怎么能做到这一点?”不可避免地一步一步地。1-加载训练数据集。两列火车。3-负载测试数据集。4-测试。您已经用代码完成了所有这些步骤,只需根据您的需要对其进行少量修改。实际上,这里我使用了一个数据集,我将其中的数据分别拆分为test和tain。此要求不同。但在我的另一个需求中,我有两个数据集,一个用于测试数据,另一个用于培训data@Inevitable这些变体之间没有实际差异。这只是如何存储数据的问题。不是你怎么用的。你能提供到你的数据集或它们的例子的链接吗?嗨@Poolka,请找到编辑过的test.txt和train.txt文件
review,label
The picture is clear and beautiful,positive
Picture is not clear,negative
X_train = reviews_tokens[:number_of_rows_of_train_data]
X_test = reviews_tokens[number_of_rows_of_train_data:]
def load_data(filename):

    X = list()
    y = list()
    with open(filename) as file:
        file.readline()
        for line in file:
            line = line.strip().split(',')
            y.append(line[1])
            X.append(line[0].split())

    return X, y

X_train, y_train = load_data('train.txt')
X_test, y_test = load_data('test.txt')