Amazon web services TSV作为sagemaker的输入

Amazon web services TSV作为sagemaker的输入,amazon-web-services,amazon-sagemaker,Amazon Web Services,Amazon Sagemaker,有没有办法用tsv代替csv作为sagemaker自动驾驶仪的输入 目前我输入的数据如下: input_data_config = [{ 'DataSource': { 'S3DataSource': { 'S3DataType': 'S3Prefix', 'S3Uri': 's3://{}/{}/train'.format(bucket,prefix) } }, 'TargetAttri

有没有办法用tsv代替csv作为sagemaker自动驾驶仪的输入

目前我输入的数据如下:

input_data_config = [{
      'DataSource': {
        'S3DataSource': {
          'S3DataType': 'S3Prefix',
          'S3Uri': 's3://{}/{}/train'.format(bucket,prefix)
        }
      },
      'TargetAttributeName': 'sentiment'
    }
  ]

对于.csv文件,这似乎可以使用该文件,但对于我的.tsv文件,则无法使用该文件。

我是AWS SageMaker的开发人员。自动驾驶仪目前只支持CSV数据。我们正在努力将支持扩展到更多的文件格式:JSON、TSV等,您可以尝试将.TSV文件转换为.csv:

import csv

# read tab-delimited file
with open('yourfile.tsv','rb') as fin:
    cr = csv.reader(fin, delimiter='\t')
    filecontents = [line for line in cr]

# write comma-delimited file (comma is the default delimiter)
with open('yourfile.csv','wb') as fou:
    cw = csv.writer(fou, quotechar='', quoting=csv.QUOTE_NONE)
    cw.writerows(filecontents)
希望这有帮助


参考:

是否可以使用报价的CSV?这里的问题是,我的输入数据(文本)包含一堆