Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/352.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 解析从Google表单获取的CSV_Python_Csv_Http - Fatal编程技术网

Python 解析从Google表单获取的CSV

Python 解析从Google表单获取的CSV,python,csv,http,Python,Csv,Http,我正在尝试解析从已发布的Google工作表中获取的CSV数据。 我通过一个简单的http请求获取CSV字符串。 然后尝试用csv python库解析它。 解析器似乎无法识别每行中的列数,但我不知道如何修复它 我试着用同样的代码从磁盘文件中读取csv,效果非常好 导入csv 导入请求 response=requests.get('https://docs.google.com/spreadsheets/d/e/2PACX-1vThbG2jdBjBWpcW0iarJD2TtW6olqygCvuQHR

我正在尝试解析从已发布的Google工作表中获取的CSV数据。 我通过一个简单的http请求获取CSV字符串。 然后尝试用csv python库解析它。 解析器似乎无法识别每行中的列数,但我不知道如何修复它

我试着用同样的代码从磁盘文件中读取csv,效果非常好

导入csv
导入请求
response=requests.get('https://docs.google.com/spreadsheets/d/e/2PACX-1vThbG2jdBjBWpcW0iarJD2TtW6olqygCvuQHRI-fwnLx6jkIFtuyiF7Bm4rEPLo_jpjLmZsr9sYGs8e/pub?output=csv&gid=784986591')
csv_bytestream=response.content.decode()
csv.register_方言('googledialent',delimiter=',',quotechar=','quoteing=csv.QUOTE_最小值)
reader=csv.reader(csv_bytestream,dialogue='googledialogue')
打印(“****非工作代码****”)
打印(csv_ByTestStream)
行数=0
对于读取器中的行:
行数+=1
打印(“行{num}有{nelem}列”。格式(num=str(num_行),nelem=str(len(行)))
打印(行)
打印(“****工作代码****”)
将open('MyFile.csv','r',encoding='utf-8')作为f:
打印(f.read())
将open('MyFile.csv','r',encoding='utf-8')作为f:
reader=csv.reader(f,dialogue='googledialogue')
行数=0
对于读取器中的行:
行数+=1
打印(“行{num}有{nelem}列”。格式(num=str(num_行),nelem=str(len(行)))
打印(行)
我期望从以下两种输出中得到:

Row 1 has 16 columns
['', 'Just insult, here and now!', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
Row 2 has 16 columns
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
...
而我从非工作代码得到的输出如下:

Row 1 has 2 columns
['', '']
Row 2 has 1 columns
['Just insult, here and now!']
Row 3 has 2 columns
['', '']
...
print(csv\u bytestream)
print(f.read())
打印的内容是相同的。
如果我知道怎么做,我会附加csv文件。

问题在于编码!您获取的csv响应具有
ISO-8859-1

 >>> response.encoding
 >>>'ISO-8859-1'
这是一个可行的解决方案,可能会对您有所帮助

response = requests.get('https://docs.google.com/spreadsheets/d/e/2PACX-1vThbG2jdBjBWpcW0iarJD2TtW6olqygCvuQHRI-fwnLx6jkIFtuyiF7Bm4rEPLo_jpjLmZsr9sYGs8e/pub?output=csv&gid=784986591')
csv_bytestream = response.content.decode('utf-8')
cr = csv.reader(csv_bytestream.splitlines(), delimiter=',')
my_list = list(cr)
my_list = list(cr)
for row in my_list:
    print(row)
样本响应:

['', 'Just insult, here and now!', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
['', 'STAGIONE CONTINUA', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
['', 'Rank', 'Adj', 'Player', 'Rating', 'Adj', 'Dist', 'Played', '# Pet', '% Pet/Played', '# Best', '# Worst', '(B-W)%', 'Wins', 'Losses', '']
['', '1', '⇔ (1)', 'JTsuited', '1674', '0', '0', '335', '4', '1,19%', '92', '52', '11,94%', '176', '159', 'HALL OF FAME']
['', '2', '⇔ (2)', 'Nameless', '1662', '2', '12', '293', '7', '2,39%', '74', '43', '10,58%', '171', '122', '']
['', '3', '⇑ (5)', 'Takysis', '1562', '55', '100', '688', '36', '5,23%', '145', '130', '2,18%', '348', '340', '']
['', '4', '⇓ (3)', 'Sfinks', '1528', '-19', '34', '696', '77', '11,06%', '134', '154', '-2,87%', '380', '316', '']
['', '5', '⇓ (4)', 'Neristelrooy', '1522', '-24', '6', '521', '37', '7,10%', '75', '103', '-5,37%', '282', '239', '']
['', '6', '⇔ (6)', 'Starmanzo', '1411', '-4', '111', '450', '24', '5,33%', '92', '78', '3,11%', '210', '240', '']
['', '7', '⇔ (7)', 'Bruno', '1386', '-13', '25', '446', '33', '7,40%', '74', '89', '-3,36%', '214', '232', 'HALL OF SHAME']
['', '8', '⇑ (9)', 'Biru', '1350', '-13', '36', '792', '132', '16,67%', '103', '159', '-7,07%', '414', '378', '']
['', '9', '⇓ (8)', 'Alino', '1340', '-32', '10', '33', '1', '3,03%', '3', '5', '-6,06%', '13', '20', '']
['', '10', '⇑ (12)', 'starpa', '1246', '48', '94', '796', '62', '7,79%', '177', '124', '6,66%', '337', '459', '']
['', '11', '⇓ (10)', 'Praxy', '1237', '0', '9', '223', '35', '15,70%', '30', '46', '-7,17%', '111', '112', '']
['', '12', '⇓ (11)', 'Beatren', '1218', '0', '19', '213', '19', '8,92%', '43', '43', '0,00%', '92', '121', '']
['', '13', '⇔ (13)', 'staratlas', '1169', '0', '49', '75', '9', '12,00%', '6', '22', '-21,33%', '34', '41', '']

问题是您正在向
csv
读取器传递一个字符串。相反,您应该传递一个类似文件的对象或一个interator返回行

您可以选择:

import io
csv_bytestream = io.StringIO(response.content.decode())

请注意,尽管变量
csv_bytestream
并不反映实际的类型,因为在第一种情况下,它将返回文本,而不是字节,在第二种情况下,它将返回行


还请注意,与其使用
response.content.decode()
不如使用
response.text
,因为这将使用响应的编码。

错误与编码无关,问题是它将整个csv传递给读卡器,而您的是先拆分行。”问题是您正在将字符串传递给csv读取器。相反,你应该传递一个像文件一样的对象或一个interator返回行!
csv_bytestream = response.content.decode().splitlines()