用Python编写的csv文件包含错误的数字格式
此脚本读取一个文本文件,对每列每3行取平均值,并将其写入csv文件: 输入文件:用Python编写的csv文件包含错误的数字格式,python,csv,numpy,format,writer,Python,Csv,Numpy,Format,Writer,此脚本读取一个文本文件,对每列每3行取平均值,并将其写入csv文件: 输入文件: 2013-08-29T15:11:18.55912 0.019494552 0.110042184 0.164076427 0.587849877 2013-08-29T15:11:18.65912 0.036270974 0.097213155 0.122628797 0.556928624 2013-08-29T15:11:18.75912 0.055350041 0.104121094 0.121
2013-08-29T15:11:18.55912 0.019494552 0.110042184 0.164076427 0.587849877
2013-08-29T15:11:18.65912 0.036270974 0.097213155 0.122628797 0.556928624
2013-08-29T15:11:18.75912 0.055350041 0.104121094 0.121641949 0.593113069
2013-08-29T15:11:18.85912 0.057159263 0.107410588 0.198122695 0.591797271
2013-08-29T15:11:18.95912 0.05288292 0.102476346 0.172958062 0.591139372
2013-08-29T15:11:19.05912 0.043507861 0.104121094 0.162102731 0.598376261
2013-08-29T15:11:19.15912 0.068343545 0.102805296 0.168517245 0.587849877
2013-08-29T15:11:19.25912 0.054527668 0.105765841 0.184306818 0.587191978
2013-08-29T15:11:19.35912 0.055678991 0.107739538 0.169997517 0.539165352
脚本:
data = loadtxt('infile.txt', usecols = (1,2,3,4))
with open ('out.csv', 'wb') as outfile:
writer = csv.writer(outfile, delimiter = '\t')
seg_len = 3
for x in range(0, len(data[:,1]), seg_len):
sample_means = ([x/seg_len], [mean(data[x:x+seg_len,i]) for i in range(4)])
bi = list(chain.from_iterable(sample_means))
writer.writerow ((', '.join(map(repr, bi))))
输出CSVfile:
0 0.037038... 0.10379... ...
1 0.051183... 0.10466... ...
2 00059516... 0.10543... ...
但是当我打开csv文件和sum列时,它给出了零!似乎它们不是数字。我直接从CSV文件复制,它看起来像这样:
"0 " " 0 . 0 3 7 0 3 8 5 2 2 3 3 3 3 3 3 3 3 " " 0 . 1 0 3 7 9 2 1 4 4 3 3 3 3 3 3 3 2 "
"1 " " 0 . 0 5 1 1 8 3 3 4 7 9 9 9 9 9 9 9 9 7 " " 0 . 1 0 4 6 6 9 3 4 2 6 6 6 6 6 6 6 6 "
"2 " " 0 . 0 5 9 5 1 6 7 3 4 6 6 6 6 6 6 6 6 1 " " 0 . 1 0 5 4 3 6 8 9 1 6 6 6 6 6 6 6 6 "
有人能建议如何解决这个问题吗?您的部分问题是
writerow
需要一个iterable值。您给它一个字符串(输出为“”,”.join
),因此字符串中的每个字母都会写入到文件中一个分隔的字段中。如果您将bi
直接传递给writerow,它至少应该解决该特定问题。部分问题在于writerow
需要一个可数的值。您给它一个字符串(输出为“”,”.join
),因此字符串中的每个字母都会写入到文件中一个分隔的字段中。如果您将bi直接传递给writerow,它至少可以解决这个特定的问题。也许您正在寻找这个
sample_means = [x/seg_len] + [mean(data[x:x+seg_len,i]) for i in range(4)]
writer.writerow(sample_means)
也许你在找这个
sample_means = [x/seg_len] + [mean(data[x:x+seg_len,i]) for i in range(4)]
writer.writerow(sample_means)
要澄清的是,“输出CSV”下的部分是您所期望的,而下面的部分是您所得到的吗?输出文件正好显示了我所期望的。但正如我所说,它们看起来就像数字,但你不能求和,平均。。。它们应该是数字,这样我就可以进行统计分析。下面的一个从csv单元格复制并粘贴到此处。我认为这就是为什么它们不被算作数字,但不知道如何处理的原因。为了澄清,在“输出CSV”下的部分是你所期望的,而下面的部分是你所得到的吗?输出文件正好显示了我所期望的。但正如我所说,它们看起来就像数字,但你不能求和,平均。。。它们应该是数字,这样我就可以进行统计分析。下面的一个从csv单元格复制并粘贴到此处。我认为这就是为什么它们不被算作数字,但不知道如何接近的原因。它是,但写了两个单独的列表。我添加了bi以删除括号。也许这不是最好的办法!如果过于复杂,使用
bi
将两个列表的元组展平应该可以。还有一些更简单的方法,比如结构怪人的答案使用的方法。它确实如此,但写了两个单独的列表。我添加了bi以删除括号。也许这不是最好的办法!如果过于复杂,使用bi
将两个列表的元组展平应该可以。还有一些更简单的方法,比如结构怪胎的答案。这会将两个列表一起写在一个单元格中,而我希望它们分别列在不同的列中。不,实际上不是这样。您确定'\t'
是用于打开结果文件的正确分隔符吗?您是对的,删除'\t'解决了问题。非常感谢:)这会将两个列表一起写在一个单元格中,而我希望它们分别列在不同的列中。不,它真的没有。您确定'\t'
是用于打开结果文件的正确分隔符吗?您是对的,删除'\t'解决了问题。非常感谢:)