Python 如何读取csv文件,该文件开头缺少数据
我正在尝试格式化meteo.gr网站上的一些天气数据 到目前为止一切都很好Python 如何读取csv文件,该文件开头缺少数据,python,csv,pandas,Python,Csv,Pandas,我正在尝试格式化meteo.gr网站上的一些天气数据 到目前为止一切都很好 我可以过滤掉标题 并删除空文件 如下所示的问题是,如果数据文件缺少初始列中除日期(最左边的列)以外的所有数据,pandas会将其作为单列数据帧读取 在您询问之前…pd.read\u csv(“…”,delim\u whitespace=1))) 同时 我希望我们不要跳过任何一行。如果不行,我会设法的 亲爱的成员们,我们如何解决问题? 1 2 3 4 5 18.5 22.5 3:30p
pd.read\u csv(“…”,delim\u whitespace=1))
)
同时
我希望我们不要跳过任何一行。如果不行,我会设法的
亲爱的成员们,我们如何解决问题?
1
2
3
4
5 18.5 22.5 3:30p 13.9 5:40a 1.1 1.2 0.0 7.1 35.4 4:00p W
6 20.6 22.1 12:40p 16.7 12:40a 0.1 2.4 0.0 19.0 54.7 5:50p S
7 20.9 22.2 1:40p 20.1 7:00a 0.0 2.6 0.0 22.9 53.1 10:50a S
8 19.7 21.7 7:00a 16.8 10:10a 0.1 1.4 16.2 11.1 56.3 4:10a S
9 18.6 22.2 1:00p 14.6 7:00a 0.8 1.1 0.0 12.1 56.3 3:30p W
10 20.8 23.2 10:50a 15.7 12:30a 0.2 2.7 0.0 25.7 69.2 10:10a S
11 20.2 22.2 12:40a 17.7 7:30a 0.0 1.9 0.0 11.6 54.7 12:30a W
12 17.9 20.1 1:20p 14.6 11:00p 0.8 0.3 1.6 6.9 38.6 2:20p NW
13 16.9 19.7 12:10p 13.8 2:50a 1.7 0.2 0.0 9.0 30.6 2:10p WNW
14 16.8 18.4 1:30p 15.8 4:30a 1.6 0.0 0.0 14.5 48.3 3:50p NW
15 16.8 19.3 2:20p 14.6 11:50p 1.7 0.1 0.0 6.0 30.6 12:10a NNW
16 18.6 20.8 12:20p 14.7 12:10a 0.3 0.6 0.0 15.1 45.1 2:20p NW
17 18.6 21.8 2:30p 16.6 3:50a 0.6 0.8 0.0 9.2 29.0 12:30p NW
18 18.9 21.6 11:40a 16.9 1:30a 0.3 0.9 0.0 13.8 38.6 10:50a NW
19 18.2 19.4 11:10a 17.3 11:30p 0.3 0.2 0.0 14.5 45.1 3:10p NNW
20 18.9 21.3 2:10p 17.4 12:30a 0.2 0.8 0.0 12.7 51.5 5:10a NW
21 18.9 21.4 2:00p 17.2 12:00m 0.2 0.8 0.0 10.5 37.0 2:50p NNW
22 17.9 20.6 3:20p 14.3 12:00m 0.9 0.5 0.0 8.4 25.7 12:30a WNW
23 15.7 18.4 2:10p 12.6 7:00a 2.7 0.0 0.0 6.3 20.9 5:20a W
24 16.2 18.8 1:20p 13.3 7:50a 2.2 0.1 0.0 6.8 19.3 3:10a W
25 16.7 18.8 10:10a 13.6 6:50a 1.7 0.1 0.4 8.7 25.7 1:50p WNW
26 16.9 20.2 1:10p 14.1 10:50p 1.6 0.2 0.0 6.9 29.0 2:20p NW
27 15.8 19.1 2:30p 12.4 7:10a 2.6 0.1 0.0 7.2 22.5 5:00a W
28 16.8 20.5 12:40p 13.3 6:40a 1.9 0.4 0.0 6.0 19.3 5:10a W
29 17.8 21.4 11:20a 14.1 5:50a 1.3 0.7 0.0 5.5 20.9 6:40p W
30 17.2 19.6 10:50a 14.6 11:50p 1.4 0.3 0.0 5.3 17.7 2:50p W
跳过行的错误似乎没有什么价值问题是:在1000个左右的文件中。缺少的数据从另一行开始。如何确保正确读取文件。您可以迭代读取每一行,直到解析出超过1列,然后将其余行视为有效数据。有时,有2列而不是1列。在这种情况下,应该有13个。13并不总是列数。它的脏数据没有从源中填充NAN跳过行的错误似乎没有什么价值问题是:在1000个左右的文件中。缺少的数据从另一行开始。如何确保正确读取文件。您可以迭代读取每一行,直到解析出超过1列,然后将其余行视为有效数据。有时,有2列而不是1列。在这种情况下,应该有13个。13并不总是列数。它因站点而异。它的脏数据未填充源中的NAN