Python 在pandas中解析文本文件
我正试图以我通常使用Pandas的方式读取文本文件,但出于某种原因,整行都被作为一列读取:Python 在pandas中解析文本文件,python,pandas,Python,Pandas,我正试图以我通常使用Pandas的方式读取文本文件,但出于某种原因,整行都被作为一列读取: import pandas as pd from StringIO import StringIO a=''' TRE-G3T- Triumph- 0.000 11/06/2013 313585.10 1765.00000 11/06/2013 313600.10 41 20 54.57907 -70 38 14.25924 -30.400 -1.379 8
import pandas as pd
from StringIO import StringIO
a='''
TRE-G3T- Triumph- 0.000 11/06/2013 313585.10 1765.00000 11/06/2013 313600.10 41 20 54.57907 -70 38 14.25924 -30.400 -1.379 893059.006 2588821.543 2834.294 -19545.615 -45.849 0.985 1.058 3.399 3.694 -15.203 1.099 1.0000 6 6.37 4 0.000 I -0.084 0.086 -0.059 0.000 0.000 0.000 363026.471 4578737.512 -30.400
TRE-G3T- Triumph- 0.000 11/06/2013 313585.20 1765.00000 11/06/2013 313600.20 41 20 54.61145 -70 38 14.22044 -30.332 -1.311 893061.933 2588824.850 2835.196 -19544.617 -45.779 0.944 1.015 3.313 3.592 -15.135 -3.365 1.4883 6 6.35 4 0.001 I 0.833 -0.485 -1.570 0.000 0.000 0.000 363027.391 4578738.493 -30.332
TRE-G3T- Triumph- 0.000 11/06/2013 313585.30 1765.00000 11/06/2013 313600.30 41 20 54.48685 -70 38 14.10862 -29.190 -0.169 893070.589 2588812.325 2837.797 -19548.465 -44.651 0.950 1.017 3.254 3.539 -13.994 -8.197 1.0000 6 5.70 4 0.001 I -0.158 0.003 0.061 0.000 0.000 0.000 363029.917 4578734.602 -29.190
'''
df = pd.read_csv(StringIO(a),delimiter='r\s+')
shape(df)
(3,1)
我相信这很简单,但我一直在看文档和示例,我想不出来 我认为您的
r
放错了位置:您可能需要delimiter=r'\s+'
:^)
(虽然我认为在这种情况下,如果没有r
前缀,它会起作用,但这是一个好习惯。)
您还应该能够使用delim\u whitespace=True
:
>>> df = pd.read_csv(StringIO(a.strip()), delimiter=r"\s+", header=None)
>>> df2 = pd.read_csv(StringIO(a.strip()), delim_whitespace=True, header=None)
>>> df2
0 1 2 3 4 5 6 7 \
0 TRE-G3T- Triumph- 0 11/06/2013 313585.1 1765 11/06/2013 313600.1
1 TRE-G3T- Triumph- 0 11/06/2013 313585.2 1765 11/06/2013 313600.2
2 TRE-G3T- Triumph- 0 11/06/2013 313585.3 1765 11/06/2013 313600.3
8 9 10 11 12 13 14 15 16 17 \
0 41 20 54.57907 -70 38 14.25924 -30.400 -1.379 893059.006 2588821.543
1 41 20 54.61145 -70 38 14.22044 -30.332 -1.311 893061.933 2588824.850
2 41 20 54.48685 -70 38 14.10862 -29.190 -0.169 893070.589 2588812.325
18 19
0 2834.294 -19545.615 ...
1 2835.196 -19544.617 ...
2 2837.797 -19548.465 ...
[3 rows x 42 columns]
吼叫声我不知道我会看这个多久,却看不到那个。