Python 熊猫:处理缺失数据(缺失字段)

Python 熊猫:处理缺失数据(缺失字段),python,csv,pandas,data-cleaning,Python,Csv,Pandas,Data Cleaning,这是我正在处理的数据 14922KMSP MSP2006020712081808 0.138 D 0.083 D 346 3 349 4 30L60+ 14922KMSP MSP2006020712091809 0.127 D 0.089 D 357 3 24 4 30L60+ 14922KMSP MSP

这是我正在处理的数据

14922KMSP MSP2006020712081808   0.138 D                 0.083 D     346     3   349    4    30L60+              
14922KMSP MSP2006020712091809   0.127 D                 0.089 D     357     3    24    4    30L60+              
14922KMSP MSP2006020712101810   0.123 D                 0.088 D     353     3   342    4    30L60+              
14922KMSP MSP2006020712111811   0.119 D                  M    M     344     3   329    4    30L60+              
14922KMSP MSP2006020712121812   0.120 D                  M    M     329     3   280    3    30L60+              
14922KMSP MSP2006020712131813   0.118 D                  M    M     341     2     6    2    30L60+              
14922KMSP MSP2006020712331833   0.123 D                  M    M     359     4   338    5    30L60+              
14922KMSP MSP2006020712341834   0.122 D                  M    M     339     4   346    4    30L60+              
14922KMSP MSP2006020712351835   0.121 D                80000.00       346     3   321    3    30L60+            
14922KMSP MSP2006020712361836   0.118 D                10001.00         5     3     8    4    30L60+
前几个是正确的

对于有问题的数据,如

14922KMSP MSP2006020712111811   0.119 D                  M    M     344     3   329    4    30L60+        
这仍然很容易处理,因为列是有序的

要不是

14922KMSP MSP2006020712361836   0.118 D                10001.00         5     3     8    4    30L60+
10001.00
之后缺少一个字段,该如何处理

如果我这样做

df = pd.read_csv("MSP/out.dat", skipinitialspace=True, error_bad_lines=False, sep=' ',
                names = ['stationID','date','vis','day_type','vis2','day_type2','dir','speed','dir_max','speed_max','unknown','unknown2'])
缺少字段后的数据将全部向左移动1列,有人能告诉我如何处理这种情况吗


谢谢

你的列分隔符真的只有一个空格吗?@DYZ,不,有时有几个空格。那么
read\u csv
sep=''
怎么能工作呢?这真的是你读取文件的方式吗?@DYZ有
skipinitialspace=True
用于转义额外的空间。这就是为什么我问你是否知道一种模式。我会将该模式应用于每一行,以“规范化”数据,然后将其传递给
read\u csv
Pandas
支持处理丢失的数据,但不一定是放错了位置的数据。您的列分隔符真的只有一个空格吗?@DYZ,不,有时有几个空格。那么
read_csv
sep='
一起工作怎么可能?这真的是你读取文件的方式吗?@DYZ有
skipinitialspace=True
用于转义额外的空间。这就是为什么我问你是否知道一种模式。我会将该模式应用于每一行,以“规范化”数据,然后将其传递给
read\u csv
Pandas
支持处理丢失的数据,但不一定是放错位置的数据。