Python 熊猫：处理缺失数据（缺失字段）_Python_Csv_Pandas_Data Cleaning

Python 熊猫：处理缺失数据（缺失字段）

python csv pandas

Python 熊猫：处理缺失数据（缺失字段）,python,csv,pandas,data-cleaning,Python,Csv,Pandas,Data Cleaning,这是我正在处理的数据 14922KMSP MSP2006020712081808 0.138 D 0.083 D 346 3 349 4 30L60+ 14922KMSP MSP2006020712091809 0.127 D 0.089 D 357 3 24 4 30L60+ 14922KMSP MSP

这是我正在处理的数据

14922KMSP MSP2006020712081808   0.138 D                 0.083 D     346     3   349    4    30L60+              
14922KMSP MSP2006020712091809   0.127 D                 0.089 D     357     3    24    4    30L60+              
14922KMSP MSP2006020712101810   0.123 D                 0.088 D     353     3   342    4    30L60+              
14922KMSP MSP2006020712111811   0.119 D                  M    M     344     3   329    4    30L60+              
14922KMSP MSP2006020712121812   0.120 D                  M    M     329     3   280    3    30L60+              
14922KMSP MSP2006020712131813   0.118 D                  M    M     341     2     6    2    30L60+              
14922KMSP MSP2006020712331833   0.123 D                  M    M     359     4   338    5    30L60+              
14922KMSP MSP2006020712341834   0.122 D                  M    M     339     4   346    4    30L60+              
14922KMSP MSP2006020712351835   0.121 D                80000.00       346     3   321    3    30L60+            
14922KMSP MSP2006020712361836   0.118 D                10001.00         5     3     8    4    30L60+

前几个是正确的

对于有问题的数据，如

14922KMSP MSP2006020712111811   0.119 D                  M    M     344     3   329    4    30L60+

这仍然很容易处理，因为列是有序的

要不是

14922KMSP MSP2006020712361836   0.118 D                10001.00         5     3     8    4    30L60+

10001.00

之后缺少一个字段，该如何处理

如果我这样做

df = pd.read_csv("MSP/out.dat", skipinitialspace=True, error_bad_lines=False, sep=' ',
                names = ['stationID','date','vis','day_type','vis2','day_type2','dir','speed','dir_max','speed_max','unknown','unknown2'])

缺少字段后的数据将全部向左移动1列，有人能告诉我如何处理这种情况吗

谢谢

你的列分隔符真的只有一个空格吗？@DYZ，不，有时有几个空格。那么

read\u csv

和

sep=''

怎么能工作呢？这真的是你读取文件的方式吗？@DYZ有

skipinitialspace=True

用于转义额外的空间。这就是为什么我问你是否知道一种模式。我会将该模式应用于每一行，以“规范化”数据，然后将其传递给

read\u csv

Pandas

支持处理丢失的数据，但不一定是放错了位置的数据。您的列分隔符真的只有一个空格吗？@DYZ，不，有时有几个空格。那么

read_csv

与

sep='

一起工作怎么可能？这真的是你读取文件的方式吗？@DYZ有

skipinitialspace=True

用于转义额外的空间。这就是为什么我问你是否知道一种模式。我会将该模式应用于每一行，以“规范化”数据，然后将其传递给

read\u csv

Pandas

支持处理丢失的数据，但不一定是放错位置的数据。