Python 熊猫:处理缺失数据(缺失字段)
这是我正在处理的数据Python 熊猫:处理缺失数据(缺失字段),python,csv,pandas,data-cleaning,Python,Csv,Pandas,Data Cleaning,这是我正在处理的数据 14922KMSP MSP2006020712081808 0.138 D 0.083 D 346 3 349 4 30L60+ 14922KMSP MSP2006020712091809 0.127 D 0.089 D 357 3 24 4 30L60+ 14922KMSP MSP
14922KMSP MSP2006020712081808 0.138 D 0.083 D 346 3 349 4 30L60+
14922KMSP MSP2006020712091809 0.127 D 0.089 D 357 3 24 4 30L60+
14922KMSP MSP2006020712101810 0.123 D 0.088 D 353 3 342 4 30L60+
14922KMSP MSP2006020712111811 0.119 D M M 344 3 329 4 30L60+
14922KMSP MSP2006020712121812 0.120 D M M 329 3 280 3 30L60+
14922KMSP MSP2006020712131813 0.118 D M M 341 2 6 2 30L60+
14922KMSP MSP2006020712331833 0.123 D M M 359 4 338 5 30L60+
14922KMSP MSP2006020712341834 0.122 D M M 339 4 346 4 30L60+
14922KMSP MSP2006020712351835 0.121 D 80000.00 346 3 321 3 30L60+
14922KMSP MSP2006020712361836 0.118 D 10001.00 5 3 8 4 30L60+
前几个是正确的
对于有问题的数据,如
14922KMSP MSP2006020712111811 0.119 D M M 344 3 329 4 30L60+
这仍然很容易处理,因为列是有序的
要不是
14922KMSP MSP2006020712361836 0.118 D 10001.00 5 3 8 4 30L60+
10001.00
之后缺少一个字段,该如何处理
如果我这样做
df = pd.read_csv("MSP/out.dat", skipinitialspace=True, error_bad_lines=False, sep=' ',
names = ['stationID','date','vis','day_type','vis2','day_type2','dir','speed','dir_max','speed_max','unknown','unknown2'])
缺少字段后的数据将全部向左移动1列,有人能告诉我如何处理这种情况吗
谢谢 你的列分隔符真的只有一个空格吗?@DYZ,不,有时有几个空格。那么
read\u csv
和sep=''
怎么能工作呢?这真的是你读取文件的方式吗?@DYZ有skipinitialspace=True
用于转义额外的空间。这就是为什么我问你是否知道一种模式。我会将该模式应用于每一行,以“规范化”数据,然后将其传递给read\u csv
Pandas
支持处理丢失的数据,但不一定是放错了位置的数据。您的列分隔符真的只有一个空格吗?@DYZ,不,有时有几个空格。那么read_csv
与sep='
一起工作怎么可能?这真的是你读取文件的方式吗?@DYZ有skipinitialspace=True
用于转义额外的空间。这就是为什么我问你是否知道一种模式。我会将该模式应用于每一行,以“规范化”数据,然后将其传递给read\u csv
Pandas
支持处理丢失的数据,但不一定是放错位置的数据。