Python 使用pandas转换列并组织非结构化csv文件
我有太多乱七八糟的csv文件,我正试图从中提取信息。每个文件的开头都有随机数目的不必要的列。然而,我感兴趣的列总是有相同的索引。让我通过一个例子解释一下:Python 使用pandas转换列并组织非结构化csv文件,python,pandas,Python,Pandas,我有太多乱七八糟的csv文件,我正试图从中提取信息。每个文件的开头都有随机数目的不必要的列。然而,我感兴趣的列总是有相同的索引。让我通过一个例子解释一下: RandomInfo XX Random2 ZZ Random3 VV Random4 KK Companyname: Apple VisitsMay ImpressionsMay VisitsApril ImpressionsApril... Information
RandomInfo XX
Random2 ZZ
Random3 VV
Random4 KK
Companyname: Apple
VisitsMay ImpressionsMay VisitsApril ImpressionsApril...
Information
International 100 250 90 260
Local 10 22 12 26
With Proxy 5 12 8 16
我想将其转换为:
Companyname Month International Local With Proxy
Apple VistsMay 100 10 5
Apple ImpressionsMay 250 22 12
Apple VisitsApril 90 12 8
Apple ImpressionsApril 260 26 16
第一个是txt文件还是熊猫数据框的表示形式?它也是熊猫数据框,您如何构建它?我的意思是,不是一个表,上面的那些随机的东西不适合下面的表。这就是问题所在,我可以说跳过一些列,但我不知道每次需要跳过多少列……啊,好的。因此,您发布的不是pandas数据框,而是应转换为pandas数据框的txt文件的内容。第一个文件是txt文件还是pandas数据框的表示形式?它也是pandas数据框,您如何构建它?我的意思是,不是一个表,上面的那些随机的东西不适合下面的表。这就是问题所在,我可以说跳过一些列,但我不知道每次需要跳过多少列……啊,好的。因此,您发布的不是熊猫数据帧,而是txt文件的内容,该文件应转换为熊猫数据帧。