Python 使用pandas转换列并组织非结构化csv文件_Python_Pandas

Python 使用pandas转换列并组织非结构化csv文件

python pandas

Python 使用pandas转换列并组织非结构化csv文件,python,pandas,Python,Pandas,我有太多乱七八糟的csv文件，我正试图从中提取信息。每个文件的开头都有随机数目的不必要的列。然而，我感兴趣的列总是有相同的索引。让我通过一个例子解释一下： RandomInfo XX Random2 ZZ Random3 VV Random4 KK Companyname: Apple VisitsMay ImpressionsMay VisitsApril ImpressionsApril... Information

我有太多乱七八糟的csv文件，我正试图从中提取信息。每个文件的开头都有随机数目的不必要的列。然而，我感兴趣的列总是有相同的索引。让我通过一个例子解释一下：

RandomInfo XX
Random2    ZZ
Random3    VV
Random4    KK

Companyname:      Apple
                  VisitsMay  ImpressionsMay VisitsApril ImpressionsApril...
Information         
   International    100         250            90          260  
   Local            10          22             12          26
   With Proxy       5           12             8           16

我想将其转换为：

Companyname  Month                 International    Local With Proxy
Apple        VistsMay               100             10      5
Apple        ImpressionsMay         250             22      12
Apple        VisitsApril            90              12      8
Apple        ImpressionsApril       260             26      16

第一个是txt文件还是熊猫数据框的表示形式？它也是熊猫数据框，您如何构建它？我的意思是，不是一个表，上面的那些随机的东西不适合下面的表。这就是问题所在，我可以说跳过一些列，但我不知道每次需要跳过多少列……啊，好的。因此，您发布的不是pandas数据框，而是应转换为pandas数据框的txt文件的内容。第一个文件是txt文件还是pandas数据框的表示形式？它也是pandas数据框，您如何构建它？我的意思是，不是一个表，上面的那些随机的东西不适合下面的表。这就是问题所在，我可以说跳过一些列，但我不知道每次需要跳过多少列……啊，好的。因此，您发布的不是熊猫数据帧，而是txt文件的内容，该文件应转换为熊猫数据帧。