Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/excel/29.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 基于系列的组合构建熊猫数据框架_Python_Excel_Pandas - Fatal编程技术网

Python 基于系列的组合构建熊猫数据框架

Python 基于系列的组合构建熊猫数据框架,python,excel,pandas,Python,Excel,Pandas,我需要一些关于构建数据框架的建议(免责声明:我正在尝试从ExcelVBA转移到使用Python和Pandas) 一项特殊任务涉及获取字符串ID列表,并在某些列中复制每一行的附加信息。请参阅下表: 第一步 Cat_1 Cat_2 String-ID null null apple null null banana 步骤2(结果) 逻辑: 对于每个字符串ID,应复制字符串ID,以便在类别列中: Ca

我需要一些关于构建数据框架的建议(免责声明:我正在尝试从ExcelVBA转移到使用Python和Pandas)

一项特殊任务涉及获取字符串ID列表,并在某些列中复制每一行的附加信息。请参阅下表:

第一步

    Cat_1    Cat_2    String-ID  
     null     null      apple        
     null     null      banana

步骤2(结果)

逻辑: 对于每个字符串ID,应复制字符串ID,以便在类别列中:

  • Cat_1-A针对每个实例进行填充
  • Cat_2-为每条线路填充AA、AB、AC、AD、AE
因此,对于一个字符串id(或一个水果),总共应该复制5次,以便填充类别列(步骤2)

我尝试将源表导入到数据帧中,然后尝试为步骤2创建嵌套循环,但没有成功

第1类和第2类列可以通过列表或系列添加,因为它们将受到限制且不会更改


有人能帮忙吗?

您可以用所需值的列表填充cat列,然后使用
df.explode

df['Cat_1'] = 'A'
df['Cat_2'] = ['AA', 'AB', 'AC', 'AD', 'AE']
df = df.explode('Cat_2', ignore_index=True)

您一次只能分解一列,但如果您需要Cat_1成为
['a',B']
,那么您可以为
Cat_1添加一个新的分解行

。您好,请使用cose块作为“步骤”,在手机上很难读取。。。另外,我不明白你的转换逻辑,你能详细解释一下吗?@RichieV,抱歉,我已经重新格式化了帖子并添加了逻辑。谢谢@RichieV,我会试试让你知道的。
df['Cat_1'] = 'A'
df['Cat_2'] = ['AA', 'AB', 'AC', 'AD', 'AE']
df = df.explode('Cat_2', ignore_index=True)