Python 在重复的行中重复添加新数据1-1-n
我不知道如何确切地解释。但让我们来看一个例子:Python 在重复的行中重复添加新数据1-1-n,python,pandas,Python,Pandas,我不知道如何确切地解释。但让我们来看一个例子: 我有这本字典 dictData = {'movie_id':[11,12,13],'title':['filmA','filmB','filmC']} dictFilm = {'filmA': ['pathA1\\ImageA1.jpg','pathA2\\ImageA2.jpg'], 'filmB': ['pathB1\\ImageB1.jpg','pathB2\\ImageB2.jpg'], 'f
我有这本字典
dictData = {'movie_id':[11,12,13],'title':['filmA','filmB','filmC']}
dictFilm = {'filmA': ['pathA1\\ImageA1.jpg','pathA2\\ImageA2.jpg'],
'filmB': ['pathB1\\ImageB1.jpg','pathB2\\ImageB2.jpg'],
'filmC':['pathC1\\ImageC1.png','']}
从这些,我将得到一个新的数据
dfData = pd.DataFrame.from_dict(dictData)
dfFilm = pd.DataFrame.from_dict(dictFilm)
to_image_df = pd.DataFrame.from_dict({})
for i, row in dfFilm.iterrows():
to_image_df.at[i,'movie_id'] = int(dfData.at[i,'movie_id'])
to_image_df.at[i,'name'] = dfData.at[i,'title']
to_image_df.at[i,'path'] = dfFilm.at[i,'filmB']
print(to_image_df.head())
这给了我一个结果:
movie_id name path
0 11.0 filmA pathB1\B1.jpg
1 12.0 filmB pathB2\ImageB2.jpg
但我想要这样的结果:
movie_id name path
0 11.0 filmA pathA1\\ImageA1.jpg
1 11.0 filmA pathA2\\ImageA2.jpg
2 12.0 filmB pathB2\ImageB1.jpg
3 12.0 filmB pathB2\ImageB2.jpg
4 13.0 filmC pathC1\ImageC1.png
映射
并展平/展开
df = pd.DataFrame(dictData)
v = df.title.map(dictFilm)
df = (pd.DataFrame(df.values.repeat(v.str.len(), axis=0), columns=df.columns)
.assign(path=list(chain.from_iterable(v)))
.replace('', np.nan)
.dropna(subset=['path']))
df
movie_id title path
0 11 filmA pathA1\ImageA1.jpg
1 11 filmA pathA2\ImageA2.jpg
2 12 filmB pathB1\ImageB1.jpg
3 12 filmB pathB2\ImageB2.jpg
4 13 filmC pathC1\ImageC1.png
使用
melt
和merge
dfFilm = dfFilm.melt().loc[lambda x : x['value']!='']
df = dfData.merge(dfFilm,left_on='title',right_on='variable',how='right').drop('variable',1)
df
Out[277]:
movie_id title value
0 11 filmA pathA1\ImageA1.jpg
1 11 filmA pathA2\ImageA2.jpg
2 12 filmB pathB1\ImageB1.jpg
3 12 filmB pathB2\ImageB2.jpg
4 13 filmC pathC1\ImageC1.png