Pandas 如何在熊猫中分割特征
这是我正在研究的培训集的前5个示例。我应该预测该用户对测试集中其他喜剧的评分 这就是测试集的外观,但没有评级: 所以我有几个问题: 1.将笑话标识符分为喜剧演员和地点的最佳方式是什么。例如,克林特·德·杜恩是一名喜剧演员,埃努古1号是一个地点Pandas 如何在熊猫中分割特征,pandas,machine-learning,deep-learning,recommendation-engine,Pandas,Machine Learning,Deep Learning,Recommendation Engine,这是我正在研究的培训集的前5个示例。我应该预测该用户对测试集中其他喜剧的评分 这就是测试集的外观,但没有评级: 所以我有几个问题: 1.将笑话标识符分为喜剧演员和地点的最佳方式是什么。例如,克林特·德·杜恩是一名喜剧演员,埃努古1号是一个地点 在深度学习方面,获得最佳预测精度的最佳方法是什么 多谢各位 Viewers_ID Joke_identifier Response_ID Rating 0 A1 Klint D
Viewers_ID Joke_identifier Response_ID Rating
0 A1 Klint De Drunk Enugu 1 A1_Klint De Drunk Enugu 1 0.11
1 A1 Klint De Drunk Enugu 2 A1_Klint De Drunk Enugu 2 -4.64
2 A1 Klint De Drunk PH 1 A1_Klint De Drunk PH 1 -3.39
3 A1 Klint De Drunk PH 2 A1_Klint De Drunk PH 2 0.44
4 A1 Klint De Drunk Lagos 1 A1_Klint De Drunk Lagos 1 -4.83
5 A1 Klint De Drunk Lagos 2 A1_Klint De Drunk Lagos 2 -4.52
关于第1点:
使用:
但是,您应该为拆分创建一个新列,不要将其重新分配,因为第二个代码不会生成所需的结果。如果需要,您可以删除原始列。我建议您对此提出两个单独的问题#2.正如现在所描述的,这个问题太宽泛了。这个问题与
tensorflow
无关-请不要发送垃圾标签(已删除)。非常感谢。这让我想起了喜剧演员的笑话。但我想把笑话标识符分为喜剧演员和位置。代码的第二行在名为位置的列中拆分位置。它不起作用吗?这给了我Klint De dunk
下的Joke\u identifier\u new
列和location
列中的Enugu 1
df['Joke_identifier_new'] = df['Joke_identifier'].str.rsplit(n=2).str[0]
df['location'] = df['Joke_identifier'].str.rsplit(n=2).str[1:].str.join(' ')
print(df)