Python 如何使用正则表达式制作假人?

Python 如何使用正则表达式制作假人?,python,regex,pandas,dataframe,dummy-variable,Python,Regex,Pandas,Dataframe,Dummy Variable,例如,我有一个reviews列,我想提取单词并基于它们创建虚拟变量 我在这里使用它,但不能使用正则表达式: df = df['reviews'].str.contains('good').astype(int) 如何在这里使用正则表达式来提取good、goid、goof等。您可以在.contains方法之后使用.map方法。下面是一个简明的例子: 将熊猫作为pd导入 df=pd.DataFrame({'id':[1,2,3], “评论”:[“这是一个好的评论”, “这是个坏消息”, “这个看起

例如,我有一个reviews列,我想提取单词并基于它们创建虚拟变量

我在这里使用它,但不能使用正则表达式:

df = df['reviews'].str.contains('good').astype(int)

如何在这里使用正则表达式来提取good、goid、goof等。

您可以在.contains方法之后使用.map方法。下面是一个简明的例子:

将熊猫作为pd导入
df=pd.DataFrame({'id':[1,2,3],
“评论”:[“这是一个好的评论”,
“这是个坏消息”,
“这个看起来不错”]})
df['review_good']=df.review.str.contains('good').map({True:1,False:0})

我知道当我命名它并将其放入我的df时,它是虚拟的,但我想使用常规表达式。你可以尝试
df['reviews'].str.extract('(你最喜欢的正则表达式)