在正则表达式python中提取特定字符串后的连续字符串

在正则表达式python中提取特定字符串后的连续字符串,python,json,pandas,Python,Json,Pandas,我在pandas dataframe中有一列,其中包含不完整的JSON数组数据。 例如,该列的第一行类似于[{“名称”:“A”,“类型”:“食品”,“服务”:“xyz_abc”},{“名称”:“B”,“类型”:“饮料”,“服务”:“pqr_ghi”},{“名称”:“C”,“类型” 我想提取数据中服务后给出的值xyz_abc和pqr_ghi。 如何在python中使用regex实现这一点?import-re df['service']=df['col'].apply(lambda x:re.fin

我在pandas dataframe中有一列,其中包含不完整的JSON数组数据。 例如,该列的第一行类似于[{“名称”:“A”,“类型”:“食品”,“服务”:“xyz_abc”},{“名称”:“B”,“类型”:“饮料”,“服务”:“pqr_ghi”},{“名称”:“C”,“类型”

我想提取数据中服务后给出的值xyz_abcpqr_ghi。 如何在python中使用regex实现这一点?

import-re

df['service']=df['col'].apply(lambda x:re.findall(r')(?如果它是json格式的,那么你可以尝试
df['column_name'])。apply(lambda x:[y['service']代表y in x])
如果它的类型是
string
,那么这段代码会抛出一个错误,即“饮料”后面的单引号打字错误?还有,你有没有试过/研究过一些可以包含在问题中的东西?
print(df)

                                                 col             service
0  [{"name":"A","type":"Food","service":"xyz_abc"...  [xyz_abc, pqr_ghi]