在python中返回字符串中正则表达式的多个匹配项

在python中返回字符串中正则表达式的多个匹配项,python,regex,pandas,Python,Regex,Pandas,我正在尝试提取“>之间包含的所有匹配项,不需要熊猫 df = '<option value="85">APOE</option><option value="636">PICALM1<' reg = '>([A-Z][^<]+)<' print re.findall(reg,df) ['APOE', 'PICALM1'] 无需熊猫 df = '<option value="85">APOE</option>&l

我正在尝试提取“>之间包含的所有匹配项,不需要熊猫

df = '<option value="85">APOE</option><option value="636">PICALM1<'
reg = '>([A-Z][^<]+)<'
print re.findall(reg,df)
['APOE', 'PICALM1']
无需熊猫

df = '<option value="85">APOE</option><option value="636">PICALM1<'
reg = '>([A-Z][^<]+)<'
print re.findall(reg,df)
['APOE', 'PICALM1']
df='APOEPICALM1([A-Z][^
import re
作为pd进口熊猫
df['new_col']=df['old_col'].str.findall(r'>([A-Z][^
import re
作为pd进口熊猫

df['new_col']=df['old_col'].str.findall(r'>([A-Z][^ <代码> Re.Field是你正在寻找的,你可能需要改变你的正则表达式,为什么你不应该用正则表达式来解析XML:你可以考虑使用一个合适的XML或HTML解析器,而不同意@ Emilien,对于HTML,你可能想要使用漂亮的汤,尽管在某些特定的任务中,这可能是多余的。寻找你可能需要改变你的正则表达式,为什么你不应该用正则表达式来解析XML:你可以考虑使用一个合适的XML或HTML解析器,而不同意@ Emilien,对于HTML,你可能想要使用漂亮的汤,尽管在某些特定的任务中,这可能是多余的。谢谢你的全面回答。这比我想象的要容易。我不知道BeautifulSoup,但我一定会去看看!它看起来非常有用。谢谢你的全面回答。这比我想象的要容易。我不知道BeautifulSoup,但我一定会去看看!它看起来非常有用。
import re
import pandas as pd
df['new_col'] =  df['old_col'].str.findall(r'>([A-Z][^<]+)<')