PYTHON中标记中的单词提取
你好,我想提取这个标签的内容PYTHON中标记中的单词提取,python,regex,Python,Regex,你好,我想提取这个标签的内容 <Sentiment int=6>Deep injustice</Sentiment> 你可以用 df['text'].str.extractall(r'<(?P<Sentiments>\w+)\s+int=(?P<Intensite>\d+)>(?P<Expression>[^<]*)') df['text'].str.extractall(r'(?P[^是否必须使用正则表达式?对于
<Sentiment int=6>Deep injustice</Sentiment>
你可以用
df['text'].str.extractall(r'<(?P<Sentiments>\w+)\s+int=(?P<Intensite>\d+)>(?P<Expression>[^<]*)')
df['text'].str.extractall(r'(?P[^是否必须使用正则表达式?对于此类操作,DOM操作会更好!您好,您是否可以更清楚地解释一下代码或更多说明。使用XML/DOM解析器会让您受益匪浅。许多不同的编程语言已经多次问到并回答了这一问题。如果您发布您的编程语言,我肯定会有更多问题人们会愿意/能够帮助您。这既不是XML也不是HTML。请尝试.extractall(r')(^P[^Thank@WiktorStribiżew它工作得很好。
Sentiments Intensite Expression
match
405 0 Disagreement 3 Bizarre contradiction
921 0 Satisfaction 5 La plus simple
2549 0 Dissatisfaction 3 Ne me contentant pas
df['text'].str.extractall(r'<(?P<Sentiments>\w+)\s+int=(?P<Intensite>\d+)>(?P<Expression>[^<]*)')