从`:`till<;提取数据;br>;使用python 的页面加载http://xxxx?roxy=www.yahoo.com&eventto=https://mywebsite?event 拍摄了4001毫秒(东北:167毫秒,东南:2509毫秒,东南:1325毫秒)主题:雅虎!!我的网站是一个好网站|我的网站
我想用python中的正则表达式从上面的消息中提取从`:`till<;提取数据;br>;使用python 的页面加载http://xxxx?roxy=www.yahoo.com&eventto=https://mywebsite?event 拍摄了4001毫秒(东北:167毫秒,东南:2509毫秒,东南:1325毫秒)主题:雅虎!!我的网站是一个好网站|我的网站,python,regex,Python,Regex,我想用python中的正则表达式从上面的消息中提取主题。我想提取的消息是Yahoo!!我的网站是一个好网站|我的网站你可以试试RegExr'Topic:(.*)\' >s='的页面加载http://xxxx?roxy=www.yahoo.com&eventto=https://mywebsite?event 拍摄了4001毫秒(东北:167毫秒,东南:2509毫秒,东南:1325毫秒)主题:雅虎!!我的网站是一个好网站|我的网站' >>>进口稀土 >>>重新搜索(r'Topic:(.*)\,s)
主题
。我想提取的消息是Yahoo!!我的网站是一个好网站|我的网站
你可以试试RegExr'Topic:(.*)\'
>s='的页面加载http://xxxx?roxy=www.yahoo.com&eventto=https://mywebsite?event 拍摄了4001毫秒(东北:167毫秒,东南:2509毫秒,东南:1325毫秒)
主题:雅虎!!我的网站是一个好网站|我的网站
'
>>>进口稀土
>>>重新搜索(r'Topic:(.*)\,s).group(1)
“雅虎!”!!我的网站是一个好网站|我的网站'
注意:与正则表达式相比,使用字符串处理可以更快地完成此操作。如果您知道分隔符,则可以拆分字符串
>>> s = 'Page load for http://xxxx?roxy=www.yahoo.com&eventto=https://mywebsite?event took 4001 ms (Ne: 167 ms, Se: 2509 ms, Xe: 1325 ms)<br><br><br>Topic: Yahoo!! My website is a good website | Mywebsite<br>'
>>> import re
>>> re.search(r'Topic: (.*)\<br\>',s).group(1)
'Yahoo!! My website is a good website | Mywebsite'
>>s.split('Topic:')[1]。split('
')[0]
“雅虎!”!!我的网站是一个好网站|我的网站'
向我们展示您当前拥有的正则表达式,我们可以修复它
>>> s = 'Page load for http://xxxx?roxy=www.yahoo.com&eventto=https://mywebsite?event took 4001 ms (Ne: 167 ms, Se: 2509 ms, Xe: 1325 ms)<br><br><br>Topic: Yahoo!! My website is a good website | Mywebsite<br>'
>>> import re
>>> re.search(r'Topic: (.*)\<br\>',s).group(1)
'Yahoo!! My website is a good website | Mywebsite'
>>> s.split('Topic: ')[1].split('<br>')[0]
'Yahoo!! My website is a good website | Mywebsite'