如何使用正则表达式(Python 3.5)提取特定字符串
我正在使用Python在一个网站上刮取一些数据。我已经完成了刮取部分,但我需要提取我需要的数据 以下是我获得的结果示例:如何使用正则表达式(Python 3.5)提取特定字符串,python,regex,python-3.x,Python,Regex,Python 3.x,我正在使用Python在一个网站上刮取一些数据。我已经完成了刮取部分,但我需要提取我需要的数据 以下是我获得的结果示例: { 'thisversionrun': 'Mon Jul 18 2016 10:36:16 GMT+0000 (UTC)', 'lastrunstatus': 'success', 'name': 'Rudolph1', 'version': 3, 'count': 30, 'newdata': True, 'thisversionstatus':
{
'thisversionrun': 'Mon Jul 18 2016 10:36:16 GMT+0000 (UTC)',
'lastrunstatus': 'success',
'name': 'Rudolph1',
'version': 3,
'count': 30,
'newdata': True,
'thisversionstatus': 'success',
'results': {
'collection1': [
{
'property1': "Ano ang 'Marginal Thinking' (Ekonomiks)"
},
{
'property1': 'Saan matatagpuan ang caspian sea ano ang kahalagahan nito'
},
{
'property1': 'ano-ano ang dalawang uri ng paghahambing ibigay ang kahulugan at ibigay ang 2halimbawa'
},
{
'property1': 'mga halimbawa ng pantangi at pambalana tao'
},
{
'property1': '10 halimbawa ng palaisipan pero hindi bugtong?'
},
{
'property1': 'Ano ang kahinaan at kalakasan ni Psyche at Cupid?'
},
{
'property1': 'Ano ang kahulugan ng incentives'
},
{
'property1': 'Ano-ano ang limang tema ng heograpiya at ang kahulugan nito?'
},
{
'property1': 'ano ang mga kultura ng mga taga-singapore'
},
{
'property1': 'Buod ng akdang psyche at cupid sa tagalog'
},
{
'property1': 'Ano ang ibig sabihin ng cañao, anito, bathala, pantas at sugo? :)'
},
{
'property1': 'Ang Paraan ng Pamumuhay sa Singapore'
},
{
'property1': 'Ano ang lahing austronesian?'
},
{
'property1': 'What are usually made of wax?'
},
{
'property1': 'ano ang kultura at tradisyon ng singapore?'
},
{
'property1': 'Pwede magbigay ng 10 halimbawa ng tugmang bayan'
},
{
'property1': 'What takes place when you inhale and exhale?'
},
{
'property1': 'Anu-ano ang mga halimbawa ng karunungang-bayan'
},
{
'property1': 'anu ano ang saklaw ng heograpiya'
},
{
'property1': 'Who hired daedalus?'
},
{
'property1': 'Kahalagahan ng ekonomiks bilang mag aaral, parte ng pamilya at sa lipunan'
},
{
'property1': 'Ano ang pang abay at 5 halimbawa ng pang abay'
},
{
'property1': 'What does each part of the bunch of grapes model represent in relation to the breathing system?'
},
{
'property1': 'kahulugan ng alaala ng isang lasing na suntok sa bibig'
},
{
'property1': 'Ano ang kahulugan ng makabanghay'
},
{
'property1': 'Ano ano ang mga tuntunin at kayarian ng talata. ?'
},
{
'property1': 'Ano ang kahulugan ng heograpiya'
},
{
'property1': 'halimbawa ng recipe para sa matiwasay na lipunan'
},
{
'property1': 'How will you describe the pathway of oxygen in the breathing system?'
},
{
'property1': 'Anu-ano ang mga halimbawa o uri ng karunungang bayan'
}
]
}
}
我需要提取与正则表达式匹配的所有数据,这意味着:{'property1':和'}]}
黑体文本是我需要的数据样本
{'property1':'Anu ano ang mga halimbawa o uri ng karunang bayan'}}}试试这个:
data = re.findall(r'(?is)property1\':\s*\'(.*?)\'\}',str(input_text))
print(data)
试试这个:
# encoding: utf-8
import re
scrappedString = """{'thisversionrun': 'Mon Jul 18 2016 10:36:16 GMT+0000 (UTC)', 'lastrunstatus': 'success', 'name': 'Rudolph1', 'version': 3, 'count': 30, 'newdata': True, 'thisversionstatus': 'success', 'results': {'collection1': [{'property1': "Ano ang 'Marginal Thinking' (Ekonomiks)"}, {'property1': 'Saan matatagpuan ang caspian sea ano ang kahalagahan nito'}, {'property1': 'ano-ano ang dalawang uri ng paghahambing ibigay ang kahulugan at ibigay ang 2halimbawa'}, {'property1': 'mga halimbawa ng pantangi at pambalana tao'}, {'property1': '10 halimbawa ng palaisipan pero hindi bugtong?'}, {'property1': 'Ano ang kahinaan at kalakasan ni Psyche at Cupid?'}, {'property1': 'Ano ang kahulugan ng incentives'}, {'property1': 'Ano-ano ang limang tema ng heograpiya at ang kahulugan nito?'}, {'property1': 'ano ang mga kultura ng mga taga-singapore'}, {'property1': 'Buod ng akdang psyche at cupid sa tagalog'}, {'property1': 'Ano ang ibig sabihin ng cañao, anito, bathala, pantas at sugo? :)'}, {'property1': 'Ang Paraan ng Pamumuhay sa Singapore'}, {'property1': 'Ano ang lahing austronesian?'}, {'property1': 'What are usually made of wax?'}, {'property1': 'ano ang kultura at tradisyon ng singapore?'}, {'property1': 'Pwede magbigay ng 10 halimbawa ng tugmang bayan'}, {'property1': 'What takes place when you inhale and exhale?'}, {'property1': 'Anu-ano ang mga halimbawa ng karunungang-bayan'}, {'property1': 'anu ano ang saklaw ng heograpiya'}, {'property1': 'Who hired daedalus?'}, {'property1': 'Kahalagahan ng ekonomiks bilang mag aaral, parte ng pamilya at sa lipunan'}, {'property1': 'Ano ang pang abay at 5 halimbawa ng pang abay'}, {'property1': 'What does each part of the bunch of grapes model represent in relation to the breathing system?'}, {'property1': 'kahulugan ng alaala ng isang lasing na suntok sa bibig'}, {'property1': 'Ano ang kahulugan ng makabanghay'}, {'property1': 'Ano ano ang mga tuntunin at kayarian ng talata. ?'}, {'property1': 'Ano ang kahulugan ng heograpiya'}, {'property1': 'halimbawa ng recipe para sa matiwasay na lipunan'}, {'property1': 'How will you describe the pathway of oxygen in the breathing system?'}, {'property1': 'Anu-ano ang mga halimbawa o uri ng karunungang bayan'}]}}
"""
regex = """'property1': ('|")([\w\d\ñ\.\-\,\?\'\(\) ]+)("|')"""
searchedItems = re.findall(pattern=regex, string=scrappedString)
for item in searchedItems:
print item[1]
这个结果是什么?是文本吗?它是Python数据结构吗?它是来自json的数据。结果是textso您想要使用
json.loads
。我使用了json.loads。import json import urllib.request import re results=json.loads(urllib.request.urlopen(“myurl.com/code/auth”).read().decode(“utf-8”))print(results)print(results)我需要做的是获取{property1':''}之间的数据。我认为它可以工作,但在编译单个语句时发现多个语句时会出错。我需要更改str吗(输入_text)到我使用的变量中?是的!您需要传递保存json数据的变量名嘿,最后一件事。我需要将结果拆分为新行?这样它将在数据:print(e)中从['data1'、'data2'、'data3']到data1 data2 data3@akash karothiyae显示