在BeautifulSoup Python中从脚本标记查找数据
我正在制作一个webscraper,但遇到了一个问题。如何获取该数据值在BeautifulSoup Python中从脚本标记查找数据,python,web-scraping,beautifulsoup,python-requests,Python,Web Scraping,Beautifulsoup,Python Requests,我正在制作一个webscraper,但遇到了一个问题。如何获取该数据值 <script> var store = { data: 'ffggel4784hth4ve8bf5hhe8rh4b1d4g84usd9', domain: 'www.domain.com' }; </script> 我得到了输出
<script>
var store = {
data: 'ffggel4784hth4ve8bf5hhe8rh4b1d4g84usd9',
domain: 'www.domain.com'
};
</script>
我得到了输出
var store = {
data: 'ffggel4784hth4ve8bf5hhe8rh4b1d4g84usd9',
domain: 'www.domain.com'
};
现在如何获取数据值。这是普通字符串,所以使用字符串的函数,如
strip()
,split()
,replace()
,切片
比如说
text = '''var store = {
data: 'ffggel4784hth4ve8bf5hhe8rh4b1d4g84usd9',
domain: 'www.domain.com'
};'''
lines = text.split('\n')
parts = lines[1].strip().split(': ')
name = parts[0]
data = parts[1].strip(',')[1:-1]
print(name, '=', data)
parts = lines[2].strip().split(': ')
name = parts[0]
data = parts[1].strip(',')[1:-1]
print(name, '=', data)
结果
data = ffggel4784hth4ve8bf5hhe8rh4b1d4g84usd9
domain = www.domain.com
这回答了你的问题吗?它是普通字符串,所以将其拆分为行-
split('\n”)
并在上拆分:
或使用[start:end]
进行切片。您也可以使用regex
data = ffggel4784hth4ve8bf5hhe8rh4b1d4g84usd9
domain = www.domain.com