引用搞乱了Python刮刀
我正试图在一个div中收集所有数据,如下所示。然而,这些引语让我很反感引用搞乱了Python刮刀,python,quotes,double-quotes,scraper,Python,Quotes,Double Quotes,Scraper,我正试图在一个div中收集所有数据,如下所示。然而,这些引语让我很反感 <div id="address"> <div class="info">14955 Shady Grove Rd.</div> <div class="info">Rockville, MD 20850</div> <div class="info">Suite: 300</div> </div>
<div id="address">
<div class="info">14955 Shady Grove Rd.</div>
<div class="info">Rockville, MD 20850</div>
<div class="info">Suite: 300</div>
</div>
夏迪格罗夫路14955号。
马里兰州洛克维尔20850
套房:300
我正试着从以下几点开始
addressStart = page.find("<div id="address">")
addressStart=page.find(“”)
但是div里面的引用把我搞砸了。有人知道我如何解决这个问题吗?要回答您的具体问题,您需要使用引号,或者在字符串本身上使用不同类型的引号:
addressStart = page.find("<div id=\"address\">")
# or
addressStart = page.find('<div id="address">')
from bs4 import BeautifulSoup
soup = BeautifulSoup(page)
for address in soup.find_all('div',id='address'): # returns a list, use find if you just want the first
for info in address.find_all('div',class_='info'): # for attribute class, use class_ instead since class is a reserved word
print info.string