Python “bsObj不断返回”;无”;
我正在努力刮这一页 我特别想要的是以“第一个月租金减价200美元”开头的描述 我尝试了几种不同的方法,但通常都没有得到任何结果作为返回值——有时我会得到一个编解码器错误,但这通常是在我尝试使用“类”时得到的结果:“NotTranslate” 这是我当前的代码——我已经注释了大部分代码,因此输出更容易阅读Python “bsObj不断返回”;无”;,python,selenium,beautifulsoup,Python,Selenium,Beautifulsoup,我正在努力刮这一页 我特别想要的是以“第一个月租金减价200美元”开头的描述 我尝试了几种不同的方法,但通常都没有得到任何结果作为返回值——有时我会得到一个编解码器错误,但这通常是在我尝试使用“类”时得到的结果:“NotTranslate” 这是我当前的代码——我已经注释了大部分代码,因此输出更容易阅读 # Import selenium webdriver. from selenium import webdriver from bs4 import BeautifulSoup import
# Import selenium webdriver.
from selenium import webdriver
from bs4 import BeautifulSoup
import time
def getData(url):
driver = webdriver.Firefox()
driver.get(url)
time.sleep(3)
pageSource = driver.page_source
bsObj = BeautifulSoup(pageSource)
# beds
#beds = bsObj.find("span", {"class":"addr_bbs"})
#print(beds)
# baths
#baths = beds.find_next("span", {"class":"addr_bbs"})
#print(baths)
# sqft
#sqft = baths.find_next("span", {"class":"addr_bbs"})
#print(sqft)
# rent_amount
#rent_amount = bsObj.find("div", {"class":"main-row home-summary-row"}).span
#print(rent_amount)
# rent_zestiment
#rent_zestiment = bsObj.find("div", {"class":"home-summary-row"}).find("span")
#print(rent_zestiment)
# days_on_zillow
#days_on_zillow = bsObj.find("ul", {"class":"zsg-list_square zsg-lg-1-3 zsg-md-1-2 zsg-sm-1-1"})
#print(days_on_zillow)
# subdivision
#subdivision = bsObj.find(id="hdp-neighborhood").h2
#print(subdivision)
# property_manager_name
#property_manager_name = bsObj.find("span", {"class":"snl company-name"})
#print(property_manager_name)
# property_manager_phone
#property_manager_phone = bsObj.find("span", {"class":"snl phone"})
#print(property_manager_phone)
# disc_of_property
disc_of_property = bsObj.find(id="yui_3_18_1_1_1448347444636_12522")
print(disc_of_property)
# url_of_imgages
# url_of_listing
getData(“”)
我是一个傻瓜,所以任何帮助都会很好。玩了13个小时后,我终于得到了它
disc_of_property =(bsObj.find('div', {'class': "notranslate"}).text)
print(disc_of_property.encode("utf-8"))
我在这上面花了那么多时间,真是太尴尬了。我会帮忙的,但是你有许可这样做吗?你是说
print(soup.find('div',{class':“nottranslate”}).text)
?是的print(bsObj.find('div),{class':“nottranslate”).text)不起作用。它返回UnicodeError'charmap'编解码器无法对字符'u2026'进行编码