Python 无法获取内部的完整数据<;部门>;
HTML: 上述编码仅打印第一个Python 无法获取内部的完整数据<;部门>;,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,HTML: 上述编码仅打印第一个标记 import requests from bs4 import BeautifulSoup page = requests.get('https://www.fincaraiz.com.co/oceana-52/barranquilla/proyecto-nuevo-det-1041165.aspx') soup = BeautifulSoup(page.content, 'html.parser') first = soup.find('div' , 'b
标记
import requests
from bs4 import BeautifulSoup
page = requests.get('https://www.fincaraiz.com.co/oceana-52/barranquilla/proyecto-nuevo-det-1041165.aspx')
soup = BeautifulSoup(page.content, 'html.parser')
first = soup.find('div' , 'breadcrumb left')
link = first.find('div')
a_link = link.findAll('a')
print (a_link)
我不知道为什么它在
'/'
内部
标记之后没有打印您可以使用lxml解析器,html.parser在BS4解析它之前对实际的源代码进行规范化/美化
import requests
from bs4 import BeautifulSoup
page = requests.get('https://www.fincaraiz.com.co/oceana-52/barranquilla/proyecto-nuevo-det-1041165.aspx')
soup = BeautifulSoup(page.content, 'html.parser')
first = soup.find('div' , 'breadcrumb left')
link = first.find('div')
a_link = link.findAll('a')
print (a_link)
Valle Del Cauca
Cali
Zona Sur
Zona Sur
你试过使用不同的解析器吗?太好了!请不要忘记将此标记为答案。谢谢
Valle Del Cauca
Cali
Zona Sur
Zona Sur
soup = BeautifulSoup(page.content, 'lxml')