Python 无法获取内部的完整数据<；部门>；_Python_Web Scraping_Beautifulsoup

Python 无法获取内部的完整数据<；部门>；

python web-scraping

Python 无法获取内部的完整数据<；部门>；,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,HTML: 上述编码仅打印第一个标记 import requests from bs4 import BeautifulSoup page = requests.get('https://www.fincaraiz.com.co/oceana-52/barranquilla/proyecto-nuevo-det-1041165.aspx') soup = BeautifulSoup(page.content, 'html.parser') first = soup.find('div' , 'b

HTML:

上述编码仅打印第一个

标记

import requests
from bs4 import BeautifulSoup
page = requests.get('https://www.fincaraiz.com.co/oceana-52/barranquilla/proyecto-nuevo-det-1041165.aspx')
soup = BeautifulSoup(page.content, 'html.parser')
first = soup.find('div' , 'breadcrumb left')
link = first.find('div')
a_link = link.findAll('a')
print (a_link)

我不知道为什么它在

'/'

内部

标记之后没有打印您可以使用lxml解析器，html.parser在BS4解析它之前对实际的源代码进行规范化/美化

import requests
from bs4 import BeautifulSoup
page = requests.get('https://www.fincaraiz.com.co/oceana-52/barranquilla/proyecto-nuevo-det-1041165.aspx')
soup = BeautifulSoup(page.content, 'html.parser')
first = soup.find('div' , 'breadcrumb left')
link = first.find('div')
a_link = link.findAll('a')
print (a_link)

Valle Del Cauca 
Cali 
Zona Sur 
Zona Sur

你试过使用不同的解析器吗？太好了！请不要忘记将此标记为答案。谢谢

Valle Del Cauca 
Cali 
Zona Sur 
Zona Sur

soup = BeautifulSoup(page.content, 'lxml')