Python 美化组分页
我试图运行这段代码来运行多个wikipedia页面,但是我得到一个错误,说 InvalidURL:URL不能包含控制字符。'/wiki/[17991799]_Football_League'(至少找到“”)。谁来帮我解决这个错误Python 美化组分页,python,Python,我试图运行这段代码来运行多个wikipedia页面,但是我得到一个错误,说 InvalidURL:URL不能包含控制字符。'/wiki/[17991799]_Football_League'(至少找到“”)。谁来帮我解决这个错误 import urllib.request from bs4 import BeautifulSoup pages = [1888-89,1889-90] for page in pages: source =urllib.request.urlopen('
import urllib.request
from bs4 import BeautifulSoup
pages = [1888-89,1889-90]
for page in pages:
source =urllib.request.urlopen('https://en.wikipedia.org/wiki/'+str(pages)+'_Football_League')
soup = BeautifulSoup(source, 'lxml')
table = soup.find('table',class_='wikitable sortable')
rows = table.find_all('tr')
for tr in rows:
td = tr.find_all('td')
row = [i.text for i in td]
print(row)
有两处需要更正 (1) 1889-1889年的连字符不是普通的连字符。 如果粘贴URL,它将显示在下面。
https://en.wikipedia.org/wiki/1888%E2%80%9389_Football_League
(2) 连接URL的变量是错误的。
str(第页)->str(第页)
pages = ['1888%E2%80%9389','1889%E2%80%9390']
source =urllib.request.urlopen('https://en.wikipedia.org/wiki/'+page+'_Football_League')