如何在python中使用BeautifulSoup按顺序提取字符串(例如:9、4、1、6、3…)
这就是我到目前为止所拥有的,我正在尝试提取数独网格的数字,但我无法按顺序提取数字。如何按顺序提取数字,以便从以下各项中获得9,4,1,6,3,8,7:如何在python中使用BeautifulSoup按顺序提取字符串(例如:9、4、1、6、3…),python,html,css,web-scraping,beautifulsoup,Python,Html,Css,Web Scraping,Beautifulsoup,这就是我到目前为止所拥有的,我正在尝试提取数独网格的数字,但我无法按顺序提取数字。如何按顺序提取数字,以便从以下各项中获得9,4,1,6,3,8,7: [<span class="true">9</span>, <span class="vloz"> </span>] [<span class="sedy">4</span>] [<span class=&qu
[<span class="true">9</span>, <span class="vloz"> </span>]
[<span class="sedy">4</span>]
[<span class="sedy">1</span>]
so on....```
import requests
import bs4
import numpy as np
import re
res = requests.get('https://www.sudokuweb.org/')
soup = bs4.BeautifulSoup(res.content)
paras = soup.select("tr > td")
#print(paras)
for para in paras:
para = para.select("span")
print(para)
[9,]
[4]
[1]
等等```
导入请求
进口bs4
将numpy作为np导入
进口稀土
res=requests.get('https://www.sudokuweb.org/')
汤=bs4.BeautifulSoup(res.content)
段落=汤。选择(“tr>td”)
#印刷品(第2-3段)
关于第1-2段中的第2段:
段落=段落选择(“跨度”)
印刷品(第2段)
您可以这样尝试。如果您想更改列,只需更改列节即可
项目
import requests
import bs4
import numpy as np
import re
res = requests.get('https://www.sudokuweb.org/')
soup = bs4.BeautifulSoup(res.content, 'html.parser')
paras = soup.select("div#sudoku.sudoku.nine")
print(paras)
columns = ['td#right']
columns += ["td#right{}".format(x) for x in range(9, 81, 9)]
for i in columns:
print(i)
print(soup.select_one(i).find('span').text)