Python 如何用特定的词解析文件?
我想解析一个来自我在网站上提出的请求的文件。所以文件看起来像这样Python 如何用特定的词解析文件?,python,python-3.x,Python,Python 3.x,我想解析一个来自我在网站上提出的请求的文件。所以文件看起来像这样 id="case8-7" autocomplete="0" /></td> <td headers="ligne 9, colonne 9. Valeur fixée" class="tdd"><input type="text" readonly name="sudoku[8][8]" value="2" class="chiffre-zoom" 所以我可以用数独,但我错过了下一行。你最好不
id="case8-7"
autocomplete="0"
/></td>
<td
headers="ligne
9,
colonne
9.
Valeur
fixée"
class="tdd"><input
type="text"
readonly
name="sudoku[8][8]"
value="2"
class="chiffre-zoom"
所以我可以用数独,但我错过了下一行。你最好不要用这种方式 在下一行中找到特定的目标,并通过
美丽群书库你最好不要用这种方式 在下一行中找到特定的目标,并通过
美丽的苏黎世图书馆如果你在那之后只需要所有的东西,我会做一些又快又脏的事 r、 拆分('name=\'sudoku')[1]
然后将其写入文件如果你只需要完成之后的所有事情,我只会做一些快速而肮脏的事情 r、 拆分('name=\'sudoku')[1]
然后将其写入文件您可以使用Beautifulsoup进行刮取,这将使解析HTML变得非常容易,使用HTML解析器-您不能依赖HTML中的换行符和空格(也不能使用XML或JSON等)。BeautifulSoup确实是一个很好的建议,因为它知道如何处理破坏的HTML(这是很正常的)。你可以使用BeautifulSoup来删除它,这将使解析HTML变得非常容易,使用HTML解析器-你不能依赖HTML中的换行符和空格(也不能依赖XML或JSON等)。BeautifulSoup确实是一个很好的建议,因为它知道如何处理破损的HTML(这是很正常的)。
#!/usr/bin/env python3
import requests
r = requests.get("https://www.e-sudoku.fr/grille-de-sudoku.php")
r= r.text
file = open("Sudoku.txt", "w")
file.write(r)
file.close
with open("Sudoku.txt", "r") as f:
for line in f:
for word in line.split():
if "name=\"sudoku" in word:
print(word)