在python中使用beautifulsoup4解析html信息_Python_Html_Parsing

在python中使用beautifulsoup4解析html信息

python html parsing

在python中使用beautifulsoup4解析html信息,python,html,parsing,Python,Html,Parsing,我和一个朋友正在做一个python项目，我们想制作一些东西来下载页面并解决您选择的问题，然后像这样打印回来：欧拉计划问题7:100001st质数通过列出前六个素数：2、3、5、7、11和13，我们可以看到第六个素数是13 What is the 10 001st prime number? 例如，您可以执行类似python脚本_name.py 7的操作，它将打印出^^ 我一直试图找到多种方法来实现这一点，但我不明白beautifulsoup4是如何工作的。如果你有脚本的话，解释一下脚本是如

我和一个朋友正在做一个python项目，我们想制作一些东西来下载页面并解决您选择的问题，然后像这样打印回来：

欧拉计划问题7:100001st质数通过列出前六个素数：2、3、5、7、11和13，我们可以看到第六个素数是13

What is the 10 001st prime number?

例如，您可以执行类似python脚本_name.py 7的操作，它将打印出^^

我一直试图找到多种方法来实现这一点，但我不明白beautifulsoup4是如何工作的。如果你有脚本的话，解释一下脚本是如何工作的也会很有帮助

谢谢大家!

这将帮助您开始：

import sys
import urllib2
from bs4 import BeautifulSoup

problem_url  = "https://projecteuler.net/problem={}".format(sys.argv[1])
problem_page = urllib2.urlopen(problem_url)
soup = BeautifulSoup(problem_page.read())

problem_text = soup.find("div", {"class": "problem_content"}).text
print problem_text

用法：

$ ./euler.py 4

输出：

回文数字的两种读取方式相同。由两个两位数的乘积构成的最大回文是9009=91×99。查找由两个3位数字的乘积构成的最大回文

这不是一个好问题，因此，除了宽泛之外，你的问题中没有代码，这等于零努力，BeautifulSoup的文档非常棒，因此没有理由不做一些尝试。