Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/88.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在python中使用beautifulsoup4解析html信息_Python_Html_Parsing - Fatal编程技术网

在python中使用beautifulsoup4解析html信息

在python中使用beautifulsoup4解析html信息,python,html,parsing,Python,Html,Parsing,我和一个朋友正在做一个python项目,我们想制作一些东西来下载页面并解决您选择的问题,然后像这样打印回来: 欧拉计划问题7:100001st质数 通过列出前六个素数:2、3、5、7、11和13,我们可以看到第六个素数是13 What is the 10 001st prime number? 例如,您可以执行类似python脚本_name.py 7的操作,它将打印出^^ 我一直试图找到多种方法来实现这一点,但我不明白beautifulsoup4是如何工作的。如果你有脚本的话,解释一下脚本是如

我和一个朋友正在做一个python项目,我们想制作一些东西来下载页面并解决您选择的问题,然后像这样打印回来:

欧拉计划问题7:100001st质数 通过列出前六个素数:2、3、5、7、11和13,我们可以看到第六个素数是13

What is the 10 001st prime number?
例如,您可以执行类似python脚本_name.py 7的操作,它将打印出^^

我一直试图找到多种方法来实现这一点,但我不明白beautifulsoup4是如何工作的。如果你有脚本的话,解释一下脚本是如何工作的也会很有帮助


谢谢大家!

这将帮助您开始:

import sys
import urllib2
from bs4 import BeautifulSoup

problem_url  = "https://projecteuler.net/problem={}".format(sys.argv[1])
problem_page = urllib2.urlopen(problem_url)
soup = BeautifulSoup(problem_page.read())

problem_text = soup.find("div", {"class": "problem_content"}).text
print problem_text
用法:

$ ./euler.py 4
输出:

回文数字的两种读取方式相同。由两个两位数的乘积构成的最大回文是9009=91×99。 查找由两个3位数字的乘积构成的最大回文


这不是一个好问题,因此,除了宽泛之外,你的问题中没有代码,这等于零努力,BeautifulSoup的文档非常棒,因此没有理由不做一些尝试。