Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/353.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何从特定网站中获取数据_Python_Html - Fatal编程技术网

Python 如何从特定网站中获取数据

Python 如何从特定网站中获取数据,python,html,Python,Html,我正试图从一个网站上搜集数据,为练习做一个分析。我在一个特定的网站上遇到了一些问题。该网站是关于西雅图地区警方的报告。我读了很多文章,但没有得到答案。网址是: 我知道我应该使用BeautifulSoup并尝试找到一个关键字来进行搜索,然后将类型转换为文本。然而,我总是一无所获 导入请求 URL='1〕https://data.seattle.gov/Public-Safety/real-time-911/nvqc-w7eg' page=请求.get(URL) 从bs4导入BeautifulSou

我正试图从一个网站上搜集数据,为练习做一个分析。我在一个特定的网站上遇到了一些问题。该网站是关于西雅图地区警方的报告。我读了很多文章,但没有得到答案。网址是:

我知道我应该使用BeautifulSoup并尝试找到一个关键字来进行搜索,然后将类型转换为文本。然而,我总是一无所获

导入请求
URL='1〕https://data.seattle.gov/Public-Safety/real-time-911/nvqc-w7eg'
page=请求.get(URL)
从bs4导入BeautifulSoup
汤=美汤(第页内容)
我的目标是将表转换为
.csv
文件。有人能帮我吗?

试试看

soup = BeautifulSoup(page.text, "html.parser")
试一试


要创建BeautifulSoup对象,请执行以下操作:

soup = BeautifulSoup(page.text, "lxml")
或者

或者


我认为,您应该使用
lxml
,因为它具有良好的性能。

创建BeautifulSoup对象:

soup = BeautifulSoup(page.text, "lxml")
或者

或者


我认为,您应该使用
lxml
,因为它具有良好的性能。

使用
lxml
HTML.parser
解析HTML。其中一些具有其他优势,包括
lxml
速度非常快

URL = 'https://data.seattle.gov/Public-Safety/real-time-911/nvqc-w7eg'
page = requests.get(URL) 
from bs4 import BeautifulSoup
soup = BeautifulSoup(page.text, "html.parser") #or lxml, htmlparser is just example

与其不使用字符串直接将其放入,不如将其与字符串一起放入,以便Python知道您正在处理解析器。

使用
lxml
HTML.parser
解析HTML。其中一些具有其他优势,包括
lxml
速度非常快

URL = 'https://data.seattle.gov/Public-Safety/real-time-911/nvqc-w7eg'
page = requests.get(URL) 
from bs4 import BeautifulSoup
soup = BeautifulSoup(page.text, "html.parser") #or lxml, htmlparser is just example

与其不使用字符串直接将其放入,不如将其与字符串一起放入,以便Python知道您正在处理解析器。

如果该表是由JS创建的,这种方法将不适用于您感兴趣的JavaScript密集型站点,您可能应该尝试而不是请求,如果该表是由JS创建的,那么这种方法将不适用于像您感兴趣的站点这样的JavaScript密集型站点,您可能应该尝试替代请求,而请求不适用于JavaScript。