Python 如何将网站上的文字转换成口述?

Python 如何将网站上的文字转换成口述?,python,parsing,text,web,webpage,Python,Parsing,Text,Web,Webpage,我正试图从你那里得到信息。基本上它看起来像一个简单的python字典,这就是我想将它转换成的。我目前的代码是: import urllib.request with urllib.request.urlopen('http://xkcd.com/info.0.json') as response: html = [response.read()] print(html) 这就产生了 [b'{"month": "2", "num": 1647, "link": "", "year": "

我正试图从你那里得到信息。基本上它看起来像一个简单的python字典,这就是我想将它转换成的。我目前的代码是:

import urllib.request
with urllib.request.urlopen('http://xkcd.com/info.0.json') as response:
    html = [response.read()]
print(html)
这就产生了

[b'{"month": "2", "num": 1647, "link": "", "year": "2016", "news": "", "safe_title": "Diacritics", "transcript": "", "alt": "Using diacritics correctly is not my fort\\u00c3\\u00a9.", "img": "http:\\/\\/imgs.xkcd.com\\/comics\\/diacritics.png", "title": "Diacritics", "day": "24"}']

您正在接收一个JSON编码的响应。您可以使用以下函数对其进行解析:

import json
import urllib.request

with urllib.request.urlopen('http://xkcd.com/info.0.json') as response:
    data = json.loads(response.read().decode('utf8'))

>>> data
{'link': '', 'transcript': '', 'month': '2', 'year': '2016', 'alt': 'Using diacritics correctly is not my forté.', 'num': 1647, 'img': 'http://imgs.xkcd.com/comics/diacritics.png', 'day': '24', 'safe_title': 'Diacritics', 'news': '', 'title': 'Diacritics'}
这在模块中更容易实现:


请求
省去了解码传入数据和解码JSON的麻烦。

您收到的是JSON编码的响应。您可以使用以下函数对其进行解析:

import json
import urllib.request

with urllib.request.urlopen('http://xkcd.com/info.0.json') as response:
    data = json.loads(response.read().decode('utf8'))

>>> data
{'link': '', 'transcript': '', 'month': '2', 'year': '2016', 'alt': 'Using diacritics correctly is not my forté.', 'num': 1647, 'img': 'http://imgs.xkcd.com/comics/diacritics.png', 'day': '24', 'safe_title': 'Diacritics', 'news': '', 'title': 'Diacritics'}
这在模块中更容易实现:


请求
省去了解码传入数据和解码JSON的麻烦。

在Python 2.7中,需要
导入urllib2
,然后
导入JSON
将数据作为Python字典加载到变量中。资源


在Python2.7中,需要
导入urllib2
,然后
导入json
将数据作为Python字典加载到变量中。资源

import urllib2
import json
response = urllib2.urlopen('http://xkcd.com/info.0.json')
html = response.read().decode('utf8')

data = json.loads(html)
type(data) is dict # True