Python网站源代码提取
我正在使用Python网站源代码提取,python,html,Python,Html,我正在使用urllib2下载一个网站的源代码,但出现了一些问题。 资料来源于本网站: 我想做的就是下载整个html,然后解析它,从网站中提取“Now playing”部分 但是,当我下载带有此代码的源代码时 response = urllib2.urlopen('http://www.starfm.com/') html = response.read() a = open("C:\\users\\Leonardo\\Desktop\\source.txt","w") a.write(html)
urllib2
下载一个网站的源代码,但出现了一些问题。
资料来源于本网站:
我想做的就是下载整个html,然后解析它,从网站中提取“Now playing”部分
但是,当我下载带有此代码的源代码时
response = urllib2.urlopen('http://www.starfm.com/')
html = response.read()
a = open("C:\\users\\Leonardo\\Desktop\\source.txt","w")
a.write(html)
a.close()
最后一个来源在网站的“正在播放”部分没有显示当前的艺术家
为什么??
我该怎么办
非常感谢
-Leonardo“now playing”来自javascript,可能它会在onload()事件中加载该信息,在本例中,您的代码只是读取内容
也许这个问题对你有帮助
您错过了
a.close
上的括号。它应该是a.close()
。刚从上一次命令行尝试中复制,原始源代码有括号。在浏览器上禁用JavaScript时访问该页面,您将回答自己的问题。是的,我知道问题是JavaScript,但我尝试过类似于或的libs,但我什么都做不了。谁能告诉我哪里做错了?