Python Can';不要下载整个html页面

Python Can';不要下载整个html页面,python,web,download,urllib,Python,Web,Download,Urllib,正如我的标题所示,我正在尝试使用脚本显示和下载html页面。 我尝试了不同的python(和ActionScript3)方法,但没有一种方法能够真正显示网站上的全部可见内容 然而,它们都显示了一些javascipt代码(我想下载的网页是由javascript动态创建的) 有什么方法可以捕捉到可见的内容吗?我想要的功能类似于“全选-复制”-windows方法。因为您编写了 我想要的功能类似于“全选-复制”-windows 方法 我知道你想下载网页的“源代码”。如果这是你想要的,那么这就是你需要做的

正如我的标题所示,我正在尝试使用脚本显示和下载html页面。 我尝试了不同的python(和ActionScript3)方法,但没有一种方法能够真正显示网站上的全部可见内容

然而,它们都显示了一些javascipt代码(我想下载的网页是由javascript动态创建的)


有什么方法可以捕捉到可见的内容吗?我想要的功能类似于“全选-复制”-windows方法。

因为您编写了

我想要的功能类似于“全选-复制”-windows 方法

我知道你想下载网页的“源代码”。如果这是你想要的,那么这就是你需要做的

import urllib.request
import re

urls = ["http://google.com","http://yahoo.com"];

i=0;
while i < len(urls):    
    htmlfile = urllib.request.urlopen(urls[i]);
    htmltext = htmlfile.read();
    print(htmltext);
    print("\n");
    i=i+1;
导入urllib.request
进口稀土
URL=[”http://google.com","http://yahoo.com"];
i=0;
而i

它读取URL并打印其源代码。

您需要使用.mechanize吗?我在Python中安装这个包的功能时遇到了很多问题。我想我已经成功地安装了pip,但是当使用pip安装lxml时,我得到了很多标准的cmd echo,直到“C:\Python33\lib\distutils\dist.py:258:UserWarning:Unknown distribution option:'extra require'”。在许多类似的错误之后。。。