如何使用Python从网站下载文本文件?

如何使用Python从网站下载文本文件?,python,file,download,Python,File,Download,我需要编写一个函数来下载和存储今天的预发布域列表.txt文件 http://www.namejet.com/pages/downloads.aspx. 因此,由于今天是10月8日,您希望获得文件“2012年10月8日,星期一”。 尝试请求,但不起作用。 我遇到了问题,因为该文件不是存储在固定的URL上,而是隐藏在一些Javascript后面。实际上,您得到的文本文件是对POST请求的响应,其中包含几个base64编码的请求参数。随便玩吧 使用Firebug或任何其他调试工具查看POST内容和参数

我需要编写一个函数来下载和存储今天的预发布域列表.txt文件
http://www.namejet.com/pages/downloads.aspx.
因此,由于今天是10月8日,您希望获得文件“2012年10月8日,星期一”。 尝试请求,但不起作用。
我遇到了问题,因为该文件不是存储在固定的URL上,而是隐藏在一些Javascript后面。

实际上,您得到的文本文件是对POST请求的响应,其中包含几个base64编码的请求参数。随便玩吧


使用Firebug或任何其他调试工具查看POST内容和参数

实际上,您得到了文本文件,以响应带有多个base64编码请求参数的POST请求。随便玩吧


使用Firebug或任何其他调试工具查看帖子内容和参数

在处理ASP.NET系统时,这一项有点棘手。如果这是为了个人脚本以外的任何东西,我会很小心,因为你不仅在有效地使用另一个网站的数据,而且也在反向工程他们的软件(然而,IANAL并不知道网络系统中这些问题的合法性)

您要做的是检查POST数据(使用Firebug、Chrome developer工具等),并查找表单对象的
\uu EVENTTARGET
\uu VIEWSTATE
属性。您必须解码
\uuu VIEWSTATE
才能读取(签出)。从那里,我认为你应该能够弄清楚如何获得你正在寻找的数据

在Python中,它非常简单:

from urllib2 import urlopen
from urllib import urlencode

data = urlopen('url', urlencode({
    '__VIEWSTATE': 'foo',
    '__EVENTTARGET': 'bar',
})).read()

在处理ASP.NET系统时,这一点有点棘手。如果这是为了个人脚本以外的任何东西,我会很小心,因为你不仅在有效地使用另一个网站的数据,而且也在反向工程他们的软件(然而,IANAL并不知道网络系统中这些问题的合法性)

您要做的是检查POST数据(使用Firebug、Chrome developer工具等),并查找表单对象的
\uu EVENTTARGET
\uu VIEWSTATE
属性。您必须解码
\uuu VIEWSTATE
才能读取(签出)。从那里,我认为你应该能够弄清楚如何获得你正在寻找的数据

在Python中,它非常简单:

from urllib2 import urlopen
from urllib import urlencode

data = urlopen('url', urlencode({
    '__VIEWSTATE': 'foo',
    '__EVENTTARGET': 'bar',
})).read()

你有关于它的教程吗?@DemianBrecht回答得比我好得多,希望有帮助:)你有关于它的教程吗?@DemianBrecht回答得比我好得多,希望有帮助:)你好,Demian。我知道现在跟进有点晚了。我使用了Chrome开发者工具,发现了你提到的两个属性!现在我该怎么办?如何从该网站获取预发布域名列表?你好,Demian。我知道现在跟进有点晚了。我使用了Chrome开发者工具,发现了你提到的两个属性!现在我该怎么办?如何从该网站获取预发布域列表?