Python/ASP.NET/Javascript:如何刮取基于ASP.NET的页面

Python/ASP.NET/Javascript:如何刮取基于ASP.NET的页面,javascript,python,asp.net,web-scraping,Javascript,Python,Asp.net,Web Scraping,我正在开发一个python程序,它可以从网页中提取数据(公共数据)。问题是,当我想要获得一个网页的源代码时,它可以使用按钮访问,并且它是基于ASP.NET的。我不能像往常一样从页面解析a href 所以我的问题是:有没有一种简单的方法来获取ASP.NET页面的源代码 为了解释清楚,我附加了一个基于ASP.NET的网页: 在这种情况下,我想得到页面的SURE代码,当我在页面的中间点击“ReaAr Tor Topen(1)”时显示。 您可以看到父页面,其中是我要模拟单击的按钮 我试图检查此(父)页面

我正在开发一个python程序,它可以从网页中提取数据(公共数据)。问题是,当我想要获得一个网页的源代码时,它可以使用按钮访问,并且它是基于ASP.NET的。我不能像往常一样从页面解析a href

所以我的问题是:有没有一种简单的方法来获取ASP.NET页面的源代码

为了解释清楚,我附加了一个基于ASP.NET的网页: 在这种情况下,我想得到页面的SURE代码,当我在页面的中间点击“ReaAr Tor Topen(1)”时显示。 您可以看到父页面,其中是我要模拟单击的按钮

我试图检查此(父)页面的源代码,并在“Radiátor topení(1)”文本附近查找一些url,但我只找到了以下内容:

Radiátor topení(1)
我担心,这对我没有帮助

我正在寻找一种最简单的方法,因为我既不精通ASP.NET,也不精通Javascript。
谢谢你的建议

该程序使用python,它提供了链接的html源代码

import urllib2
from bs4 import BeautifulSoup

link="http://www.example.com"
hdr = {'User-Agent': 'Mozilla/5.0'}
req = urllib2.Request(link,headers=hdr)

page = urllib2.urlopen(link)
soup = BeautifulSoup(page,'html.parser')

print soup

对于一个in-soup.find_all('a',href=True):print“find the URL:”,a['href']谢谢,但正如我所写的,父页面的源代码中没有href。。。所以我不能只看源代码就找到页面的路径(在本例中是“Radiátor topení(1)”)