Python 请求和urllib2从XBRL页面获取错误';您正在运行的浏览器模式与此应用程序不兼容';

Python 请求和urllib2从XBRL页面获取错误';您正在运行的浏览器模式与此应用程序不兼容';,python,python-requests,urllib2,Python,Python Requests,Urllib2,不知道为什么我不能从这个链接获取页面。我所要做的就是把它弄到beautifulsoup import requests,urllib2 link='https://www.sec.gov/ix?doc=/Archives/edgar/data/1373715/000137371518000157/now-2018630x10q.htm' r = requests.get(link) r2=urllib2.urlopen(link) html=r2.read() 还尝试使用以下内容伪造浏览

不知道为什么我不能从这个链接获取页面。我所要做的就是把它弄到beautifulsoup

import requests,urllib2

link='https://www.sec.gov/ix?doc=/Archives/edgar/data/1373715/000137371518000157/now-2018630x10q.htm'

r = requests.get(link)

r2=urllib2.urlopen(link)
html=r2.read()
还尝试使用以下内容伪造浏览器:

headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}

r = requests.get(link, headers=headers)
文本是一样的。。。不是我想要的那一页

得到一个像这样的标题

var note = 'The browser mode you are running is not compatible with this application.';

            browserName ='Microsoft Internet Explorer';

            note +='You are currently running '+browserName+' '+((ie7>0)?7:8)+'.0.';       

                var userAgent = window.navigator.userAgent.toLowerCase();           

                if(userAgent.indexOf('ipad') != -1 || userAgent.indexOf('iphone') != -1 || userAgent.indexOf('apple') != -1){               

                    note += ' Please use a more current version of '+browserName+' in order to use the application.';

                }else if(userAgent.indexOf('android') != -1){               

                    note += ' Please use a more current version of Google Chrome or Mozilla Firefox in order to use the application.';

                }else{              

                    note += ' Please use a more current version of Microsoft Internet Explorer, Google Chrome or Mozilla Firefox in order to use the application.';

                }
我可以很好地获得此页面:
https://www.sec.gov/Archives/edgar/data/1373715/000137371518000153/erq2fy18-document.htm


这不是XBRL文档。我认为这与XBRL有关,服务器希望我的浏览器与数据交互?

页面的这部分似乎是由js呈现的。通常,动态内容最可靠的选择是
selenium
,但在这种情况下,您可以避免它,并使用
请求

很明显,该页面使用了本文档的内容
/Archives/edgar/data/1373715/00013371518000157/now-2018630x10q.htm
。您可以绕过该页面,直接请求文档

import requests

url = "https://www.sec.gov/Archives/edgar/data/1373715/000137371518000157/now-2018630x10q.htm"
r = requests.get(url)
html = r.text

print(html)

但是你的结果是什么?你能添加它吗?你的python版本是什么?我刚刚运行了代码,它运行得很好。2.7.15。。。你有实际的10-Q和一堆财务报表数字吗?没有,但我没有你遇到的错误。我没有一堆财务报表数字,因为js加载的数据。我想你可以添加错误信息吗?我想你的回答让我省去了很多麻烦。侧踏板XBRL全部放在一起。