用于呈现HTML和javascript的Python库
是否有任何python模块用于使用javascript呈现HTML页面并获取DOM对象用于呈现HTML和javascript的Python库,javascript,python,html,Javascript,Python,Html,是否有任何python模块用于使用javascript呈现HTML页面并获取DOM对象 我想解析一个使用javascript生成几乎所有内容的页面 这里最大的复杂性是在浏览器之外模拟完整的浏览器环境。您可以使用独立的javascript解释器(如Rhino和SpiderMonkey)来运行javascript代码,但它们不提供完整的浏览器式环境来完整呈现网页 如果我需要解决这样的问题,我会首先看看javascript是如何呈现页面的,它很可能是通过AJAX获取数据并使用这些数据来呈现页面的。然后
我想解析一个使用javascript生成几乎所有内容的页面 这里最大的复杂性是在浏览器之外模拟完整的浏览器环境。您可以使用独立的javascript解释器(如Rhino和SpiderMonkey)来运行javascript代码,但它们不提供完整的浏览器式环境来完整呈现网页 如果我需要解决这样的问题,我会首先看看javascript是如何呈现页面的,它很可能是通过AJAX获取数据并使用这些数据来呈现页面的。然后,我可以使用像simplejson和httplib2这样的python库直接获取数据并使用它,从而消除访问DOM对象的需要。然而,这只是一种可能的情况,我不知道你正在解决的确切问题 其他选项包括Łukasz提到的selenium解决方案、某种webkit嵌入式疯狂、某种IE win32脚本疯狂,或者最后一种基于pyxpcom的解决方案(添加了疯狂)。所有这些都有一个缺点,那就是python需要一个几乎完全运行的web浏览器才能使用,这可能不是一个取决于您的环境的选项。您可能可以使用它。需要运行glib和GTK,但这可能比不使用glib包装webkit的部分问题要小
我不知道它是否能满足您的所有需求,但我想您应该尝试一下。我认为pywebkitgtk只能呈现html页面。在呈现xml源代码后是否可以获取它?上面没有足够的文档,你可以把这个问题改为“用python模拟浏览器DOM”之类的问题吗?当前的问题并没有真正反映这个问题。