Python 如何在Internet Explorer中抓取ActiveX内容
我的任务是抓取特定的网页(使用Internet Explorer)。 在某些页面中包含各种网格表,当我检查它的HTML源代码时。除了该表的空间外,没有与表相关的数据。似乎无法在HTML源中对表中的内容进行爬网 当我检查它的HTML源代码时,除了像Python 如何在Internet Explorer中抓取ActiveX内容,python,selenium,beautifulsoup,web-crawler,activex,Python,Selenium,Beautifulsoup,Web Crawler,Activex,我的任务是抓取特定的网页(使用Internet Explorer)。 在某些页面中包含各种网格表,当我检查它的HTML源代码时。除了该表的空间外,没有与表相关的数据。似乎无法在HTML源中对表中的内容进行爬网 当我检查它的HTML源代码时,除了像[object object]这样的字符串或一些用字母和数字书写的随机字符串外,什么都没有 另外,我从该源代码中所能得到的就是它被称为WiseGrid(我还安装了用于登录的WiseGridactiveX) 当我搜索其他单词来检查源表时,它只会改变奇怪的长
[object object]
这样的字符串或一些用字母和数字书写的随机字符串外,什么都没有
另外,我从该源代码中所能得到的就是它被称为WiseGrid(我还安装了用于登录的WiseGrid
activeX)
当我搜索其他单词来检查源表时,它只会改变奇怪的长文本
有没有从这些文档中获取数据的一般方法
对不起,我的解释很不友好。这里的代码无法上传(它的表包含1000多个数据,html内容无法解释。)读取ActiveX插件可能很困难,具体取决于它的构建方式。一个要考虑的事情是制作页面的截图,然后使用OCR来解析页面。你能找到一个公开的例子来分享吗?@ FryYouGuy是的,看起来它是唯一的方法,但是导航表的按钮也在ActiveX中,我需要控制页面。但图像检查是个好主意。@QHarr我想我找不到这个案例的公开例子。除了我的业务相关代码外,我在网上找不到任何东西。我能告诉你的只是它是一个
智能网格
(我以前没听说过)