Web scraping 基于imacros的数据提取_Web Scraping_Imacros_Extraction

Web scraping 基于imacros的数据提取

web-scraping

Web scraping 基于imacros的数据提取,web-scraping,imacros,extraction,Web Scraping,Imacros,Extraction,我需要有一个imacros脚本来提取这个网站的所有数据（“姓”~A*）。我手动点击字母表链接并计算结果，然后输入max loop来播放loop，但这样做确实很耗时，并尝试在谷歌上查找，但没有运气，尝试在这里查找。希望有人能帮我这里还有我通过record imacros创建的脚本 VERSION BUILD=8871104 RECORDER=FX SET !TIMEOUT_PAGE 20 SET !EXTRACT_TEST_POPUP NO SET !ERRORIGNORE YES TAB

我需要有一个imacros脚本来提取这个网站的所有数据（“姓”~A*）。我手动点击字母表链接并计算结果，然后输入max loop来播放loop，但这样做确实很耗时，并尝试在谷歌上查找，但没有运气，尝试在这里查找。希望有人能帮我

这里还有我通过record imacros创建的脚本

VERSION BUILD=8871104 RECORDER=FX
SET !TIMEOUT_PAGE 20
SET !EXTRACT_TEST_POPUP NO
SET !ERRORIGNORE YES

TAB T=1
TAG POS={{!LOOP}} TYPE=A ATTR=HREF:/lawyers/* EXTRACT=HREF
TAB OPEN NEW
TAB T=2
URL GOTO={{!EXTRACT}}
WAIT SECONDS=2

'data text
SET !EXTRACT {{!URLCURRENT}}
TAG POS=1 TYPE=H1 ATTR=CLASS:gd_title EXTRACT=TXT
TAG POS=4 TYPE=SPAN ATTR=* EXTRACT=TXT
TAG POS=13 TYPE=DIV ATTR=* EXTRACT=TXT
TAG POS=15 TYPE=DIV ATTR=* EXTRACT=TXT
TAG POS=19 TYPE=DIV ATTR=* EXTRACT=TXT
TAG POS=20 TYPE=DIV ATTR=* EXTRACT=TXT
TAG POS=21 TYPE=DIV ATTR=* EXTRACT=TXT 
TAG POS=22 TYPE=DIV ATTR=* EXTRACT=TXT
TAG POS=23 TYPE=DIV ATTR=* EXTRACT=TXT
SAVEAS TYPE=EXTRACT FOLDER=* FILE=gibsondunn.csv

tab close
TAB T=1

非常感谢您的帮助。

在不使用JavaScript脚本接口的情况下，简化任务的最简单方法是不计算要提取的行数。下面是提示它的代码。在一个单独的.iim文件中写下这个宏，当然，在运行自己的宏之前，在max loop上手动输入获得的值

SET !EXTRACT_TEST_POPUP NO
URL GOTO=javascript:{var<SP>els=window.document.getElementsByTagName("td");var<SP>n=0;for(i=0;i<els.length;i++){if(els[i].className=="gd_nameColumnData")n++}n;}
URL GOTO=javascript:{window.history.back()}
TAG POS=1 TYPE=HTML ATTR=* EXTRACT=TXT
BACK
PROMPT {{!EXTRACT}}

SET！提取\u测试\u弹出窗口编号
URL GOTO=javascript:{varels=window.document.getElementsByTagName（“td”）；varn=0；for（i=0；i