Web scraping 网页抓取谷歌表单脚本
我正在尝试将基于列“A”的数据输入到列“B”中。如果“A”是一个网站URL的综合列表,那么是否可以运行一个脚本,从这些网站上刮取电话号码,然后输入到“B”列中Web scraping 网页抓取谷歌表单脚本,web-scraping,google-sheets,Web Scraping,Google Sheets,我正在尝试将基于列“A”的数据输入到列“B”中。如果“A”是一个网站URL的综合列表,那么是否可以运行一个脚本,从这些网站上刮取电话号码,然后输入到“B”列中 我是100%的脚本新手,但我很想了解它是如何工作的。假设A列中的每个单元格都是一个url,您肯定可以搜索电话号码 实现此目的的代码: 提取网页文本(假设电话号码不是链接或其他形式) 使用正则表达式搜索该文本中的电话号码 谢谢你的回复!IMPORTXML不提取页面的任何内容,也不允许我在C2中搜索电话号码。您使用的URL是什么?(它可
我是100%的脚本新手,但我很想了解它是如何工作的。假设A列
中的每个单元格都是一个url,您肯定可以搜索电话号码
实现此目的的代码:
- 提取网页文本(假设电话号码不是链接或其他形式)
- 使用正则表达式搜索该文本中的电话号码
谢谢你的回复!IMPORTXML不提取页面的任何内容,也不允许我在C2中搜索电话号码。您使用的URL是什么?(它可能对机器人有一些保护…)
B2: =JOIN("|",IMPORTXML(A2,"//a/@href"))
C2: =REGEXEXTRACT(B2,"[0-9]{3}[- ]*[0-9]{3}[- ]*[0-9]{4}")