使用python beautiful soup或html模块的电子邮件刮板

使用python beautiful soup或html模块的电子邮件刮板,python,html,web-scraping,gmail,Python,Html,Web Scraping,Gmail,目前,我正试图从我的房地产经纪人那里收集她发给我的房源信息。“我想只有房地产经纪人才能进入这个网站并过滤房屋,但当她把它发给我时,我可以看到房屋清单。” 我想知道是否可以创建一个python脚本:) 1) 打开Gmail 2) 在她的电子邮件上 3) 打开她的一封电子邮件 4) 点击链接 5) 将房屋数据刮取为CSV格式 我不确定这是否可行,我从来没有用python来刮网页。我可以看出第5步是可行的,但我如何执行第1步到第4步?是的,这是可能的,但您需要事先进行一些需求收集,以确定可以消除流程中

目前,我正试图从我的房地产经纪人那里收集她发给我的房源信息。“我想只有房地产经纪人才能进入这个网站并过滤房屋,但当她把它发给我时,我可以看到房屋清单。”

我想知道是否可以创建一个python脚本:)

1) 打开Gmail 2) 在她的电子邮件上 3) 打开她的一封电子邮件 4) 点击链接 5) 将房屋数据刮取为CSV格式


我不确定这是否可行,我从来没有用python来刮网页。我可以看出第5步是可行的,但我如何执行第1步到第4步?

是的,这是可能的,但您需要事先进行一些需求收集,以确定可以消除流程中的哪些部分。例如,如果您的房地产经纪人每次都向您发送相同的链接,您可以直接将该网址作为目标。例如,如果链接发生了更改,但按月份进行了参数化,则您可以在希望处理结果时每月调整网址

为了发出请求,我建议使用
requests
包和
bs4
(beautifulsoup4)来定位元素。对于创建CSV文件,您可以选择使用
CSV
,但如果您需要更特定于您的用例的内容,则有许多替代方案