Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/email/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 从不同网站收集大量信息的最有效方法_Python - Fatal编程技术网

Python 从不同网站收集大量信息的最有效方法

Python 从不同网站收集大量信息的最有效方法,python,Python,我的问题是在工作中,我必须点击一个网站的链接,然后将公司名称、公司电话号码和公司地址复制到excel电子表格中,每一个都在不同的列中。这些信息在每个网站上都放在同一个地方,而且非常耗时,因为我必须单击每个链接,然后复制并粘贴信息 我了解Python编程语言,我只是想知道最好的方法是使用该语言搜索网站的源代码,只留下相关信息,还是使用另一种编程语言。另外,有没有关于图书馆的建议可以参考 您可以与requests/urllib结合使用,以获取和解析网站的源代码 然后,您可以使用将数据写入Excel电

我的问题是在工作中,我必须点击一个网站的链接,然后将公司名称、公司电话号码和公司地址复制到excel电子表格中,每一个都在不同的列中。这些信息在每个网站上都放在同一个地方,而且非常耗时,因为我必须单击每个链接,然后复制并粘贴信息

我了解Python编程语言,我只是想知道最好的方法是使用该语言搜索网站的源代码,只留下相关信息,还是使用另一种编程语言。另外,有没有关于图书馆的建议可以参考

您可以与requests/urllib结合使用,以获取和解析网站的源代码


然后,您可以使用将数据写入Excel电子表格。

我以前在这类工作中使用过Beautiful Soup Python库。它以一种方式组织所有HTML代码,您可以轻松地从中提取您想要的任何数据。您可以在这里看到一个示例:

非常感谢!我现在就去调查DIf如果您需要任何帮助,请随时回复,我会尽快回复您!谢谢,谢谢!在接下来的几天里,我将进行一次尝试,我相信你会收到我的来信:)@tompitts好的!如果到目前为止我帮了忙,请随意将此标记为答案,因为它确实帮助了我:)似乎无法访问该链接:/你确定它是对的吗?我只是再次单击它,我能够看到它。您还可以搜索“美丽的汤文档”