Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/358.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/search/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
PHP简单HTML DOM或Python BSoup:哪种方法更简单?_Php_Python_Perl_Parsing_Lwp - Fatal编程技术网

PHP简单HTML DOM或Python BSoup:哪种方法更简单?

PHP简单HTML DOM或Python BSoup:哪种方法更简单?,php,python,perl,parsing,lwp,Php,Python,Perl,Parsing,Lwp,我目前正在研究一种解析包含欧洲基金会数据的网站的方法 它拥有790个基础数据集。所有数据都是免费使用的,没有版权限制 目标是什么:我想解析数据并将其保存在本地:为了更好的检索和更方便的使用方式:也许可以将其存储到Calc/或更好的MySQL数据库中 问:用Perl解析HTML最简单的方法是什么 我应该使用LWP还是Mechanize:哪种方法更简单 一些朋友让我试试Python!?好汤。我考虑了一种使用Perl LWP或Python Beautiful Soup的方法。我看不到解析这样一个站点的

我目前正在研究一种解析包含欧洲基金会数据的网站的方法

它拥有790个基础数据集。所有数据都是免费使用的,没有版权限制

目标是什么:我想解析数据并将其保存在本地:为了更好的检索和更方便的使用方式:也许可以将其存储到Calc/或更好的MySQL数据库中

问:用Perl解析HTML最简单的方法是什么 我应该使用LWP还是Mechanize:哪种方法更简单

一些朋友让我试试Python!?好汤。我考虑了一种使用Perl LWP或Python Beautiful Soup的方法。我看不到解析这样一个站点的其他方法。好的,有一种方法-使用PHP。当然,我们可以使用PHP(和Curl)

哪种方法是最好的。Perl与LWP还是Mechanize?还是Python的那个

除了语言问题:有人能在第一步帮助我吗?-帮助我走上正轨!?我期待着收到你的来信

问候

我的两分钱是你必须根据你最熟悉的语言来选择。如果我是的话,我会使用Python,它有很多库和工具,可能需要几个小时的工作


但是,如果您精通Perl或PHP,则必须选择其中一种语言。大多数脚本语言都有可以完成此任务的库。

您擅长哪些方面?PHP还是Python?当然,在这类事情上,会有更多的比较讨论,但我们不要谈这个。去选择一个你更了解的。可以说Perl,甚至Python,或者PHP,但它们都有自己的优势。最后,你将是编码它的人,所以选择你更了解的

所有数据都是免费使用的,没有版权限制

我不会那么肯定。他们正在千方百计混淆联系人数据,以便“数据不能存储在表格中以生成邮件列表”。基础的细节不是HTML,而是图像。此外,它们将搜索结果限制为最多100个。如果您懂德语,您应该阅读Informationen中的“Daten Schutz”(数据保护)部分


如果您只想将基金会的名称链接到该网站允许您使用的搜索条件,那么请查看其他人的答案。如果您确实希望存储详细信息,那么您将违反网站的意图,并且需要咨询律师,了解他们的陈述是否具有法律价值。此外,您还需要将图像还原为可用数据。

以下哪种语言是您最流利的语言?从绝对意义上讲,可能Perl最适合这项任务,但如果您对PHP最熟悉,那么这最终会更重要。如果您擅长PHP,我建议您将PHP的DOM类与XPath结合使用。这相当简单。嗨,施瓦茨,你好,泰语-非常感谢你的快速回答。我对PHP有点熟悉,所以我想我必须走PHP的路。这些想法很好,但我不知道我能自己完成所有的工作。泰语-您是否可以通过一些代码片段提供支持,以简要了解如何加快PHP的运行速度!?我喜欢听到youthx的想法和建议。。。我试着去做/走php的路…任何一个想伸出援手的人…thx的回答-好吧,php似乎是这里最熟悉的东西。我猜整个事情都在我头上。我会尽我所能。。。。再次感谢thx Ramdaz回答得如此之快thx感谢答案:据我所知,该网站及其理念:它正在全力支持philantrophy:因此他们希望分享想法/知识,并希望将寻找信息的ppl整合在一起。顺便说一句:我不想复制数据并在第二个网站上提供它们;不结论:我很确定我不反对任何关于费兰特里的想法或关于这个网站的想法。。。。