Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/67.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
很难理解如何进行此练习#R scraping#提取web数据_R_Dataframe_Screen Scraping - Fatal编程技术网

很难理解如何进行此练习#R scraping#提取web数据

很难理解如何进行此练习#R scraping#提取web数据,r,dataframe,screen-scraping,R,Dataframe,Screen Scraping,因此,有时我需要从网络上获取一些数据,将其组织成一个数据框架,并浪费大量时间手动执行。我一直在试图找出如何优化这个过程,我也尝试过一些R刮削方法,但做不好,我想可能有更简单的方法,有人能帮我吗 虚构的练习: 这是一个按大陆列出的国家的网页: 每个国家名称也是指向另一个网页的链接(例如,每个国家的特定网页) 作为最终结果,我希望得到一个数据框架,其中观察数(行)=列出的国家数和4个变量(列),ID=国家名称,大陆=其所属大陆,语言=官方语言(来自国家的特定网页)和人口=最新人口计数(来自国家的特定

因此,有时我需要从网络上获取一些数据,将其组织成一个数据框架,并浪费大量时间手动执行。我一直在试图找出如何优化这个过程,我也尝试过一些R刮削方法,但做不好,我想可能有更简单的方法,有人能帮我吗

虚构的练习:

这是一个按大陆列出的国家的网页:

每个国家名称也是指向另一个网页的链接(例如,每个国家的特定网页)

作为最终结果,我希望得到一个数据框架,其中观察数(行)=列出的国家数和4个变量(列),ID=国家名称,大陆=其所属大陆,语言=官方语言(来自国家的特定网页)和人口=最新人口计数(来自国家的特定网页)

在R中我应该遵循哪些步骤才能到达最终的数据帧?

。您需要在下载所需内容后,使用不同的节点,并可能执行一些字符串操作(清理)