如何使用R中的WikipediR包从Wikipedia页面获取数据?

如何使用R中的WikipediR包从Wikipedia页面获取数据?,r,api,mediawiki,R,Api,Mediawiki,我需要从多个Wikipedia页面中获取特定部分的数据。我如何使用WikipediR软件包做到这一点?还是有其他更好的选择。准确地说,我只需要所有页面中下面标记的部分 我怎么能得到这个?任何帮助都将不胜感激 关于你想要什么,你能再具体一点吗?这里有一个简单的方法可以从web导入数据,特别是从Wikipedia导入数据 library(rvest) scotusURL <- "https://en.wikipedia.org/wiki/List_of_Justices_of_the

我需要从多个Wikipedia页面中获取特定部分的数据。我如何使用WikipediR软件包做到这一点?还是有其他更好的选择。准确地说,我只需要所有页面中下面标记的部分


我怎么能得到这个?任何帮助都将不胜感激

关于你想要什么,你能再具体一点吗?这里有一个简单的方法可以从web导入数据,特别是从Wikipedia导入数据

library(rvest)    
scotusURL <- "https://en.wikipedia.org/wiki/List_of_Justices_of_the_Supreme_Court_of_the_United_States"

## ********************
## Option 1: Grab the tables from the page and use the html_table function to extract the tables you're interested in.

temp <- scotusURL %>% 
  html %>%
  html_nodes("table")

html_table(temp[1]) ## Just the "legend" table
html_table(temp[2]) ## THE MAIN TABLE
库(rvest)

scotusURL你能更具体一点你想要什么吗?这里有一个简单的方法可以从web导入数据,特别是从Wikipedia导入数据

library(rvest)    
scotusURL <- "https://en.wikipedia.org/wiki/List_of_Justices_of_the_Supreme_Court_of_the_United_States"

## ********************
## Option 1: Grab the tables from the page and use the html_table function to extract the tables you're interested in.

temp <- scotusURL %>% 
  html %>%
  html_nodes("table")

html_table(temp[1]) ## Just the "legend" table
html_table(temp[2]) ## THE MAIN TABLE
库(rvest)

到目前为止你试过什么了吗?你想要什么格式?我想表格的HTML代码不会有帮助…@tgr For me任何格式的数据都可以。我可以得到表格的HTML代码,但是必须非常仔细地清理数据…这意味着任何格式都不行。。。您也可以相对容易地获取模板值的wikitext,但它们本身可以是模板,并且并非所有值都来自显式参数。所以,也许描述一下你在寻找什么样的数据以及为了什么样的目标可以更容易地回答这个问题。到目前为止你尝试过什么吗?你想要什么格式?我想表格的HTML代码不会有帮助…@tgr For me任何格式的数据都可以。我可以得到表格的HTML代码,但是必须非常仔细地清理数据…这意味着任何格式都不行。。。您也可以相对容易地获取模板值的wikitext,但它们本身可以是模板,并且并非所有值都来自显式参数。所以,也许描述一下你在寻找什么样的数据以及你的目标会让回答这个问题变得更容易。