Python 如何在R中刮取多个表?
说到R,我是一个“新手”,但我真的很想知道如何从一个网站上抓取多个表(我不知道表的尺寸),比如: (具体来说,python中的代码如下所示:Python 如何在R中刮取多个表?,python,r,web-scraping,multiple-tables,Python,R,Web Scraping,Multiple Tables,说到R,我是一个“新手”,但我真的很想知道如何从一个网站上抓取多个表(我不知道表的尺寸),比如: (具体来说,python中的代码如下所示: from bs4 import BeautifulSoup import urllib2 url1 = "https://en.wikipedia.org/wiki/World_population" page = urllib2.urlopen(url1) soup = BeautifulSoup(page) table1 = soup.find(
from bs4 import BeautifulSoup
import urllib2
url1 = "https://en.wikipedia.org/wiki/World_population"
page = urllib2.urlopen(url1)
soup = BeautifulSoup(page)
table1 = soup.find("table", {'class' : 'wikitable sortable'})
trs = soup.find_all('tr')
tds = soup.find_all('td')
for row in trs:
for column in tds:
a = column.get_text().strip()
print a
break
在R中
u欢迎使用SO!对于R,在SO上有许多这样的示例。除非您有一些R代码表明它不起作用,否则这可能会被视为dup或“太宽”。
u <- "https://en.wikipedia.org/wiki/World_population" # input
library(XML)
b <- basename(u)
download.file(u, b)
L <- readHTMLTable(b)