Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/66.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 2.15.3的R包中的searchTwitter()。大量重复_R_Twitter_Duplicates - Fatal编程技术网

R 2.15.3的R包中的searchTwitter()。大量重复

R 2.15.3的R包中的searchTwitter()。大量重复,r,twitter,duplicates,R,Twitter,Duplicates,从searchTwitter输出中删除重复项效果很好,问题是searchTwitter()函数提供的原始tweet数量始终为100,无论n=1000还是n=3000 这是我使用的代码: tweets <- searchTwitter("#rstats", n = 1000) tweets.df <- do.call("rbind", lapply(tweets, as.data.frame)) df.undup <- tweets.df[duplicated(tweets.d

从searchTwitter输出中删除重复项效果很好,问题是searchTwitter()函数提供的原始tweet数量始终为100,无论n=1000还是n=3000

这是我使用的代码:

tweets <- searchTwitter("#rstats", n = 1000)
tweets.df <- do.call("rbind", lapply(tweets, as.data.frame))

df.undup <- tweets.df[duplicated(tweets.df) == FALSE,] 
dim(df.undup)
我的问题是:这是否与twitterapi有关,以及我如何解决这个问题


我在Mac OS X 10.7.5上使用的是R版本2.15.3

不幸的是,目前可用的
twitteR
软件包无法正常工作。你可以从Geoff Jentry的网页上获取最新版本,这些版本似乎比CRAN上的版本工作得更好

它需要ROAuth 0.9.4(也未在CRAN上更新)

我有一种感觉,除非您可以编译包(即,除非您不需要二进制包),否则您可能很难在MacOSX上使用它


我在这些新版本中仍然受到欺骗,但没有那么多。

我已经设法安装了这些软件包。以下是我使用的代码,以防有人感兴趣。但问题依然存在,最初的推文仍然只有100条

我想知道为什么我们在重复方面得到了不同的结果

install.packages("~/Downloads/ROAuth_0.9.4.tar.gz",
             repos=NULL,type="source",
             INSTALL_opts="--no-multiarch")

install.packages("~/Downloads/twitteR_1.1.5.tar.gz",
             repos=NULL,type="source",
             INSTALL_opts="--no-multiarch")

library(twitteR)
library(ROAuth)

tweets <- searchTwitter("#rstats", n = 1000)
tweets.df <- do.call("rbind", lapply(tweets, as.data.frame))

df.undup <- tweets.df[duplicated(tweets.df) == FALSE,]
dim(df.undup)

dim(df.undup)
[1] 100  12
install.packages(“~/Downloads/ROAuth_0.9.4.tar.gz”,
repos=NULL,type=“source”,
安装_opts=“--无多拱”)
install.packages(“~/Downloads/twitteR_1.1.5.tar.gz”,
repos=NULL,type=“source”,
安装_opts=“--无多拱”)
图书馆(推特)
图书馆(ROAuth)

tweets自从API转换后,我也遇到了类似的问题,但没有时间调试,所以我暂时改用Python(非常类似的步骤/过程)。我相当肯定它与API有关。(在10.8.3 btw上使用2.15.3)。我想他们在dev中解决了这个问题(看看()这真的是完整的代码吗?你不需要初始化ROAuth吗?使用这个确切的命令:
searchTwitter(#rstats,n=1000)
我收到了706条独特的推文(美国东部时间上午10点)。我已经完成了ROAuth步骤,否则我不会从搜索中得到任何结果。您使用的是什么版本的R,您是否也使用OS x?这似乎会有所不同。R版本2.15.3(2013-03-01);平台:x86_64-pc-linux-gnu(64位)。我稍后会在我的mac上试一试,并报告结果。那太好了!谢谢!新版本已经发布,运行良好!安装。软件包(“~/Downloads/twitteR\u 1.1.5.tar.gz”,repos=NULL,type=“source”,install\u opts=“--no-multiarch”)
install.packages("~/Downloads/ROAuth_0.9.4.tar.gz",
             repos=NULL,type="source",
             INSTALL_opts="--no-multiarch")

install.packages("~/Downloads/twitteR_1.1.5.tar.gz",
             repos=NULL,type="source",
             INSTALL_opts="--no-multiarch")

library(twitteR)
library(ROAuth)

tweets <- searchTwitter("#rstats", n = 1000)
tweets.df <- do.call("rbind", lapply(tweets, as.data.frame))

df.undup <- tweets.df[duplicated(tweets.df) == FALSE,]
dim(df.undup)

dim(df.undup)
[1] 100  12