在R中自动过滤
studio和我有一个包含a列和b列的数据框在R中自动过滤,r,R,studio和我有一个包含a列和b列的数据框 a b EUR 1 SGD 2 AUD 3 CAD 4 JPY 5 HKD 6 现在数据总共只有6行,但在将来,它可能会像这样 a b EUR 1 SGD 2 AUD 3 CAD 4 JPY 5 HKD 6 NZD 7 因为数据每天都随一个新文件导入,所以我想自动
a b
EUR 1
SGD 2
AUD 3
CAD 4
JPY 5
HKD 6
现在数据总共只有6行,但在将来,它可能会像这样
a b
EUR 1
SGD 2
AUD 3
CAD 4
JPY 5
HKD 6
NZD 7
因为数据每天都随一个新文件导入,所以我想自动化,只选择带有“EUR”、“USD”、“NZD”的列。我的一个问题是,对于即将到来的数据帧,我不知道是否会有NZD、EUR或USD,所以我希望R扫描它,是否有相应的值。我会选择的
有人知道怎么做吗?这是base-R版本
df <- data.frame(
a = c("EUR", "SGD", "AUD", "CAD", "JPY", "HKD")
, b = c(1 , 2 , 3 , 4 , 5 , 6 )
)
df[df$a %in% c("EUR", "USD", "NZD"), ]
df您可以轻松地选择dplyr
方式:
yourdf%>%
过滤器(以%c(“欧元”、“美元”、“新西兰元”)表示的百分比)
这是dplyr
版本
library(dplyr)
df <- data.frame(
a = c("EUR", "SGD", "AUD", "CAD", "JPY", "HKD")
, b = c(1 , 2 , 3 , 4 , 5 , 6 )
)
df %>%
filter(a %in% c("EUR", "USD", "NZD"))
库(dplyr)
df%
过滤器(以%c(“欧元”、“美元”、“新西兰元”)表示的百分比)
当然可以。欢迎来到堆栈溢出。你能不能提供一个可复制的例子嗨,乔治,我还没有做任何代码。我可以在dplyr中执行过滤功能,但我不确定将来如何将其自动化“自动化”是什么意思?嘿,dplyr在很多方面帮助你。这里有一本超级好书,可以帮助你开始学习R:它在网上可以买到,而且写得很好试试看与@Andrea Dodet的答案有什么不同?我不明白。为什么我的答案在这里被否决了?你得到了否决票(在本例中是我的),因为它等于另一个答案,你也可以在上面编辑你的答案,而不是添加另一个答案。我没有看到另一个答案,当我写我的答案时-我认为这仍然没有理由否决它,但是如果你想知道区别:这个答案是可复制的,而另一个答案不是。我不想编辑我的另一个答案,因为它是不同的。