Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/75.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
是否有一个R函数,我可以从中获取数据集中特定列中的名称_R - Fatal编程技术网

是否有一个R函数,我可以从中获取数据集中特定列中的名称

是否有一个R函数,我可以从中获取数据集中特定列中的名称,r,R,编辑:在一个用户的帮助下,我可以使用“table(ArrestData$CHARGE)”,但是,由于有2400多个条目,许多条目被省略了。我正在寻找前5项费用,是否有代码?此外,我正在研究一个特定的议会区(这是另一个名为“城市议会区”的变量)。我想知道在一个特定的议会选区内,哪五项收费最高。有代码吗 谢谢你的帮助 原文如下 就像我如何使用“名称(MyData)”查看变量的名称一样,我想知道是否可以使用代码查看特定列的名称/响应/数据点 换句话说,我正在尝试查看特定数据列的行中的名称。我想看看累

编辑:在一个用户的帮助下,我可以使用“table(ArrestData$CHARGE)”,但是,由于有2400多个条目,许多条目被省略了。我正在寻找前5项费用,是否有代码?此外,我正在研究一个特定的议会区(这是另一个名为“城市议会区”的变量)。我想知道在一个特定的议会选区内,哪五项收费最高。有代码吗

谢谢你的帮助

原文如下


就像我如何使用“名称(MyData)”查看变量的名称一样,我想知道是否可以使用代码查看特定列的名称/响应/数据点

换句话说,我正在尝试查看特定数据列的行中的名称。我想看看累积使用了哪些名称

找到这个后,我想知道行中的每个名称被使用了多少次,是数字还是百分比。在此之后,我想看看在满足另一列/变量的数值的条件下,行中的每个名称被使用了多少次

道歉,如果这在任何方面是令人困惑的

为了进一步深入,我正在玩弄通过市长办公室网站获得的洛杉矶警方数据。从2017年到2018年,我试图了解第5区议会给出了哪些费用以及每个具体费用的金额。收费和市议会区是我所关注的两个变量


感谢所有帮助。

要获取所有不同的变量,您可以使用
unique
功能,如中所示:

> x <- c(1,1,2,3,3,4,5,5,5,6)
> unique(x)
[1] 1 2 3 4 5 6
第一行给出不同的值,第二行给出每个值的计数

编辑

这个编辑的目的是用我前面的例子回答你的第二个问题

为了查找变量的前五个重复次数最多的值,我们可以使用base
R
。为此,我首先从频率表中创建一个数据帧:

df <- as.data.frame(table(x))
但是,为了查找组内变量重复次数最多的前五个值,我们需要超出基本
R
。我将使用
dplyr
创建一个增强数据帧,其中包含感兴趣变量的每个值的频率,让它成为
count\u variable

library(dplyr)
x_or <- x %>% 
  group_by(group_variable, count_variable) %>% 
  summarise(freq=n())

chrisicool,但Chris应该使用
dput(head(df,n))
将样本数据添加到帖子中。Chris还应显示当前和预期输出。嗨,我如何才能做到这一点?对不起,我对这件事还不熟悉@Nelsongon您可以在R编辑器/控制台中执行此操作。将上行中的
df
替换为数据集的名称或最能代表数据的样本。然后选择n来决定足够再现性的行数。所以,我用R控制台做了这件事,我怎样才能和你们分享呢?此外,即使是w/20行,我也不能滚动太多。我应该把它减少到,也许,10吗?考虑到我从另一个用户那里得到的帮助,我还对原始帖子进行了编辑。所以,我只是通过“table(ArrestData$CHARGE)”尝试了你在回答的第二部分中提供的内容,但是,由于有2400多条条目,许多条目被省略了。我正在寻找前5项费用,你知道如何找到它们吗?此外,我正在研究一个特定的议会区(这是另一个名为“城市议会区”的变量)。我想知道在一个特定的议会选区内,哪五项收费最高。你知道这方面的代码吗?我编辑了我的第一个答案,试图加入你的新问题。
df[order(-df$Freq),]
library(dplyr)
x_or <- x %>% 
  group_by(group_variable, count_variable) %>% 
  summarise(freq=n())
x_or %>% 
  arrange(group_variable, count_variable, freq)