R显示因子频率和总百分比的数据帧摘要

R显示因子频率和总百分比的数据帧摘要,r,R,我有一个R数据框“internet”,包含以下数据: > internet Time Domain Category File_Type 1 1.9 google.com News_Media html 2 2.0 google.com News_Media css 3 2.0 google.com News_Media jpg 4 2.1 google.com News_Media j

我有一个R数据框“internet”,包含以下数据:

> internet Time Domain Category File_Type 1 1.9 google.com News_Media html 2 2.0 google.com News_Media css 3 2.0 google.com News_Media jpg 4 2.1 google.com News_Media jpg 5 4.0 facebook.com Social html 6 4.0 facebook.com Social jpg 7 4.1 facebook.com Social css 8 5.9 bbc.co.uk News_Media html 9 6.0 bbc.co.uk News_Media css 10 6.0 bbc.co.uk News_Media jpg 11 6.1 bbc.co.uk News_Media jpg 12 6.0 facebook.com Social html 13 6.0 facebook.com Social jpg 14 6.1 facebook.com Social css >互联网 时域类别文件类型 1.1.9 google.com新闻和媒体html 2.0 google.com新闻和媒体css 3.2.0 google.com新闻与媒体jpg 4.2.1 google.com新闻与媒体jpg 5.4.0 facebook.com社交html 6.4.0 facebook.com社交jpg 7.4.1 facebook.com社交css 8.5.9 bbc.co.uk新闻\媒体html 9.6.0 bbc.co.uk新闻和媒体css 10 6.0 bbc.co.uk新闻和媒体jpg 11.6.1 bbc.co.uk新闻与媒体jpg 12.6.0 facebook.com社交html 13.6.0 facebook.com社交jpg 14.6.1 facebook.com社交css 我想对这些数据进行如下总结,尽管我正在努力找到正确的方法

Domain Frequency Total Percentage bbc.co.uk 4 28.57143 facebook.com 6 42.85714 google.com 4 28.57143 域频率总百分比 bbc.co.uk 4 28.57143 facebook.com 6 42.85714 google.com 4 28.57143 我能够使用以下方法生成域因子:


域如果你安装了这个包,你可以用它来获得它。考虑:

proxy <- read.table(text="Row   Time       Domain    Category File_Type
1   1.9   google.com  News_Media      html
2   2.0   google.com  News_Media       css
3   2.0   google.com  News_Media       jpg
4   2.1   google.com  News_Media       jpg
5   4.0 facebook.com      Social      html
6   4.0 facebook.com      Social       jpg
7   4.1 facebook.com      Social       css
8   5.9    bbc.co.uk  News_Media      html
9   6.0    bbc.co.uk  News_Media       css
10  6.0    bbc.co.uk  News_Media       jpg
11  6.1    bbc.co.uk  News_Media       jpg
12  6.0 facebook.com      Social      html
13  6.0 facebook.com      Social       jpg
14  6.1 facebook.com      Social       css", header=T)

library(epicalc)
codebook(proxy)
... (output skipped)
================== 
Domain    :       
             Frequency Percent
bbc.co.uk            4    28.6
facebook.com         6    42.9
google.com           4    28.6
... (output skipped)
proxy这个怎么办:

multi.fun <- function(x) {cbind(freq = table(x), percentage = prop.table(table(x))*100)}
multi.fun(proxy$Domain)

multi.fun马丁的答案正是我想要的。以下略有更改,格式为可读性百分比

multi.fun <- function(x) {
 cbind(freq = table(x), 
 percentage = round(prop.table(table(x))*100, 2))
}
multi.fun(proxy$Domain)

multi.fun谢谢你的帮助@gung!谢谢你的回复!epicalc看起来像一个非常有用的库!看起来该库已从CRAN存储库中删除。