R中密码子使用表中最常用密码子的载体

R中密码子使用表中最常用密码子的载体,r,rstudio,R,Rstudio,我有一个密码子使用表()。我想生成一个最常用密码子的载体(每个氨基酸残基1个)。有20个自然产生的无氨酸+终止密码子(End),所以我的载体长度将是21。我尝试过使用grep,但它一次只需要一个模式,或者搜索所有没有帮助的模式。有没有避免循环的方法?以下是我认为您应该做的。您可以使用包XML读取数据,然后dplyr计算最大值 # load packages require(XML) require(dplyr) # read the table tt <- htmlParse('http:

我有一个密码子使用表()。我想生成一个最常用密码子的载体(每个氨基酸残基1个)。有20个自然产生的无氨酸+终止密码子(End),所以我的载体长度将是21。我尝试过使用grep,但它一次只需要一个模式,或者搜索所有没有帮助的模式。有没有避免循环的方法?

以下是我认为您应该做的。您可以使用包
XML
读取数据,然后
dplyr
计算最大值

# load packages
require(XML)
require(dplyr)
# read the table
tt <- htmlParse('http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=10029&aa=1&style=GCG')
df <- read.table(text=xpathSApply(tt, "//pre", xmlValue), 
                 header=TRUE, 
                 fill=TRUE)
# calculate the maximum codons by Amino Acid
df.max <- group_by(df, AmAcid) %.% 
  filter(Number==max(Number)) %.% 
  select(AmAcid, Codon)
#加载包
需要(XML)
需要(dplyr)
#阅读表格

tt您的输入数据是什么样子的?你已经知道正确的开放阅读框架了吗?请创建一个清晰显示一些示例输入和所需输出的页面。输入是我添加的网页。我基本上可以用数据生成一个文本文件,但网页会更好,因为切换到不同的密码子使用表意味着只需将不同的网址粘贴到解析器中。是的,这样就可以了。谢谢