R_IT技术博客_编程技术问答 - 「Fatal编程技术网」

在R中创建索引变量

标签： R

我有下表： #Rainfall(PCP-minimum) #Rainfall(PCP-maximum) #Rainfall_index(DRI) 0 - 4.9 0 5 - 9.9 1 10 - 14.9

我试着写一个包含循环的短程序，结果卡住了。我的代码：我想使用泊松生成模拟，然后在我的例子中为下一个级别的基础选择值。我的选择标准是0.5%。若屏幕返回的值为4，我将生成4个介于0和1之间的随机编号。其中，我将计算值小于或等于0的数量。5并将其置于基线。其余的将交给旧金山。我需要把它放在一个循环中，这样我会得到一个包含Screen、Base和SF列的表，当基线中的值的累积和达到100时，这将停止。因此，我希望屏幕继续生成值，直到Base达到100。列Base的值之和应正好为100。您可以将代码

R 绘制纽约市花旗自行车数据，地图上未显示Lat和Long

标签： R Plot

我正试图在纽约市地图的顶部绘制纽约市花旗自行车站的数据我从以下位置下载了zipcode数据：以下是我所做的： > bike.loc<-bike.train > nyc.zip<-readShapePoly("nyc_zipcta.shp") > coordinates(bike.loc)<-c("start.station.id","end.station.id") > class(bike.loc) [1] "SpatialPointsDat

data.frame R中的置换组

标签： R permutationsample

我有这样一个data.frame： DqStr <- "Group q Dq SD.Dq 1 -3.0 0.7351 0.0067 1 -2.5 0.6995 0.0078 1 -2.0 0.6538 0.0093 2 -3.0 0.7203 0.0081 2 -2.5 0.6829 0.0094 2 -2.0 0.6350 0.0112" Dq1 <- read.table(textConnection(DqStr), header=TRUE) Dq

R 不同的情节有不同的主文本

标签： R Plot

我经常在R中创建函数，以绘制一个图。很多时候，我通过改变其中一个参数（如期望值或标准偏差）来绘制不同的图。我这样做是为了比较情节我真的希望R改变绘图上的主文本，因为它对函数中的其他参数很敏感例如： QQplot <- function(samples, mu, sigma){ X<- rnorm(samples, mu, sigma) Y<- rlnorm(samples, mu, sigma) plot(sort(X), sort(Y), main=????)

R ggplot-使用数值填充堆叠条形图

标签： R ggplot2

我想构建一个堆叠条形图，在字段fill中提供数值，而不是类别这是我目前的图表：对于堆叠条形图，字段fill对应于diamonds数据集的列cut。此列对应于： > class(diamonds$cut) [1] "ordered" "factor" 因此，我认为不同术语的频率不同 > head(diamonds$cut) [1] Ideal Premium Good Premium Good Very Good Levels: Fair

R Shinny-如何将tableOutput用作vector或data.frame

标签： R Shiny

问候并感谢您的帮助我无法在ui.R中使用data.frame（在server.R上创建）。原因很明显：tableOutput（）既不是data.frame，也不是向量。我之所以需要这样做，是因为selectInput（“ops”，…）从server.R接收该表，因为它是应用于那里的输入的函数的结果。函数很长，所以我刚刚制作了这个data.frame（c（1,2），c（3,4），c（5,6））。无论如何，这一点是相同的问题: 即使我知道为什么它不起作用，我也不能使它起作用。我要寻找的是

在R中旋转名义数据

标签： R

我在R中有一个数据帧，需要对其进行操作（pivot）。在最简单的级别上，前几行如下所示： Batch Unit Success InputGrouping 1 1 1 A 2 5 1 B 3 4 0 C 1 1 1 D 2 5 1 A 我希望透视此数据，以便列名为InputGrouping，如果存在，则值为1，如果不存在，则值为0。

R 从字符中提取数字部分

标签： R String Character Encoding

我使用read.table读取UTF-8编码的csv文件，其中一列显示为： [1] 16渭g/m鲁 15渭g/m鲁 14渭g/m鲁 15渭g/m鲁 12渭g/m鲁 16渭g/m鲁 [7] 12渭g/m鲁 15渭g/m鲁 11渭g/m鲁 15渭g/m鲁 12渭g/m鲁 15渭g/m鲁 16ug/m3 在我使用as.character将此列转换为字符并查看它们之后，它显示为： [1] 16渭g/m鲁 15渭g/m鲁 14渭g/m鲁 15渭g/m鲁 12渭g/m鲁 16渭g/m鲁 [7] 12渭

从data.frame获取相应的值

标签： R Dataframe

我的问题是，我无法用文字表达我的问题，这使得谷歌很难找到它，所以我不得不问你。我希望你能阐明我的问题：我得到了这样一个数据帧： 6 4 5 2 3 6 0 7 0 2 1 3 6 0 1 1 正如您所注意到的，在第一列中，我得到了重复两次的0，1两次，如此类推。我想做的是在第二列（本例中为7和2）中获取一个数字的所有对应值，比如0。最好是在data.frame中我知道尝试使用df$V2[which（df$V1==0）]，但是由于第一列可能有100多行，我不能真正使用它。你们有好办法吗关于

R：根据第二个数据帧中的引用ID减去一个数据帧中的值

标签： R Dataframe

我一直在努力寻找答案，并多次试图找到实现我追求的目标的方法。我有两个XTS数据帧：1.）帐户数据2.）参考数据。以下是一些示例数据（注意：示例数据不是XTS格式，但相同的想法适用）： df2包含我需要从帐户中减去的数据（引用ID作为列名）： df3是一个表，我可以从中确定df2引用中的哪一列将df1转换为df1-df2之间的差异问题是我有大约200个帐户和1200个参考ID本质上，我想创建一个新的数据帧，它是df1中的每一列减去df2中相应的refID的结果。是df1[as.character

R 从一定范围内的分布中抽取随机数

标签： R Random distribution

我想从一系列分布中提取一些随机变量。但是，返回的值必须不高于某个阈值。假设我想使用伽马分布，阈值是10，我需要n=100个随机数。我现在想要100个介于0和10之间的随机数。（假设比例和形状为1。）获得100个随机变量显然很容易 rgamma(100, shape = 1, rate = 1) 但是我如何才能实现这些值从0到100的范围呢编辑让我的问题更清楚。绘制的100个值应在0和10之间缩放。因此，最高绘制值为10，最低绘制值为0。抱歉，如果这不清楚编辑第2条为了给我需要的随机

使用带有csv变量的tm pacake进行R文本挖掘

标签： R ggplot2text-miningtmcorpus

我正在完成一个项目，在这个项目中，我使用R来编写我的文本，并将其与其他变量进行比较。我是一个比较新的编程，所以任何帮助将不胜感激我有一个超过100个变量的csv文件，其中一个变量是一个充满文本的评论部分。我已设法清理了文件，并将该列作为语料库处理，删除了英文停止词、标点符号等。以下是代码，第一季度数据文件已读入： com <- read.csv("dataQ1", stringsAsFactors=TRUE) 现在，我想通过将其与csv文件中的另一个变量（如“总体满意度”）进行比较来探

在R中的clogit中创建空模型

标签： R nullcrash

每次我试图为我的条件逻辑回归创建一个空模型时，R崩溃以下是Matt O'Brian的一篇帖子，他也有这个问题，但从未注意到它是如何修复的：有什么建议吗？有人吗？简而言之，您不应该创建空模型。旧版本的R或生存包允许您这样做，但它们是无效的

R中与之对应的组

标签： R group-bydplyr

尝试从数据集创建引用表以查找文档的当前状态。示例如下： Document<-c(1,1,1,1,2,2,2) change_date <- c("2015-01-01","2015-01-03","2015-01-05","2015-01-08","2015-01-05","2015-01-07","2015-01-20") status <- c("A","A","B","C","A","B","D") df<-data.frame(Document,change_da

R将日期从字符mmm dd，yyyy格式化为类日期

标签： R Date

我正在尝试从格式为mmm dd，yyyy的字符格式化日期我试过： date1 <- "Dec 05, 2016" date2 <- format(date1, format="%d %B %Y") class(date2) date2 date1我们可以转换为“Date”类，然后转换为感兴趣的格式 format(as.Date(date1, "%b %d, %Y"), "%d %B %Y") #[1] "05 December 2016" 首先，您需要转换为Date类，即格

R列表中的宽到长格式：三维到二维数组，第三维作为ID

标签： R Matlab reshape2tidyr

我导入了一个*.mat数据集的ECG数据，结果是一个嵌套在1:19、1:2000、1:45维度列表中的数组我想将此数组转换为长格式的data.table，其中每个1:45都是“id”。我喜欢Reformae2和tidyr的外观，但当涉及“列表”时，我看不到一种简单的方法。有什么想法吗新增：如下图所示：编辑：从ECGa添加dput 我试过做： ECGa我认为您可以不使用abind，可能简单到： Reduce(rbind, sapply(1:dim(df)[3], function(i) {

R 拆下'；日期'；具有任何'的行；NA'；在'；价值'；柱

标签： R Dataframe missing-data

我有一个包含多个时间序列的数据帧。我想删除日期中具有NA值的所有数据数据框如下所示： Date Time Value 1/1/2014 0:00 30 1/1/2014 1:00 20 1/1/2014 2:00 12 1/1/2014 3:00 NA . . . 1/1/2014 23:00 23 2/1/2014 0:00 12 2/1/2014 1:00

R 删除前几行并将标题名称更改为行值

标签： R

我有一个数据框，它的列名由R指定 Col1 Col2 Col3 NA NA ABC NA NA XYZ Name1 Name2 Name3 Joe Paul Ross 我想删除前3行，包括由R分配的Col Numbers头，并使Name1、Name2、name3成为dataframe中列的头名称为了删除这些行，我尝试使用tail（df，-3）。。但它不会删除列号行，也不会删除您需要的“我的名字”行 names(df) <- df[3

R 将数据帧转换为表时出错

标签： R

我想加入一个多数据框，这样我就可以在一个图中创建一个多箱线图。然而，我的数据有不同的格式，我需要转换成表，然后我将使用“左连接”和“熔化”函数，然后再打印。我收到一个错误“alloc.col（ans）中出错：找不到对象'Csetmutable'，无法找到修复它的方法。请告诉我是否有其他方法可以在不转换为表格的情况下进行绘图。谢谢你的帮助 library("reshape2") library("ggplot2") library("dplyr") library(data.table) df&

R 从交互式代理TWS下载数据

标签： R Api quantmodyahoo-financeinteractive-brokers

我一直在和互动经纪人TWS和R打交道，并取得了不同程度的成功 library(IBrokers) IBConn <- twsConnect(port = xxxx) currency_df = twsCurrency("NZD",currency = "USD") test = reqHistoricalData(IBConn, Contract = currency_df, whatToShow ='BID_ASK', useRTH = "0", barSize = '1 min', d

R 如何从每个块中减去特定区域

标签： R Dataframe

我有一个包含多个列的数据 df<- structure(list(X1 = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L), X2

在函数内部运行时，lmer返回错误

标签： R Function lme4

我试图在所选变量上建立一个适合混合模型的函数如果在函数中运行此命令： lme4::lmer(VAR ~ cVAR + (1|ID), data=df) 我得到一个错误： Error in model.frame.default(data = df, drop.unused.levels = TRUE, formula = VAR ~ : variable lengths differ (found for 'ID') 我已经用几种方法测试了我的代码，但我就是找不出哪里出了问题。我

R 获取数据集的一半值

标签： R

我提前道歉这是我的第一篇帖子我有以下数据集。我想获得船只达到其最大速度一半的时间（例如船只1 6秒，船只2 4秒）。我有20种不同的船只来获得其半速时间值。非常感谢 vessel time speed vessel1 1 6 vessel1 2 7 vessel1 3 10 vessel1 4 16 vessel1 5 18 vessel1 6 20 vessel1 7 22 vessel1 8 24 vessel1 9 36 vessel1 10

R 从web访问日志中的请求提取训练集和测试集

标签： R dplyr

我有这个DF：- df = structure(list(session_id = c(1105L, 1105L, 1105L, 1107L, 1107L, 1107L, 1108L, 1108L, 1108L, 1109L, 1109L, 1109L, 1110L, 1110L, 1110L, 1111L, 1111L, 1111L, 1111L, 1112L, 1112L, 1112L, 1112L, 1114L, 1114L, 1114L, 1114L), datetime = st

R-将data.frame中多列的值匹配到查找表

标签： R dplyrpurrr

目标：我想将t1和t2中的值从dfdata转换为查找表lookup中的其他值（PWT）。我已经看过一些关于如何对单个列执行此操作的教程，但我想以编程方式对数据中无限数量的t列（例如t1、t2、t3、t4、t5等）执行此操作查找 # A tibble: 6 x 4 (HEAD) Response `Final Fil.` Adjustment PWT <chr> <dbl> <dbl> <db

下料优化：在R中找到所有可能的组合

标签： R

我正在研究如上所述的下料问题。现在问题的出发点是，他们说对于给定的可能切割，即14,31,36,45，长度为100的木板可以切割成37种可能的模式。一种模式可以是1,0,1,1，而另一种模式可以是1,1,0,1或0,0,0,2等。是否有一种现有的算法可用于R中，该算法将列出给定的所有尺寸和单个切割的所有可能组合。在这种情况下37这是一种蛮力方法。创建一个向量，该向量具有每个切割的最大值。然后创建一个可能性网格。然后在网格上对切割进行矩阵乘法，以获得组合的总长度-任何小于或等于lteq 100的都

R 公共水管工遥控器

标签： R Server remote-accessplumber

根据文档，它说如果我们使用plumber$run（），它只会在本地运行localhost:8000。我想把它发布到远程服务器上。如何使用管道工软件包启动远程API？请参阅run（）上的host参数。e、 g.$run（host=“0.0.0.0”）谢谢。这里也解释了原因：

绘图大小=1/{N∗⌈log2N⌉∗[（1/70）/60]}在R？

标签： R Plot logarithm

大小=1/{N∗⌈log_2N⌉∗[1/70/60]} 如何用R绘制此函数 ⌈⌉= 细胞例如： y轴的标签尺寸为N，x轴的标签尺寸为N N>=2，N是自然数2,3,4,5,6，…让我们定义函数 f <- function(N) 1 / (N * ceiling(log2(N)) * 1/70/60) 使用范围为[1,20]的ggplot2进行打印曲线1/x*天花板log2x*1/70/60？可能的副本不是真的。。。因为这不是一个简单的函数：/I我画了一个例子-见上文。。。应该是这样

从HTML文本（嵌套在shinyServer中）链接到特定的闪亮选项卡面板（在shinyUI中）

标签： R Shiny

我正在寻找一种从HTML文本（嵌套在服务器部件中）链接到特定闪亮选项卡面板（嵌套在UI中）的方法。假设我们有以下应用程序： library(shiny) shinyUI(fluidPage( sidebarLayout( mainPanel( tabsetPanel( type="tabs", tabPanel("Contents", htmlOutput("contents")), tabPanel("Plot", pl

R 国际单项体育联合会声明和日期

标签： R Date If Statement

我试图实现的是分配一个新列，其中包含一个随时间变化的变量。这只是其中的一个正在改变，所以我想做的是在日期之后，如果是22，则改为40 我目前有一段代码不能正常工作 Idea: if(lst$taskDate <= as.Date("2018-11-18")){ t2$Budget <- case_when( t2$taskStaffName == "L" ~ 20, t2$taskStaffName == "J" ~ 22,

在data.frame中将列表定义为观察值的便捷方法

标签： R List

有没有办法将列表定义为循环内的观察？例如，只要data.frame的另一个观测值满足某个条件，我就可以运行下面的代码，将每个列表替换为观测值，如下面的代码所示，但在运行循环之前，我需要将列表创建为一组空列表。另外，我还没有弄清楚如何将列表放在创建data.frame的行中-有没有办法做到这一点这是代码： #line that creates the data.frame: I wished to know how to place the list #(at the line after c

每个单元格具有多个匹配项的Vlookup的R版本

标签： R matchvlookup

我有一个带数字的向量和一个查找表。我想用查找表中的描述替换数字当向量是直接向前的时，这很容易，例如： > variable <- sample(1:5, 10, replace=T) > variable [1] 5 4 5 3 2 3 2 3 5 2 > > lookup <- data.frame(var = 1:5, description=LETTERS[1:5]) > lookup var description 1 1

R 按组id合并两个不同长度的数据帧

标签： R Merge

我正在尝试按组id合并两个数据帧。但是，两个数据帧的长度不同，并且在第二个数据帧中缺少某些组的某些元素。在合并的文件中，某个组缺少的元素应该是NAs 数据看起来像这样 df1 <- data.frame(id = c(1,1,1,2,3,3,4), x = c("a", "b", "c", "d", "e", "f", "g")) df2 <- data.frame(id = c(1,1,2,3,4), y = c("A", "B", "D", "E", "G")) df1此数据。

R 如何将cat的输出作为字符串而不是打印它？

标签： R

我正在寻找一种将cat（）命令的输出作为字符串获取的方法（而不是将其打印到屏幕上）。我原以为paste（）可以做到这一点，但有区别： > cat("A", c(1,2,3), sep=",") A,1,2,3 > paste("A", c(1,2,3), sep=",") [1] "A,1" "A,2" "A,3" > paste("A", c(1,2,3), collapse=",") [1] "A 1,A 2,A 3" 是否有一个函数可以获取cat（）将要打印的内容？如果

如何使R中naiveBayes（）的公式参数泛型？

标签： R classificationnaivebayes

使用库“e1071”的函数naiveBayes（）时，需要插入以下类型的公式： myFormula <- myClass~ feature1 + feature2 + feature3 myFormula您可以使用动态引用所有其他列 myFormula <- cyl ~ . naiveBayes(myFormula, data = mtcars) Call: naiveBayes.default(x = X, y = Y, laplace = laplace) A-

是什么使得使用rvest软件包进行桌面web清理有时会失败？

标签： R Web Scraping rvest

我在玩这个软件包，试图弄明白为什么有时候它不能刮到那些看起来像桌子的东西例如，考虑这样一个脚本： require(rvest) url <- "http://bigcharts.marketwatch.com/quickchart/options.asp?symb=SPY" population <- url %>% xml2::read_html() %>% html_nodes(xpath='//*[@id="options"]/table/tbody/tr

R 基于date.times连接数据帧

标签： R Join Merge

我想合并两个数据集。第一个数据集包含特定时间仪器中CO2浓度的信息。第二个数据集包含测量何时开始和结束的信息我希望将这两个数据帧组合在一起，以便来自数据集1的时间在数据集2中的时间间隔（开始日期时间到结束日期时间）内结束在同一行上。这一点没有很好的解释，因此更容易查看下面的数据我是R的新手，因此，非常感谢您的帮助数据看起来与下图所示相似 Data set 1 co2 date_time 0.2 2012-05-01 10:2

如何选择在R中的数据表列中只出现一次的值？

标签： R

就像标题一样，这个问题非常简单。请原谅我的无知我在数据表中有一个列，字符类型。并且存储了多个不同的单词/值，其中一些只出现一次，另一些出现多次我如何选择只出现一次的项目？？感谢您的帮助！谢谢大家! 一个选项是执行分组，然后选择具有单行的组 library(data.table) dt1 <- dt[, .SD[.N == 1], .(col)] 图书馆弹琴 df%>% 分组按列%>% dplyr:：filtern==1%>% 解组例如： data = tibble(text

将命名向量添加到R中的向量列表中

标签： R List Function Loops lapply

我有一个名为AA、BB和CC的3个向量的列表。我想向这3个向量中的每一个添加一个名为H的新命名元素，它将显示为H=some number 以下是我尝试过但没有成功的方法： L <- list(AA = c(K = 2225, M = 39911), BB = c(K = 5456, M = 65533), CC = c(K = 15274, M = 48877)) L[[1]]$H <- H = 25 L[[2]]$H <- H = 23 L[[3]]$H <- H =

R 重新编码离散变量

标签： R dplyrrecode

我有一个离散变量，分数在1-3之间。我想把它改成1=2，2=1，3=3 我试过了重新编码（数据$GEB43，“c（1=2；2=1；3=3”）但这不起作用我知道这是一个非常愚蠢的问题，可以在几秒钟内用excel解决，但要想在R中学习如何做这样的基础工作，我们应该始终提供：返回： [1] 2 2 1 1 3 3 假设您的意思是dplyr:：recode，语法是 recode(.x, ..., .default = NULL, .missing = NULL) 从文件中可以看出 .x-要修

在switch（）中指定一个不同于在R中传递的参数的值

标签： R switch-statement

我不完全理解R中的switch（），我看到过如下示例： newCat <- switch(EXPR = category, cat1 = catX, cat2 = catX, cat3 = catY, cat4 = catY, cat5 = catZ, cat6 = catZ, "not available") newCat您可能正在CRAN上的kit包中寻找类似vs

PostgresqlR/DBI说表不存在

标签： R Postgresql

我正在使用R3.6.3和PostgreSQL 12。我在数据库中有几个表。其中一个有8000000多行，我正在尝试将其发送到R。我正在使用RPostgreSQL包，它依赖于DBI 所以像下面这样的查询不起作用 > dbSendQuery(con, "SELECT * FROM ebird_sel_spt LIMIT 1") Error in postgresqlExecStatement(conn, statement, ...) : RS-DBI driver: (could not

R 与多个光栅相关的嵌套条件语句

标签： R If Statement nestedconditional-statementsraster

假设我有四个光栅文件：x、y、w和z，我想根据它们之间的关系（即网格单元的层次顺序）使用多个嵌套条件创建一个新的光栅文件，如下所示： x <- raster(nrows=100, ncols=100) x[] <- runif(ncell(x), min = 0, max = 100) y <- raster(nrows=100, ncols=100) y[] <- runif(ncell(y), min = 0, max = 100) w <- raste

无法在带有R3.6的ubuntu 18.04中安装phytools

标签： R Installation Dependencies

无法安装phytools 尝试使用devtools library(devtools) install_github("liamrevell/phytools") 及我总是犯同样的错误 ERROR: dependency ‘mnormt’ is not available for package ‘phytools’ 我无法安装mnormt，因为 package ‘mnormt’ is not available (for R version 3.6.3) gfortran已安装在我的系

R 分组后做一个字符串

标签： R String dplyr

这是我的问题。我有城市代码（地理代码）和邮政编码（邮政编码）的数据。通常，多个邮政编码对应一个城市代码。如果是这种情况，我想创建一列，其中包含对应于同一城市的邮政编码字符串： ID<-1:10 GeoCode<-c("AA","BB","BB","CC","CC","CC","DD","DD","DD",&

持续数据的线性回归，R

标签： R Loops regressionlm

模特儿大约1000行我想做的是“一步一步”做一个预测使用0:20行预测21:30的y，然后使用11:30预测31:40的y，依此类推。您可以使用预测功能： y ~ x1 + x2 + x3 编辑：要更改循环中训练数据的范围，请执行以下操作： mod = lm(y ~ ., data=df[1:990,]) pred = predict(mod, newdata=df[991:1000,2:4]) 你在找这样的东西吗 index = seq(10,990,10) pred = matri

R 在数据中查找陡坡

标签： R find

我有一个具有X和Y坐标的高分辨率路面垂直剖面图，我正在寻找Y的突然增加，这可能归因于被归类为6mm增加的绊倒危险。我在pracma中使用findpeaks命令，但它没有实现我想要的功能，或者我没有正确地使用它。我需要做的是检测Y在指定距离X上至少增加6 mm，在这个例子中为100 mm，并记录Y在增加过程中的最大值。本质上是“绊倒危险”的最高点这是X和Y的数据单位为mm 这是我现在使用的代码 plot(x, y, ylim=c(0, 30), xlim = c(0, 2200), ce

使用sum（）对R中特定列中的特定值求和

标签： R

我有一个值表1，2，3，4，随机分布在35行15列。如何使用sum（）函数只在整个表中添加“4”，并在单独的操作中添加特定列中的所有“4” 谢谢这是矩阵： m1导入以在整个矩阵中计数4： sum(m1imported == 4) #[1] 124 sum(m1imported == 4) sum(m1imported==4)*4 在每列中计数4 colSums(m1imported == 4) #CALIFORNIA FLORIDA ARIZONA MICHIGAN W

R 根据因子的常用程度更改ggplot2热图y轴上因子的顺序

标签： R ggplot2dplyrtidyverse

我有一个data.frame，有数千行，看起来像这样 rep = c("rep1", "rep1", "rep1","rep2", "rep2", "rep2","rep3", "rep3", "rep3") species = c("a","b","d",&