在R中创建索引变量

我有下表: #Rainfall(PCP-minimum) #Rainfall(PCP-maximum) #Rainfall_index(DRI) 0 - 4.9 0 5 - 9.9 1 10 - 14.9

R中一系列步骤的循环

我试着写一个包含循环的短程序,结果卡住了。 我的代码: 我想使用泊松生成模拟,然后在我的例子中为下一个级别的基础选择值。我的选择标准是0.5%。若屏幕返回的值为4,我将生成4个介于0和1之间的随机编号。其中,我将计算值小于或等于0的数量。5并将其置于基线。其余的将交给旧金山。我需要把它放在一个循环中,这样我会得到一个包含Screen、Base和SF列的表,当基线中的值的累积和达到100时,这将停止。因此,我希望屏幕继续生成值,直到Base达到100。列Base的值之和应正好为100。您可以将代码

R 绘制纽约市花旗自行车数据,地图上未显示Lat和Long

我正试图在纽约市地图的顶部绘制纽约市花旗自行车站的数据 我从以下位置下载了zipcode数据: 以下是我所做的: > bike.loc<-bike.train > nyc.zip<-readShapePoly("nyc_zipcta.shp") > coordinates(bike.loc)<-c("start.station.id","end.station.id") > class(bike.loc) [1] "SpatialPointsDat

data.frame R中的置换组

我有这样一个data.frame: DqStr <- "Group q Dq SD.Dq 1 -3.0 0.7351 0.0067 1 -2.5 0.6995 0.0078 1 -2.0 0.6538 0.0093 2 -3.0 0.7203 0.0081 2 -2.5 0.6829 0.0094 2 -2.0 0.6350 0.0112" Dq1 <- read.table(textConnection(DqStr), header=TRUE) Dq

R 不同的情节有不同的主文本

我经常在R中创建函数,以绘制一个图。很多时候,我通过改变其中一个参数(如期望值或标准偏差)来绘制不同的图。我这样做是为了比较情节 我真的希望R改变绘图上的主文本,因为它对函数中的其他参数很敏感 例如: QQplot <- function(samples, mu, sigma){ X<- rnorm(samples, mu, sigma) Y<- rlnorm(samples, mu, sigma) plot(sort(X), sort(Y), main=????)

R ggplot-使用数值填充堆叠条形图

我想构建一个堆叠条形图,在字段fill中提供数值,而不是类别 这是我目前的图表: 对于堆叠条形图,字段fill对应于diamonds数据集的列cut。 此列对应于: > class(diamonds$cut) [1] "ordered" "factor" 因此,我认为不同术语的频率不同 > head(diamonds$cut) [1] Ideal Premium Good Premium Good Very Good Levels: Fair

R Shinny-如何将tableOutput用作vector或data.frame

问候并感谢您的帮助 我无法在ui.R中使用data.frame(在server.R上创建)。 原因很明显:tableOutput()既不是data.frame,也不是向量。 我之所以需要这样做,是因为selectInput(“ops”,…)从server.R接收该表,因为它是应用于那里的输入的函数的结果。 函数很长,所以我刚刚制作了这个data.frame(c(1,2),c(3,4),c(5,6))。无论如何,这一点是相同的 问题: 即使我知道为什么它不起作用,我也不能使它起作用。 我要寻找的是

在R中旋转名义数据

我在R中有一个数据帧,需要对其进行操作(pivot)。在最简单的级别上,前几行如下所示: Batch Unit Success InputGrouping 1 1 1 A 2 5 1 B 3 4 0 C 1 1 1 D 2 5 1 A 我希望透视此数据,以便列名为InputGrouping,如果存在,则值为1,如果不存在,则值为0。

R 从字符中提取数字部分

我使用read.table读取UTF-8编码的csv文件,其中一列显示为: [1] 16渭g/m鲁 15渭g/m鲁 14渭g/m鲁 15渭g/m鲁 12渭g/m鲁 16渭g/m鲁 [7] 12渭g/m鲁 15渭g/m鲁 11渭g/m鲁 15渭g/m鲁 12渭g/m鲁 15渭g/m鲁 16ug/m3 在我使用as.character将此列转换为字符并查看它们之后,它显示为: [1] 16渭g/m鲁 15渭g/m鲁 14渭g/m鲁 15渭g/m鲁 12渭g/m鲁 16渭g/m鲁 [7] 12渭

从data.frame获取相应的值

我的问题是,我无法用文字表达我的问题,这使得谷歌很难找到它,所以我不得不问你。我希望你能阐明我的问题: 我得到了这样一个数据帧: 6 4 5 2 3 6 0 7 0 2 1 3 6 0 1 1 正如您所注意到的,在第一列中,我得到了重复两次的0,1两次,如此类推。我想做的是在第二列(本例中为7和2)中获取一个数字的所有对应值,比如0。最好是在data.frame中 我知道尝试使用df$V2[which(df$V1==0)],但是由于第一列可能有100多行,我不能真正使用它。你们有好办法吗 关于

R:根据第二个数据帧中的引用ID减去一个数据帧中的值

我一直在努力寻找答案,并多次试图找到实现我追求的目标的方法。我有两个XTS数据帧:1.)帐户数据2.)参考数据。以下是一些示例数据(注意:示例数据不是XTS格式,但相同的想法适用): df2包含我需要从帐户中减去的数据(引用ID作为列名): df3是一个表,我可以从中确定df2引用中的哪一列将df1转换为df1-df2之间的差异 问题是我有大约200个帐户和1200个参考ID本质上,我想创建一个新的数据帧,它是df1中的每一列减去df2中相应的refID的结果。是df1[as.character

R 从一定范围内的分布中抽取随机数

我想从一系列分布中提取一些随机变量。但是,返回的值必须不高于某个阈值。 假设我想使用伽马分布,阈值是10,我需要n=100个随机数。我现在想要100个介于0和10之间的随机数。(假设比例和形状为1。) 获得100个随机变量显然很容易 rgamma(100, shape = 1, rate = 1) 但是我如何才能实现这些值从0到100的范围呢 编辑 让我的问题更清楚。绘制的100个值应在0和10之间缩放。因此,最高绘制值为10,最低绘制值为0。抱歉,如果这不清楚 编辑第2条 为了给我需要的随机

使用带有csv变量的tm pacake进行R文本挖掘

我正在完成一个项目,在这个项目中,我使用R来编写我的文本,并将其与其他变量进行比较。我是一个比较新的编程,所以任何帮助将不胜感激 我有一个超过100个变量的csv文件,其中一个变量是一个充满文本的评论部分。我已设法清理了文件,并将该列作为语料库处理,删除了英文停止词、标点符号等。以下是代码,第一季度数据文件已读入: com <- read.csv("dataQ1", stringsAsFactors=TRUE) 现在,我想通过将其与csv文件中的另一个变量(如“总体满意度”)进行比较来探

在R中的clogit中创建空模型

每次我试图为我的条件逻辑回归创建一个空模型时,R崩溃 以下是Matt O'Brian的一篇帖子,他也有这个问题,但从未注意到它是如何修复的: 有什么建议吗?有人吗?简而言之,您不应该创建空模型。旧版本的R或生存包允许您这样做,但它们是无效的

R中与之对应的组

尝试从数据集创建引用表以查找文档的当前状态。示例如下: Document<-c(1,1,1,1,2,2,2) change_date <- c("2015-01-01","2015-01-03","2015-01-05","2015-01-08","2015-01-05","2015-01-07","2015-01-20") status <- c("A","A","B","C","A","B","D") df<-data.frame(Document,change_da

R将日期从字符mmm dd,yyyy格式化为类日期

我正在尝试从格式为mmm dd,yyyy的字符格式化日期 我试过: date1 <- "Dec 05, 2016" date2 <- format(date1, format="%d %B %Y") class(date2) date2 date1我们可以转换为“Date”类,然后转换为感兴趣的格式 format(as.Date(date1, "%b %d, %Y"), "%d %B %Y") #[1] "05 December 2016" 首先,您需要转换为Date类,即格

R列表中的宽到长格式:三维到二维数组,第三维作为ID

我导入了一个*.mat数据集的ECG数据,结果是一个嵌套在1:19、1:2000、1:45维度列表中的数组 我想将此数组转换为长格式的data.table,其中每个1:45都是“id”。我喜欢Reformae2和tidyr的外观,但当涉及“列表”时,我看不到一种简单的方法。有什么想法吗 新增:如下图所示: 编辑:从ECGa添加dput 我试过做: ECGa我认为您可以不使用abind,可能简单到: Reduce(rbind, sapply(1:dim(df)[3], function(i) {

R 删除前几行并将标题名称更改为行值

我有一个数据框,它的列名由R指定 Col1 Col2 Col3 NA NA ABC NA NA XYZ Name1 Name2 Name3 Joe Paul Ross 我想删除前3行,包括由R分配的Col Numbers头,并使Name1、Name2、name3成为dataframe中列的头名称 为了删除这些行,我尝试使用tail(df,-3)。。但它不会删除列号行,也不会删除您需要的“我的名字”行 names(df) <- df[3

R 将数据帧转换为表时出错

我想加入一个多数据框,这样我就可以在一个图中创建一个多箱线图。然而,我的数据有不同的格式,我需要转换成表,然后我将使用“左连接”和“熔化”函数,然后再打印。我收到一个错误“alloc.col(ans)中出错:找不到对象'Csetmutable',无法找到修复它的方法。请告诉我是否有其他方法可以在不转换为表格的情况下进行绘图。谢谢你的帮助 library("reshape2") library("ggplot2") library("dplyr") library(data.table) df&

R 从交互式代理TWS下载数据

我一直在和互动经纪人TWS和R打交道,并取得了不同程度的成功 library(IBrokers) IBConn <- twsConnect(port = xxxx) currency_df = twsCurrency("NZD",currency = "USD") test = reqHistoricalData(IBConn, Contract = currency_df, whatToShow ='BID_ASK', useRTH = "0", barSize = '1 min', d

R 如何从每个块中减去特定区域

我有一个包含多个列的数据 df<- structure(list(X1 = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L), X2

在函数内部运行时,lmer返回错误

我试图在所选变量上建立一个适合混合模型的函数 如果在函数中运行此命令: lme4::lmer(VAR ~ cVAR + (1|ID), data=df) 我得到一个错误: Error in model.frame.default(data = df, drop.unused.levels = TRUE, formula = VAR ~ : variable lengths differ (found for 'ID') 我已经用几种方法测试了我的代码,但我就是找不出哪里出了问题。我

R 获取数据集的一半值

我提前道歉这是我的第一篇帖子 我有以下数据集。我想获得船只达到其最大速度一半的时间(例如船只1 6秒,船只2 4秒)。我有20种不同的船只来获得其半速时间值。非常感谢 vessel time speed vessel1 1 6 vessel1 2 7 vessel1 3 10 vessel1 4 16 vessel1 5 18 vessel1 6 20 vessel1 7 22 vessel1 8 24 vessel1 9 36 vessel1 10

R 从web访问日志中的请求提取训练集和测试集

我有这个DF:- df = structure(list(session_id = c(1105L, 1105L, 1105L, 1107L, 1107L, 1107L, 1108L, 1108L, 1108L, 1109L, 1109L, 1109L, 1110L, 1110L, 1110L, 1111L, 1111L, 1111L, 1111L, 1112L, 1112L, 1112L, 1112L, 1114L, 1114L, 1114L, 1114L), datetime = st

R-将data.frame中多列的值匹配到查找表

目标: 我想将t1和t2中的值从dfdata转换为查找表lookup中的其他值(PWT)。我已经看过一些关于如何对单个列执行此操作的教程,但我想以编程方式对数据中无限数量的t列(例如t1、t2、t3、t4、t5等)执行此操作 查找 # A tibble: 6 x 4 (HEAD) Response `Final Fil.` Adjustment PWT <chr> <dbl> <dbl> <db

下料优化:在R中找到所有可能的组合

我正在研究如上所述的下料问题。现在问题的出发点是,他们说对于给定的可能切割,即14,31,36,45,长度为100的木板可以切割成37种可能的模式。一种模式可以是1,0,1,1,而另一种模式可以是1,1,0,1或0,0,0,2等。是否有一种现有的算法可用于R中,该算法将列出给定的所有尺寸和单个切割的所有可能组合。在这种情况下37这是一种蛮力方法。创建一个向量,该向量具有每个切割的最大值。然后创建一个可能性网格。然后在网格上对切割进行矩阵乘法,以获得组合的总长度-任何小于或等于lteq 100的都

R 公共水管工遥控器

根据文档,它说如果我们使用plumber$run(),它只会在本地运行localhost:8000。我想把它发布到远程服务器上。如何使用管道工软件包启动远程API?请参阅run()上的host参数。e、 g.$run(host=“0.0.0.0”)谢谢。这里也解释了原因:

绘图大小=1/{N∗⌈log2N⌉∗[(1/70)/60]}在R?

大小=1/{N∗⌈log_2N⌉∗[1/70/60]} 如何用R绘制此函数 ⌈⌉= 细胞 例如: y轴的标签尺寸为N,x轴的标签尺寸为N N>=2,N是自然数2,3,4,5,6,…让我们定义函数 f <- function(N) 1 / (N * ceiling(log2(N)) * 1/70/60) 使用范围为[1,20]的ggplot2进行打印 曲线1/x*天花板log2x*1/70/60?可能的副本不是真的。。。因为这不是一个简单的函数:/I我画了一个例子-见上文。。。应该是这样

R 国际单项体育联合会声明和日期

我试图实现的是分配一个新列,其中包含一个随时间变化的变量。 这只是其中的一个正在改变,所以我想做的是在日期之后,如果是22,则改为40 我目前有一段代码不能正常工作 Idea: if(lst$taskDate <= as.Date("2018-11-18")){ t2$Budget <- case_when( t2$taskStaffName == "L" ~ 20, t2$taskStaffName == "J" ~ 22,

在data.frame中将列表定义为观察值的便捷方法

有没有办法将列表定义为循环内的观察?例如,只要data.frame的另一个观测值满足某个条件,我就可以运行下面的代码,将每个列表替换为观测值,如下面的代码所示,但在运行循环之前,我需要将列表创建为一组空列表。另外,我还没有弄清楚如何将列表放在创建data.frame的行中-有没有办法做到这一点 这是代码: #line that creates the data.frame: I wished to know how to place the list #(at the line after c

每个单元格具有多个匹配项的Vlookup的R版本

我有一个带数字的向量和一个查找表。我想用查找表中的描述替换数字 当向量是直接向前的时,这很容易,例如: > variable <- sample(1:5, 10, replace=T) > variable [1] 5 4 5 3 2 3 2 3 5 2 > > lookup <- data.frame(var = 1:5, description=LETTERS[1:5]) > lookup var description 1 1

R 按组id合并两个不同长度的数据帧

我正在尝试按组id合并两个数据帧。但是,两个数据帧的长度不同,并且在第二个数据帧中缺少某些组的某些元素。在合并的文件中,某个组缺少的元素应该是NAs 数据看起来像这样 df1 <- data.frame(id = c(1,1,1,2,3,3,4), x = c("a", "b", "c", "d", "e", "f", "g")) df2 <- data.frame(id = c(1,1,2,3,4), y = c("A", "B", "D", "E", "G")) df1此数据。

R 如何将cat的输出作为字符串而不是打印它?

我正在寻找一种将cat()命令的输出作为字符串获取的方法(而不是将其打印到屏幕上)。我原以为paste()可以做到这一点,但有区别: > cat("A", c(1,2,3), sep=",") A,1,2,3 > paste("A", c(1,2,3), sep=",") [1] "A,1" "A,2" "A,3" > paste("A", c(1,2,3), collapse=",") [1] "A 1,A 2,A 3" 是否有一个函数可以获取cat()将要打印的内容?如果

如何使R中naiveBayes()的公式参数泛型?

使用库“e1071”的函数naiveBayes()时,需要插入以下类型的公式: myFormula <- myClass~ feature1 + feature2 + feature3 myFormula您可以使用动态引用所有其他列 myFormula <- cyl ~ . naiveBayes(myFormula, data = mtcars) Call: naiveBayes.default(x = X, y = Y, laplace = laplace) A-

是什么使得使用rvest软件包进行桌面web清理有时会失败?

我在玩这个软件包,试图弄明白为什么有时候它不能刮到那些看起来像桌子的东西 例如,考虑这样一个脚本: require(rvest) url <- "http://bigcharts.marketwatch.com/quickchart/options.asp?symb=SPY" population <- url %>% xml2::read_html() %>% html_nodes(xpath='//*[@id="options"]/table/tbody/tr

R 基于date.times连接数据帧

我想合并两个数据集。 第一个数据集包含特定时间仪器中CO2浓度的信息。 第二个数据集包含测量何时开始和结束的信息 我希望将这两个数据帧组合在一起,以便来自数据集1的时间在数据集2中的时间间隔(开始日期时间到结束日期时间)内结束在同一行上。这一点没有很好的解释,因此更容易查看下面的数据 我是R的新手,因此,非常感谢您的帮助 数据看起来与下图所示相似 Data set 1 co2 date_time 0.2 2012-05-01 10:2

如何选择在R中的数据表列中只出现一次的值?

就像标题一样,这个问题非常简单。请原谅我的无知 我在数据表中有一个列,字符类型。 并且存储了多个不同的单词/值,其中一些只出现一次,另一些出现多次 我如何选择只出现一次的项目?? 感谢您的帮助!谢谢大家! 一个选项是执行分组,然后选择具有单行的组 library(data.table) dt1 <- dt[, .SD[.N == 1], .(col)] 图书馆弹琴 df%>% 分组按列%>% dplyr::filtern==1%>% 解组 例如: data = tibble(text

将命名向量添加到R中的向量列表中

我有一个名为AA、BB和CC的3个向量的列表。我想向这3个向量中的每一个添加一个名为H的新命名元素,它将显示为H=some number 以下是我尝试过但没有成功的方法: L <- list(AA = c(K = 2225, M = 39911), BB = c(K = 5456, M = 65533), CC = c(K = 15274, M = 48877)) L[[1]]$H <- H = 25 L[[2]]$H <- H = 23 L[[3]]$H <- H =

R 重新编码离散变量

我有一个离散变量,分数在1-3之间。我想把它改成1=2,2=1,3=3 我试过了 重新编码(数据$GEB43,“c(1=2;2=1;3=3”) 但这不起作用 我知道这是一个非常愚蠢的问题,可以在几秒钟内用excel解决,但要想在R中学习如何做这样的基础工作,我们应该始终提供: 返回: [1] 2 2 1 1 3 3 假设您的意思是dplyr::recode,语法是 recode(.x, ..., .default = NULL, .missing = NULL) 从文件中可以看出 .x-要修

在switch()中指定一个不同于在R中传递的参数的值

我不完全理解R中的switch(),我看到过如下示例: newCat <- switch(EXPR = category, cat1 = catX, cat2 = catX, cat3 = catY, cat4 = catY, cat5 = catZ, cat6 = catZ, "not available") newCat您可能正在CRAN上的kit包中寻找类似vs

PostgresqlR/DBI说表不存在

我正在使用R3.6.3和PostgreSQL 12。我在数据库中有几个表。其中一个有8000000多行,我正在尝试将其发送到R。我正在使用RPostgreSQL包,它依赖于DBI 所以像下面这样的查询不起作用 > dbSendQuery(con, "SELECT * FROM ebird_sel_spt LIMIT 1") Error in postgresqlExecStatement(conn, statement, ...) : RS-DBI driver: (could not

R 与多个光栅相关的嵌套条件语句

假设我有四个光栅文件:x、y、w和z,我想根据它们之间的关系(即网格单元的层次顺序)使用多个嵌套条件创建一个新的光栅文件,如下所示: x <- raster(nrows=100, ncols=100) x[] <- runif(ncell(x), min = 0, max = 100) y <- raster(nrows=100, ncols=100) y[] <- runif(ncell(y), min = 0, max = 100) w <- raste

无法在带有R3.6的ubuntu 18.04中安装phytools

无法安装phytools 尝试使用devtools library(devtools) install_github("liamrevell/phytools") 及 我总是犯同样的错误 ERROR: dependency ‘mnormt’ is not available for package ‘phytools’ 我无法安装mnormt,因为 package ‘mnormt’ is not available (for R version 3.6.3) gfortran已安装在我的系

R 分组后做一个字符串

这是我的问题。我有城市代码(地理代码)和邮政编码(邮政编码)的数据。通常,多个邮政编码对应一个城市代码。如果是这种情况,我想创建一列,其中包含对应于同一城市的邮政编码字符串: ID<-1:10 GeoCode<-c("AA","BB","BB","CC","CC","CC","DD","DD","DD",&

持续数据的线性回归,R

模特儿 大约1000行 我想做的是“一步一步”做一个预测 使用0:20行预测21:30的y,然后使用11:30预测31:40的y,依此类推。您可以使用预测功能: y ~ x1 + x2 + x3 编辑:要更改循环中训练数据的范围,请执行以下操作: mod = lm(y ~ ., data=df[1:990,]) pred = predict(mod, newdata=df[991:1000,2:4]) 你在找这样的东西吗 index = seq(10,990,10) pred = matri

R 在数据中查找陡坡

我有一个具有X和Y坐标的高分辨率路面垂直剖面图,我正在寻找Y的突然增加,这可能归因于被归类为6mm增加的绊倒危险。我在pracma中使用findpeaks命令,但它没有实现我想要的功能,或者我没有正确地使用它。我需要做的是检测Y在指定距离X上至少增加6 mm,在这个例子中为100 mm,并记录Y在增加过程中的最大值。本质上是“绊倒危险”的最高点 这是X和Y的数据单位为mm 这是我现在使用的代码 plot(x, y, ylim=c(0, 30), xlim = c(0, 2200), ce

使用sum()对R中特定列中的特定值求和

我有一个值表1,2,3,4,随机分布在35行15列。如何使用sum()函数只在整个表中添加“4”,并在单独的操作中添加特定列中的所有“4” 谢谢 这是矩阵: m1导入以在整个矩阵中计数4: sum(m1imported == 4) #[1] 124 sum(m1imported == 4) sum(m1imported==4)*4 在每列中计数4 colSums(m1imported == 4) #CALIFORNIA FLORIDA ARIZONA MICHIGAN W

  1    2   3   4   5   6  ... 下一页 最后一页 共 7796 页