Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/73.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
 R_IT技术博客_编程技术问答 - 「Fatal编程技术网」

R 用时间序列数据绘制stl

我试图使用stl在我的timeseries数据中获得季节和趋势的细分。我有记号数据,我已经创建了一个ts对象 我运行了一个SQL查询,以获取以下表单中的数据 > x datetime price 1 2010-09-08 1501 9110 2 2010-09-08 1501 9110 3 2010-09-08 1501 9110 4 2010-09-08 1501 9110 5 201

在R中使用嵌套的mlogit函数-内存有问题吗?

我正在尝试使用mlogit函数在R中建模决策树。该模型的目的是描述海峡岛屿船民的选择。我们想要建立模型的方式是使用两个决策层。首先,个人选择一项活动(如潜水、浮潜或皮划艇)。其次,根据该活动,他们根据该地点对该活动有利的属性(海带覆盖物、无脊椎动物、鱼类等)选择岛屿上的地点进行访问。我们认为这是一个嵌套结构,首先是活动选择,然后是站点选择。该模型有4个不同的活动和31个不同的站点可供选择,总共有124个独特的“活动选择”选项。我们有111个人的数据,他们每个人都根据不同地点的属性做出了特定的决定

R 设置种子时的整数是什么意思?

我想使用R中的sample函数从数据集中随机选择n行。我每次都得到不同的输出,因此使用set.seed函数得到相同的输出。我知道set.seed中的每个整数都会给我一个唯一的输出,如果设置相同的seed,输出将是相同的。但我无法理解作为参数传递给set.seed函数的整数是什么意思。它只是进入随机生成器算法的一个索引,还是意味着从哪里开始采样的部分数据?例如,set.seed2中的2是什么意思?它只是一个用于为随机数生成器设置种子的数字。这与你的数据无关。如果没有显式提供种子,将从当前时间创建一

R y轴和对数x轴断裂的条形图

我希望以条形图的形式呈现一个变量,并警告说,我试图绘制对象大小的组在几个数量级上有所不同。数据的另一个复杂性是,变量y在正值和负值时也会在几个数量级上变化。我通常在图片中思考,因此我沿着我在下面寻找的线条画了一些东西,颜色只是距离零的函数,即白色零、深蓝色非常负、深红色非常正等: 以下是数据的真实案例(如果需要): x <- c(1.100e-08, 1.200e-08, 1.300e-08, 1.400e-08, 1.600e-08, 1.700e-08, 1.900e-08, 2.1

在R中移动SD-需要语法 数据

您可以使用嵌入和应用,例如 data<-read.csv("http://ichart.finance.yahoo.com/table.csv?s=^NSEI&a=08&b=16&c=2006&d=08&e=26&f=2012&g=d&ignore=.csv") tmp <- data[order(data$Date), ] data<-tmp data'$'MovAvg60=filter(da

r中的方框图:3个时间点,2个处理,在同一图表上有2个因子

我想展示3个时间点0、7和28的数据与丰度的简单方框图。我想将图分成处理,即CO2水平/温度,嵌套在图中。基本上,每个时间点我有两个方框图,表示两种不同的处理方式。我本来打算用一个覆盖图,但是因为我有两个时间点的方框图,所以我发现很难写出正确的代码 谢谢嗨,欢迎来到SO。由于您是新来的,您可能希望阅读网站的和部分,以帮助您充分利用它。请阅读并相应更新您的问题!这就是你要找的吗?

使用polyroot()或寻找其他方法来计算P[实根]

假设A、B和C是独立的随机变量,每个都均匀分布在0,1上。 AX^2+BX+C有实根的概率是多少 我发现概率是2544 如何使用R验证您的答案是否正确?R中的命令是否有助于确定这一点 你需要写一个程序来计算p[实根]吗?有人告诉我,使用polyroot所需的CPU时间是您对此问题的分析解决方案(即5+6log2/36)所建议的更直接的方法的40倍 此外,除非你精通浮点运算,否则你会得到一个微妙的错误结果。请注意,R中的此类计算量实际上无法验证此类数学结果;它只能证实这一点,也就是说,您希望代码输

R 使用多个标准子集数据帧列表

我有一个很大的数据集,包含来自森林资源清册的多个数据。此数据框包含在每个地块中发现的物种。数据是按站点组织的 > str(MM,max.level=2) List of 50 $ :'data.frame': 2944 obs. of 18 variables: ..$ plot : int [1:2944] 2 3 3 3 3 4 4 4 5 5 ... ..$ Cla : Factor w/ 2 levels "A

R 如何在ggplot2中增加条形图尺寸?

这就是我得到的数字 正如你所看到的,有些数字是重叠的,有些则是看不见的。我怎样才能增加一点酒吧的宽度,使数字可见?五位数是我的数据中最大的数字。ggplot2允许您像这样调整宽度: ggplot(scount_all, aes(x=classes, y=frequency, group=seasons,fill=seasons)) + scale_fill_manual(name = "Seasons",values=bwPalette(4))+ geom_bar(colour="bla

R 数据拟合多项式-数据帧中数据的困难

我有下面的例子来拟合数据的三阶多项式: # rm(list = ls(all = TRUE)) # clear workspace var2 <- c(32,64,96,118,126,144,152.5,158) var3 <- c(99.5,104.8,108.5,100,86,64,35.3,15) fit1 <- lm(var3 ~ poly(var2,3,raw=TRUE)) plot(var2, var3 , pch=19, ylim=c(0,150)) xx &l

将缺少的唯一行添加到data.frame

所以我有两个不同长度的数据帧。我试图通过添加tdx缺少的dx行,使它们具有相似的长度。在本例中,tdx缺少Age==“UNSP”的行。我有其他数据集可能缺少不同的行;我正在寻找一种方法来识别缺少哪些行,然后为输出添加这些行;年份列(对于该行)将是NA值 更清楚地说,输出将是一个数据帧,tx和tdx数据并排显示,性别和年龄匹配。 以下是我尝试过的内容(感谢Richard指出我忘记添加此内容) >头部(tdx,n=12L) 最终起作用的是merge(dx,tdx,by=c('Gender','Age

R 三重矢量数据的平均值和标准差

我有一个实验,我测量了不到200个变量,一式三份。换句话说,我有三个向量,大约200个值 我想要一个快速的方法来确定我的计算应该使用平均值还是中值。我可以很容易地计算出平均值((v1+v2+v3)/3),但我如何计算SD,使其在~200个SDs的向量中?中位数呢? 在获得这些值之后,我需要绘制生长曲线(在特定时间段内进行测量)。apply就是您要做的。让你的向量在一个矩阵中,例如 mydat <- matrix(rnorm(600), ncol = 3) means <- apply

R 打印列并仅显示“级别:”行

我想检查代码中数据帧中的一个特定列,它有4种不同的模式。当我使用printdf[,column2]时,我会打印所有行和级别:-9999.99 EA ST。因此,我只想在控制台中看到级别:-9999.99 EA ST。可能只打印levelsdf[,2]catLevels:,levelsdf[,2]

R 如何压缩一个数据帧,每三列替换一个平均值的数据帧?

我有一个数据框,看起来像这样:(子集) 我对R不熟悉。是否有一个函数可以用来“压缩”数据帧,使其每三列的平均值为一列?可能的重复项:您想要一到三列的平均值,然后是四到六列的平均值,等等,还是想要一到三列的滚动平均值,然后是二到四列的滚动平均值,然后是三到五等?对不起,我想知道第一列到三列的平均值,然后是第四列到六列的平均值等等。链接的问题/答案回答你的问题吗?看起来很有用,我正在尝试 Peptide CNB CNB.1

如何将for循环的输出存储到R中的csv文件中?

我有几个for循环: for (i in 1:length(v1)) { v2[i] <- subset(file1, srl == v1[i], FlrGrp) } v1[]是一些数字的向量 现在,第二个for循环的输出如下所示: [1] 789 [[1]] [1] Pg D115 D06 Slz 27 Levels: DD D004 D010 D022 D023 D103 D108 D113 D115 D211 D214 ... Slz [1]

R 如何解有求和的方程?

我将方程和((2*x+1)/k^x)=3*k(其中x属于整数)解为 它返回TRUE 但是我想要一个自动解决它的方法,我应该如何解决它?您可以尝试函数uniroot: uniroot(function(k){sum((2*x+1)/k^x)-3*k}, c(0,100))$root #[1] 2.000019 uniroot(function(k){sum((2*x+1)/k^x)-3*k}, c(1,10))$root #[1] 2 同样在第一次调用中,可能由于数字表示,您没有得到确切的2,

使用REPLACE2时缺少值

我的问题与贴在这里的问题非常相似。我试图使用重塑数据将CRSP数据从长格式转换为宽格式。我把标准普尔公司的股票代码放在一列中,我想让它们成为一列。在我的数据框中有三列:“日期”、“股票代码”和“PRC”。(PRC是价格)。 相反,我希望列数等于我的唯一标记。我使用: dcast(df, DATE~TICKER, value.var="PRC"), fun.aggregate=length, fill=NaN, drop=FALSE) 这将返回一个完美的数据帧,对左侧的时间序

R 如何确定向量中第一个出现的局部极小值的位置?

假设我有以下向量: y [1] 10 [2] 9 [3] 8 [4] 6 [5] 7 [6] -3 [7] -1 虽然最小值的位置可以通过使用which(y==min(y)作为6来获得。但是我想知道如何获得第一个最小值,它是6,位置是4。在6之后,值增加到7。 提前感谢。这可能也适用于: y <- c(10,9,8,6,7,-3,-1) which(diff(y) > 0) # [1] 4 6 y[ head(which(diff(y) > 0L),

R 有误部分插补

我试图使用R中的missfreest包来部分插补数据集。详细地说,我想计算所有的度量变量,但只留下一些列。这可能吗?如果我正确理解了你的问题,我有一个潜在的解决方案。我将为您提供一些完全可复制的代码 ## Get some data... data(iris) ## The data contains four continuous and one categorical variable. ## Artificially produce missing values using the 'p

使用循环的R码

有人知道如何1)获得3,5,7,9,11和2)使用R代码循环(for()函数)获得132152237146的最大值吗 提前谢谢 无需使用循环即可实现max()和mean()函数可按如下方式使用: nums <- c(132, 152, 237, 146) max(nums) # for max nums2 <- c(3,5,7,9,11) 1/mean(1/nums2) # for harmonic mean nums也用于循环是解决这些问题的一种非常不自然的方法。是的,但我需

R 当数据与组标题散布在同一列中时,如何对数据进行分组?

基本上,我的数据按天分组,其间的行数不一致: 16-Oct-16 Name1 Name2 Name3 17-Oct-16 Name1 Name2 Name3 Name4 Name5 19-Oct-16 等等 我需要能够获取组数据并将其应用于子记录。 预期结果应如下所示: Name1 16-Oct-16 Name2 16-Oct-16 Name3 16-Oct-16 Name1 17-Oct-16 Name2 17-Oct-16 Name3 17-Oct-16 Name4

R 用稀疏向量对向量进行索引

我正在使用R的Matrix包。我有一个业余爱好者 index.map <- sparseVector(x=1:3, i=c(10, 33, 50), length=50) 我得到了错误 值[index.map[33]中出现错误:下标类型“S4”无效 大概是因为R不知道如何通过sparseVector对数值值进行子集划分。 我可以强制index.map为整数来执行查找: values[as(index.map[33], 'integer')] == values[2] # TRUE 但是

R 如何按行和列查找>;列名?

我正在考虑如何在下面的文件DS.csv中按大学名称(第一行:A,…,F)、字段名称(第一列:Acute,…,En)和/或毕业时间(time)查找时间数据。 我正在考虑dplyr方法,但无法将数字ID查找(线程答案)扩展到三个变量的查找。 挑战 如何按第一行查找?也许,类似于$1==“A”的东西 如何将大学查找扩展到两列?Pseudocode$1==“A”是关于第二列和第三列,…,$1==“F”是关于最后两列 按3个查找标准进行查找:第一行(无标题)、第一列(标题字段和标题时间)。伪码 times

无效的R变量名错误

下面是我的数据帧的结构,当我对它运行一些R代码时,我不断得到一个错误 错误:至少有一个类级别不是有效的R变量名;这将在生成类概率时导致错误,因为变量名称将转换为X0,X1。请使用可用作有效R变量名的因子级别(有关帮助,请参阅?make.names) 抛出错误的代码在这里 objModel <- train(df.schools[,predictorsNames], df.schools[,outcomeName], method='gbm',

R-如何将列名用作函数中的参数并插入到模型公式中

我想要一个函数,其中的参数可以采用变量名(这是数据集的一部分,但不作为对象存储在环境中),并将该变量名插入到模型公式中 例如: # Some data with a couple of variables my_df <- data.frame(y = rbinom(10, 1,0.5), var1 = runif(10), var2 = runif(10)) # A function that fits a model using predictor specified in the

RStudio和Microsoft R-Open

我目前正在与RStudio合作制作R-statistics发行版 我也想安装Microsoft R-Open版本,但如何让RStudio安装 参考此MRO分布,而不是“常规”R统计 我在Stack Overflow或RStudio的网站上都找不到关于此的任何文档。因此,如果我理解正确,您想在已安装的Microsoft R Open版本上运行RStudio吗 如果是这样,在RStudio中,转到工具|全局选项,您将看到选项对话框。选择右侧的“常规”,在顶部可以看到“R版本:”。单击更改,您将获得“

R中按键的数据表的条件和

我有一个数据表'df',有3列。身份证、膳食、时间 每个id有许多行 library(data.table) id = c(1,1,2,2,3,3) meal = c(1,1,0,0,1,0) time = c(10,9,12,13,7,15) df <- data.table(id, meal, time) > df id meal time 1: 1 1 10 2: 1 1 9 3: 2 0 12 4: 2 0 13 5:

R 我如何检查英国境内是否有坐标?

我得到了经纬度数据。我想检查一下这个坐标是否在英国境内?特别使用R的示例代码受到赞赏 包RDSTK::协调2政治 在这里发布之前,请使用网络搜索我的答案是谷歌地图:)该关闭链接是众多链接中的一个,您可以使用。请在未来做基础研究。这就是我要找的@安德烈-我得到了数百万排Lat/Lng,并在寻找能够自动化的东西。

未能为R中的if()设置正确的条件

链接到我的数据: 说实话,这实际上不是我的剧本,我从一些资料中得到了它,试着把它分解,然后,试着根据我的知识重写它 这是我的剧本 rankhospital<- function(state, outcome, num = "best"){ data<- read.csv("outcome-of-care-measures.csv", colClasses = "character") outcomes<- c("heart attack", "

使用setDT在R中进行子集设置以删除值

您好,我正在使用R studio筛选数据集中出现次数少于5000次的各种葡萄酒 我已经运行了下面的函数- #create new data frame with varities greater than 5000 wineVar <- setDT(wineNew)[, if(.N > 5000) .SD, by = variety] #list the unique varieties to show theres only 5 unique(wineVar$variety) 有

将独立Rmd(自有回购和项目)作为博文导入blogdown?

我的大部分分析都是使用1 project=1存储库方法完成的。在每一个存储库中,都有一个单独的R项目,通常还有一个生成html_文档的Rmd文件,其中包含所有分析 这些分析中的一些会成为很好的博客文章,如果我更新分析,我希望博客文章能够更新 有没有一种方法可以从这个分析中创建一篇博客文章,而不必在博客的项目和repo中重复所有内容 我曾尝试将分析报告克隆到blogdown的/content文件夹中,但最终我只在我的博客主页上找到了0001年。这并非不可能,但可能非常棘手,我不建议你这么做。相反,

R 如何计算给定变量集的所有可能模型

我想在R中找到一个命令,以便计算给定变量集的所有可能模型。 例如,对于三个变量x1、x2和x3,有8种可能的模型: m1: x1+x2+x3 m2: x1*x2+x3 m3: x1*x3+x2 m4: x2*x3+x1 m5: x1*x2+x1*x3 m6: x1*x2+x2*x3 m7: x1*x3+x2*x3 m8: x1*x2*x3 如果我有5个变量,则有6894个不同的模型,包括所有可能的交互作用,但我想用R确认。答案是 “如果我想让x1、x2和x3的主效应保持不变?”乔

使用来自R的JAGS进行结果预测

[代码已更新,不再与错误消息对应] 我试图理解JAGS如何预测结果值(对于混合马尔可夫模型)。我在一个数据集上训练了模型,该数据集包括结果m和协变量x1、x2和x3 预测结果而不固定参数值在R中有效,但输出似乎完全随机: preds <- run.jags("model.txt", data=list(x1=x1, x2=x2, x3=x3, m=m, statealpha=rep(1,times=

R 如何在仅包含字符串的数据上运行群集

我试图在一个非常大的数据集上运行集群。它只包含值的字符串。我已经删除了NA,并用一个虚拟值进行了重新关联。我在R中的K-均值由于NA共同累加而不断失败。社区如何在此数据上运行群集。我在下面展示10行虚拟示例。在这种情况下,让我们调用数据帧:cluster\u data 任何帮助都将不胜感激。我正在尝试查看是否有任何列导致数据提前中断,然后另一列尝试了解可能的结构。认为使用K-means进行聚类是最好的方法,但不知道如何使用字符串。已转换为R中的因子,但仍存在问题。非常感谢任何示例代码问题:如何

R 如何消除文本输出中逗号前后的额外空格?

我想知道如何摆脱额外的空间,出现在我的R闪亮应用程序的文本输出 这是它的编码方式: output$summary <- renderText ({ isolate({ paste("The power of this independent samples t-test, with population means of", input$mu_1,"and", input$mu_2, ", standard deviations of"

使用不同的权重和R中的缺失值计算加权平均值

我试图计算3列的加权平均值,其中权重是根据每行缺失值的计数来确定的 一个可重复的例子: # Some simulated data N <- 50 df <- data.table(int_1 = runif(N,1000,5000), int_2 = runif(N,1000,5000), int_3 = runif(N,1000,5000)) df[-1] <- lapply(df[-1], function(x) { x[sample(c(1:N), floor(N/1

R 除了一篇文章有超过一页的答案外,抓取问答也可以

下面的代码将所有的问题和答案及其作者和日期一网打尽,但我不知道如何将占用一页以上的答案一网打尽,例如这里的第二个问题 阿斯伯格综合症和自言自语 答案分为两页:第一页15页,第二页3页,我只在第一页得到答案 library(rvest) library(dplyr) library(stringr) library(purrr) library(tidyr) library(RCurl) library(xlsx) #install.packages("xlsx") # Scrape thread

R 以TIBLE格式显示测量单位

是否可以将测量单位添加到tibble列,并在打印tibble时显示?因此,在下面的示例中,是否可以在重量列中的旁边打印磅 tibble(name=c(“汤姆”,“杰瑞”),weight=c(10,1)) #>#tibble:2x2 #>重量 #> #>1汤姆10 #>2杰瑞1 正如@camille和@Brian所提到的,您可以使用单元库 使用valid\u udunits(),您可以查找有效的单位并找到所需的单位: symbol symbol_aliases name_singu

基于R中不同数据帧中的索引对列求和

我有两个与此类似的数据帧: df<-data.frame("A1"=c(1,2,3), "A2"=c(3,4,5), "A3"=c(6,7,8), "B1"=c(3,4,5)) ref_df<-data.frame("Name"=c("A1","A2","A3","B1"),code=c("Blue" ,"Blue","Green","Green")) 我想根据ref_df中的代码对df列中的值求和。我想将结果存储在一个新的数据框中,其中的列名与ref_df中的代码匹配 i、 e.

多变量上的fuzzy_full_join在R中复制列

我对R中的两个表进行模糊全联接,需要多个键来匹配。一些 行不匹配。输出复制了这些键。这种情况不会发生 具有非模糊完全联接。删除重复项的最佳方法是什么?我 我们有一个解决方案,但它似乎很麻烦 例如: x<-data.frame("id"=c(1,1,2,2), "time" = c(1,2,1,2), "meas1" = c(1,2,3,4)) y<-data.frame("id"=c(1,1,2,2), "time" =c(1,3,2,4),"meas2"=c(-1,-2,-3,-

基于parsnip模型的VIP包重要性度量计算

我正试图使用Viu公司在parsnip制造的逻辑回归模型上计算特征重要性。对于regex,我将使用iris数据集,并尝试预测一个观测值是否为setosa iris1 <- iris %>% mutate(class = case_when(Species == 'setosa' ~ 'setosa', TRUE ~ 'other')) iris1$class = as.factor(iris1$class) #set u

有人知道如何在R中使用ggplot2制作这样的图表吗?

查看我试图在R中使用ggplot2创建的图。该图显示了我的示例数据以及我希望图表的外观和功能。有什么想法吗 以下是我的尝试: #sample data library( data.table ) DT <- data.table::fread("Ticker Name Purchase Current Target Action FB Facebook 16 45 42 Sell AAPL Apple 5 2 22 Buy GOOG Google 21 32 42 Hol

R 如何求解给定x的函数?

我已经浏览了很多帮助页面,但是我没有找到解决我的-可能-简单问题的方法。 我定义了一个函数 funB <- function(x) (0.8042851 + ((3.9417843-0.8042851)/(1+((x/0.4039609)^(-3.285016))))) funB如果您想找到x的值,使funB(x)等于0.2,您可以这样做: funB <- function(x) (0.8042851 + ((3.9417843-0.8042851)/(1+(

R 文本聚类花费太多时间

我在MacBook pro中使用TF-IDF和k-means聚类进行文本聚类。我的数据有1400个观测值,我想有140个集群。TF-IDF矩阵有101611692个元素(780.9 Mb)。我已经花了2天的时间,但是k-means聚类步骤还没有完成。这对笔记本电脑来说计算成本太高了吗?有没有更快的方法?谢谢。K-Means可能是所有聚类算法中最简单的一种。它的复杂性和处理时间随着数据点数量的增加和维度数量的增加而线性增加。因此,在具有多个数据点的高维空间中运行此方法几乎是不可行的。去掉停止词,在

R 如何解决Can';在@INC错误中找不到IO/Zlib.pm?

我安装了这个库: 使用: install.packages("SNPolisher_2.0.3.tar.gz",repos=NULL,type="source") 我使用R版本3.6.3运行它,如下所示: > library(SNPolisher) > Ps_Visualization(pidFile="pidfile.txt", summaryFile="brlmm-p.summary.txt" ,c

R 自动创建数据子集

我希望对大量数据进行子集划分,使其更易于处理和绘制。我希望创建大约10个变量长的组,这样我的图就不会变得过于累赘。我从“mpg”中提取了一些虚拟数据来演示我的计划 library(tidyverse) ##Creates a list of car manufacturers and how many models they offer car_types <- as.data.frame(table(mpg$manufacturer)) ##filters to only havi

R 跟进:从同一列表的元素中查找零位置的不匹配

我正在跟进。我想创建一个if()条件,以便在list()的一个元素中的0值对于同一list()的第二个元素中的相应位置不是0时捕获 例如,在A列表中,x的前两个值是0,但y的前两个值不是0。所以,我想把这当作一个错误(停止) 但是,在B列表中,x的前三个值是0,而y的前三个值也是0。所以,我想把这当作(警告) Q:虽然我预计D列表会出现错误,但我想知道为什么我的如果()没有捕捉到它,是否有修复方法 ( A = list(x = c(0,0,2,2), y = c(3,3,1,1)) ) # Ex

使用循环重命名多个dataframe的变量,引用列表中的dataframe名称

难以表达。这里有一个例子来解释。 我有3个数据帧 df1 <- data.frame(var1=c(1:5),var2=seq(1,10,by=1) ) df2 <- data.frame(var1=c(6:10),var2=seq(1,10,by=1) ) df3 <- data.frame(var1=c(11:15),var2=seq(1,10,by=1) ) 可能有很好的理由不将所有列命名为相同的,但嵌套循环可以工作: df1 <- data.frame(var1

上一页 1 2  3   4   5   6    7   8   9  ... 下一页 最后一页 共 7917 页