我想为我拥有的数据创建一个平滑的曲线图。我有一个文本文件中的数据,比如file.txt,它是一个选项卡分隔的文件,标题类似于a和B
在A和B项下都有大约30000个这样的数据点
我正在为此使用以下代码:
dstr_data <- read.table("file.txt", header=T, sep="\t")
ggplot(dstr_data,aes(xaxis))+geom_smooth(method="auto",aes(y=dstr_data$A)
,colour="red",
从一个空的数据帧开始,我需要按如下方式填充数据帧:for循环在每次迭代中生成固定数量的值,我需要使用该列表中的值添加一个新列,并给该列一个唯一的名称col_I(其中I是循环的第I次迭代)
如何完成这项看似简单的任务?cbind有什么问题
The functions cbind and rbind are S3 generic, with methods for data frames.
The data frame method will be used if at least one arg
我正在尝试为另一个以空格分隔的程序创建一个输入文件。我将多个列的内容粘贴在一起,当数字长度不同时出现问题,原因是R中的默认右对齐方式。例如:
row_id monthly_spend
123 4.55
567 24.64
678 123.09
变成:
row_id:123 monthly_spend: 4.55
row_id:567 monthly_spend: 24.64
row_id:678 monthly_s
我需要创建一个带有中间x轴和上下两个正y轴的条形图。
它应该看起来像a轴,但x轴和y轴是换位的。
我的数据是雄性和雌性鱼的长度
样本数据:
length <- c(12,13,15,14,13,16,18)
sex<-c("m","m","m","f","f","f","f")
dat=data.frame(length,sex)
length另一个术语是“反向水平条形图”。(要打包的作者有多个:plotrix,但Jim Lemon是最有效率的,他既是打包的维护者,也是pyra
是否可以使用RODBC仅读取excel文件的一列?你怎么能这么做
感谢从sheet sheetname获取列名
谢谢您的回答,我的excel文件中的列没有任何名称,我已经尝试了以下代码:dfr请参阅上述代码中TBL的列表名称。也许您会发现应该使用什么名称。表的名称是正确的,但如何从excel文件中的检索数据?请从Sheet1$Thank中选择top 1 F1,但仍然存在相同的问题
library(RODBC)
sheet = 'my_excel.xls'
con = odbcConnectEx
我有下面的数据表
| State | Prod. |Non-Prod.|
|-------|-------|---------|
| CA | 120 | 23 |
| GA | 123 | 34 |
| TX | 290 | 34 |
如何在R或任何其他软件(如Excel)中将此表转换为微小的数据格式
|State | Class | # of EEs|
|------|----------|---------|
| CA
如何向monet.frame-对象添加列
例如,如果我想将一个简单的行ID添加到名为data的monet.frame中,我可以通过如下操作来实现:
from <- gsub("^SELECT(.)+FROM", "", data$query)
addid_query <- gsub("data", from,
"SELECT *, ROW_NUMBER() OVER () AS id FROM data"
attr(data, "query
我有一个\t分隔的.csv文件,第一行有列名,其他行有小数点。我正在尝试使用read.csv命令读取它,如下所示:
x = read.csv("Export.csv", header = TRUE, sep = "\t", dec = ",")
例如,在输入文件Export.csv中
"$\{,}_"
45,2
这让我
<header>X....._</header>
45.2
我原以为它会将引用的值解释为字符串,将数字解释为数字
它正确地将45,2解释为一个数字,
您能否评论一下如何处理以下非线性数据(svm回归):
我可以提取系数和偏差(w和b),但我找不到定义损失函数的松弛变量(软裕度)。您能为我推荐另一种适合此类数据的选项吗?请查看e1701包中的函数svm()和predict()。它支持回归支持向量机和各种核函数 我认为您应该尝试使用biocLite(“e1071”)将e1071软件包安装到R中。
你可以这样做:
来源(“”)
生物石(“e1071”)
至少我已经在R中安装了e1071软件包
希望这能对你有所帮助 我已尝试安装它,但它显示:inst
标签: R
librariesspell-checkingaspellhunspell
我想在Windows的R中安装Aspell软件包,但没有可用的Aspell软件包二进制文件
请提出一些解决办法
以下是我试图安装它时收到的消息
> install.packages("Aspell", repos = "http://www.omegahat.org/R")
Installing package into ‘C:/Users/admin/Documents/R/win-library/3.0’
(as ‘lib’ is unspecified)
package
我试着在R中做一个逻辑回归,然后计算一个优势比。我有两组人,第一组比第二组更容易受到污染物的影响,而第一组更容易患某种疾病。
我只是在这里使用一组玩具数据。很容易生成模型并估计污染物暴露对疾病发展的影响的重要性:
df <- data.frame(disease = as.factor(c(rep(1,100),rep(0,500))),
exposure=c(rnorm(100, mean = 200, sd = 50),
标签: R
keyaggregateplyrkey-value
我有一个像这样的数据集。您可以看到列X2具有键值。我想将列X1中的成对值与列X2中的键值相加。我一直在尝试使用ddply或aggregate,但我遇到了问题。有没有人有一个简单的方法来做到这一点
> X1=rnorm(30,mean=20, sd=10)
> X2=rep(1:15,2)
>df= data.frame(X1,X2)
X1 X2
1 10.065545 1
2 6.938315 2
3 5.657782 3
4 11.371
我需要读取一个.csv文件,其中第一列是时间。然后,我的想法是阅读本专栏(typeof=int)并转换为R时间类。因为我是R方面的新手,我首先尝试一个例子:
> myData2 <- data.frame(time=c("2014-01-23 14:28:21","2014-01-23 14:28:55",
"2014-01-23 14:29:02","2014-01-23 14:31:18"),
sp
标签: R
applyxtsquantmodalgorithmic-trading
我面临以下简单的交易策略:
买入:当一只股票的价格高于布林格上限时
卖出:当股票价格低于较低的布林线时
持有:一个买入信号已经出现,所以我们持有该股票直到一个重新分配日出现卖出信号
我们只考虑每周重新分配日期,使用GSE:StistPoots函数。
require(quantmod)
# load stock data
tickers <- c("IBM")
myEnv <- new.env()
getSymbols(tickers, from ="2012-01-03", to
好的,我将您的代码添加到了其中,因此通过shinyServer它更可读、更可运行
它可以通过以下方式运行:
error
sqlQuery(con,"insert into samp values('",input$text1,"',",input$text2,")");
Error in sqlQuery(con, "insert into samp values('", input$text1, "',", :
object 'input' not found
ui.R
library(
我已使用以下行在我的应用程序中嵌入了视频:
tags$video(src = "myVideo.mp4", type = "video/mpeg4", controls = NA, width = "100%")
我已经在我的Mac上编写了这个应用程序,当我发布和查看它时,视频在Safari中播放得非常完美,但在Chrome或Firefox中没有显示任何内容。大多数用户不会使用Safari,因此这是一个小问题。还有其他更好的格式吗?我认为mp4不应该有这种问题
谢谢你的提示 结果是一个糟糕的视
我有一个超过608000行的主表(前7行如下图所示)。这些对应于基因组中的位置以及Affymetrix(和dbSNP)给予它们的一个(或两个)标识符
我还有一张只有46行的桌子。如果在第二个表的46行中有一行同时具有染色体和染色体起始值,我需要从主表中删除这些行。这是第二张桌子;它没有Affymetrix/dbSNP标识符
1 5641055
如何筛选出这些记录?使用R,您可以从Tab1中删除最后一列中有数字的所有行,这些数字显示在46行表Tab2的第二列中
Tab1 <- Tab
我已经使用R中的alpha.centrality和bonpow包计算了无向图节点的Bonacich中心度指标。我在两个包中都使用了默认设置,当我计算两个包的相关性时,它是-0.97。两种情况下的幂指数均为默认值,即1。
bonpow软件包明确提到“正值(指数)意味着顶点随着其变化变得更强大而变得更强大”。在阿尔法中心性的情况下,情况正好相反吗?我想知道这一点,因为alpha.centrality允许我们包含权重(我想使用),而bonpow不包含权重。这些函数计算不同的东西。你查过帮助部分了吗?@
我想删除所有带有“否”的列,例如DIGSANo、SETFANo。。。我该怎么做?非常感谢。
数据在这里
一种方法是使用dplyr和在中工作的函数选择:
iris %>% select(-ends_with("Width"))
在您的情况下,您应该执行以下操作:
yourData %>% select(-ends_with("No"))
下一次,为了帮助我们帮助您,请:详细说明您试图实现的目标,提供一些可复制的,如果可能的话,提供所需的输出。要想帮你猜出自己的目的是什么是很困难的。
我想用许多不同的矩阵填充一个列表,这些矩阵是从原始矩阵中选择各种不同的样本创建的。然后重复这个过程10次。我成功地做到了(在经历了许多战斗/痛苦的学习过程之后)。如果有人能给我指出正确的方向,让我摆脱多余的代码,改进我正在使用的函数,我将不胜感激(甚至可能摆脱我收集的循环,这些循环都是我不赞成的)
我的问题在于从循环中得到不同大小的矩阵
以下是我使用的代码,有一天我渴望编写不难看的R代码:
##defining a matrix called allmat
allmat <- matrix
嗨,伙计们,我已经试了好几个星期了,但是我没能成功。网上的R传单资源也不够。我真的需要完成这件事
请帮忙,非常感谢
ui.R-->
server.R-->
库(闪亮)
图书馆(ggmap)
图书馆(单张)
shinyServer(功能(输入、输出、会话){
输出$map%
addTiles(选项=providerTileOptions(noWrap=TRUE))
}
否则{
地址%setView(lng=p$lng,纬度=p$lat,缩放=16)%>%
addTiles(选项=providerT
如何计算协方差矩阵而不使用for循环
这是一个矩阵:
ts <- structure(c(-0.63, NaN, -0.3, 0.48, 1.24, 1.39, 0.13, -0.03,
-0.03, 0.32, 0.38, 0.32, -0.05, 0.22, 0.02, -0.04, -0.38, -0.05,
0.57, -0.14, 0.05, 0.59, -1.07, NaN), .Dim = c(6L, 4L))
ts
[,1] [,2] [,3] [,
我想计算列中相同字符串的数量,如果该数量为奇数,则删除具有此类字符串的所有行。例如:
set.seed(1)
df <- data.frame(
Name = c(rep("Mark", 6), rep("Tom", 8), rep("Tim", 12), rep("Greg", 3), rep("Matt", 3)),
rand = rnorm(32, 0, 1))
set.seed(1)
df带有dplyr的解决方案
library(dplyr)
df_new <- df %&
我想使用dplyr逐行遍历数据帧,如果a==0,则将B设置为前一行中B的值,否则保持不变。但是,我希望“前一行中B的值”在计算过程中指的是前一行,而不是在计算开始之前,因为值可能已经更改了——换句话说,我希望更改向下传播。例如,使用以下数据:
dat似乎您希望采用“最后一次观察结转”的方法。最常见的R实现是zoo::na.locf,它用最后一个观察值填充na值。在这种情况下,我们需要做的就是首先将要填写的所有B值设置为NA:
mutate(dat,
B = ifelse(A ==
我有一个带有id列和布尔事件列的数据帧:
x <- data.frame(id = c(0,0,0,1,1,1,2,2,2,2,3,3,3),
event = c(F,F,F,T,F,F,F,T,F,F,F,T,T))
要尝试获取此信息,我使用以下代码:
x %>% group_by(id) %>% mutate(event_num = match(TRUE, event))
然而这给了我
id event event_num
(
当显示R笔记本的输出时,文本输出将全部显示。有没有办法只显示文本输出的第一部分,以获得输出内容的“要点”
例如,下面的输出显示了一个文本块。我意识到print()命令不知道应该显示什么。但是,在显示R笔记本时,我希望避免多页的文本输出。可以将文本输出块限制为特定大小
我不确定您所说的“要点”是什么意思,因为概要已经给出了数据帧的要点。。。但这里有各种命令可以查看一些数据集
> summary(mtcars[1])
mpg
Min. :10.40
1st
我有很多文本文件
fr.txt
no.txt
sta.txt
sto.txt
我创建了一个文件名为字符串的向量
string <- c("fr","no","sta","sto")
string如果要读取目录中的所有“.txt”文件,只需使用:
temp = list.files(pattern="*.txt")
myfiles = lapply(temp, read.table)
解释
list.files()-获取工作目录中的文件。假设您将文件(“one.txt”、“two.tx
以下内容适用于R,但不适用于浏览器
library(leaflet)
data(quakes)
map = leaflet(data = quakes[1:20,]) %>%
addTiles() %>%
addMarkers(~long, ~lat,
popup = ~as.character(mag), label = ~as.character(mag))
浏览器仅显示标记的位置。我已禁用所有浏览器扩展
问题:如何显示基础地
对于广义线性模型主题:
如何通过一次添加一个变量来构造(至少100个)模型的嵌套序列
有一个基本模型_0,E(Y)=b0+b1x1+b2x2,它是下一个复杂模型的一部分
模式是:
任务提示使用poly()和update()函数,主要任务是根据其他生成模型的生成AIC测试AIC(model_o),并应用测试统计信息
如果有人能帮我编写上述模式的代码,我将非常高兴。我找到的最简单的方法是依靠leaps::regsubsets来推导公式的所有组合
例如:
使用瑞士数据集,以生育率作为响应变量,我可以
通过将
正整数:
0.123456789101112131415161718192021
可以看出,小数部分的第12位数字是1
如果dn表示小数部分的第n位,则查找该值
下面的表达式
d1×d10×d100×d1000×d10000×d100000×d1000000
问题来源
我编写了以下代码来计算数字:
ans = data.frame(matrix(ncol = 6, nrow=2))
colnames(ans) = c(10,100,1000,10000,100000,1000000)
r
我想在几个月前提出的这个问题的基础上再接再厉
我有一些患者入院数据,我想让r检查患者入院状态,看看是否再次入院。如果患者状态是住院患者,我想回顾30天,看看是否还有其他住院患者遭遇。如果有另一个住院患者遭遇,我想填写一个30天的专栏,说是,否则填写否,如果没有。我有一些关于我需要什么的示例数据。每个患者都有一个唯一的MRN编号,该编号永远不会改变,但每次就诊都可以有多个遭遇编号。“df2”是我在评估“df”之后想要创建的。感谢您的帮助。我不确定上一篇文章是否会使用类似的设置
csn <-
我想在另一个脚本中使用一个脚本中的函数,但我要么得到一个erorr,要么什么都没有发生,这取决于我的代码语法。当我使用源(“文件名”)时,我得到一个erorr,当我添加if(存在(“函数名”,mode=“函数”)时,我什么也得不到
希望你能帮忙
祝您今天过得愉快
或者Terru\t错误完全正确:看起来您的源文件夹有问题
您可以使用getwd()检查工作目录的当前名称,并通过dir()检查包含此目录的内容。如果您的源文件放在其他位置,您应该更改当前目录或使用source()包含源文件的路径:
so
标签: R
social-networkingnetwork-analysisstatnet
我想模拟指数族随机图,我刚刚开始学习使用statnet和ergmR包。通过我在网上找到的示例,我能够从示例数据集中学习ERGM模型:
# install.packages('statnet')
# install.packages('ergm')
# install.packages('coda')
library(statnet)
set.seed(123)
data(package='ergm') # tells us the datasets in our packages
data
当数据扫描时,我经常使用.Rmd文件而不是R脚本,因为.Rmd文件更易于人类阅读。有没有一种方法可以在不生成任何类型的报告或.md的情况下执行.Rmd文件
当我从makefile执行.Rmd文件时,我使用
Rscript -e "rmarkdown::render('file.Rmd')" # which generates a report
Rscript -e "knitr::knit('file.Rmd')" # which generates an .md file
您可以使用knit
标签: R
Tree
nodesphylogenyape
R中的phylo对象可以具有内部节点标签phylo_obj$node.label,但许多R函数使用节点编号而不是节点标签。甚至phylo对象本身也使用节点编号来描述phylo_obj$边缘,并且似乎没有内部节点标签到phylo_obj$边缘使用的这些节点编号的直接映射。如何将节点标签(如NodeA或偶蹄动物)映射到节点编号(如250或212)?我找不到任何R函数,也找不到任何文档。不确定这里的目标是什么,但如果您想在边缘表中选择特定的节点编号,并在节点标签向量中选择等效的节点编号,您可以简单地使
假设我有一个包含10+1列和10行的数据帧,每个值都有相同的单位,除了一列(分组列a)。
我试图完成以下工作:给定一组基于最后一列的数据帧,如何计算整个块作为单个单片变量的标准偏差
假设我在现实中进行分组,这是一个间隔切割:
df %>% group_by(A)
根据我在本网站收集的信息,您可以使用聚合或其他dplyr方法来计算每列的方差,即:
因此,如果我有%,在结尾附加了summary…,FUN=sd,我就不会嵌入
然而我想要的是:就像在Matlab中一样
group1 = df(r
我正在尝试制作一个R脚本test.R,它可以直接从unix中的管道获取文件或文本字符串,如下所示:
file | test.R
或:
我试着去寻找答案,但我显然错过了一些东西。是上面的管道还是下面的脚本给了我这样的错误:
me@lnx: cat AAAA | test.R
bash: test.R: command not found
cat: AAAA: No such file or directory
我的测试脚本:
#!/usr/bin/env Rscript
input <-
我有一段代码搜索矩阵框的哪些行等于给定向量x。这段代码使用了apply功能,我想知道它是否可以进一步优化
x = floor(runif(4)*10)/10
boxes = as.matrix(do.call(expand.grid, lapply(1:4, function(x) {
seq(0, 1 - 1/10, length = 10)
})))
# can the following line be more optimised ? :
result <- which(sa
标签: R
ggplot2legendkernel-density
我想给一个有多条线的线图添加一个图例,每条线都是用geom_密度函数创建的。我找不到任何解决办法如何做到这一点
# This is my code:
ggplot(Flugzeiten, aes(x = Falconidae)) +
scale_x_continuous (breaks=c(0, 20, 40, 60, 80, 100, 120, 140, 160, 180, 200, 220)) +
geom_density(kernel="gaussian", size=1.2,
我试图创建一个带有rbokeh的折线图,其中x轴应该显示一个日期时间变量
考虑以下示例:
data <- tibble(
time = as.POSIXct(c("2019-08-27 08:15:00",
"2019-08-27 10:30:00",
"2019-08-27 12:45:00")),
value = c(0.3, 0.6, 0.2)
)
figure(data = data) %>%
ly_lines(x =
采取以下措施
我想在两个子图中省略X轴上的标签,如:
据称,实现这一点的方法应该是使用layout()函数,并包括配置参数xaxis=list(showticklabels=FALSE)。但是,请参见以下reprex中的输出:
library(tidyverse)
library(reshape2)
library(plotly)
p <- ggplot(tips, aes(x=total_bill, y=tip/total_bill)) + geom_point(shape=1) +
具有29000行和189列的df。我有几排
"true / Bob"
我想找到一种方法,把所有这些细胞都替换成
"Bob"
正在寻找一种解决方案,其中我不只是将“true/Bob”替换为“Bob”。试图与
gsub
lapply
尝试此操作以替换字符
as.data.frame(lapply(df, function(v) gsub(".*Bob.*","Bob",v)))
使用dplyr:
library(dplyr)
df %>% mutate_all(~ g
因此,我正在RStudio中使用CSV文件。我试图找出某一特定列中的数字之和在哪一行加起来等于0.8 80%的累积数字或接近值
这就是我提取列时它的样子
[1] 0.165705620 0.087013121 0.066435240 0.058204088 0.046089979 0.044273757 0.038910088 0.038449322 0.027019652 0.026174169
[11] 0.021463624 0.021065487 0.016690451 0.0142
标签: R
text-miningtopic-modelingtidytext
我有一个在tidytext上工作的项目,我对这个项目很陌生。我的输入数据当前以文件夹中单个.txt文件的形式存在。我成功地使用get_mountains()来跟踪数据的积极/消极情绪,但我希望做一些更高级的主题建模
我正试图摆脱这本指南,但我正在努力开始。看起来你需要做主题建模的输入数据是一个DocumentTermMatrix,我不确定如何创建它。是否有办法将我当前作为单个文件保存的数据转换成这种格式,以便我可以使用该指南中描述的方法?您可以将所有.txt文件读入df,并使用tm从中创建Do
我在将函数应用于dataframe列中的每一行以创建一个新列时遇到困难,希望您能提供一些指导。该函数是一个maxplus运算符
maxplus <- function(x, lb=0){max(x, lb)}
我想对最后一列应用maxplus,以获得GS3M_-ret的正限制。直接使用运算符会给我一个单独的数字,这不是我想要的(我希望每一行测试都是GS3M_-ret对应行的最大值和0)
我试过apply、tapply、sapply等,得到了以下的变体
apply(r_df[, "GS3
在R中有两个矩阵:
M<-matrix(c(1,4,1,3,1,4,2,3,1,2,1,2),3)
1 3 2 2
4 1 3 1
1 4 1 2
N<-matrix(c(1,1,2,2,3,4,-2,2,1,4,3,-1),3)
1 2 -2 4
1 3 2 3
2 4 1 -1
但是它太长了。任何人都可以编写一个更短(或更简单,或更容易)的代码吗?解决这个问题的最直接的
我可以轻松地将函数as.integer应用于tibble中与提供给any\u of()的列名匹配的所有列。:
这可以在数据表中实现吗?使用“按引用修改”我们可以使用set和intersect
library(data.table)
setDT(df)
for(v in intersect(cols, names(df))) {
set(df, i = NULL, j = v, value = as.integer(df[[v]]))
}
我们可以使用set和intersect
lib
当自定义顺序包含在数据框中找不到的值时,是否有方法按自定义顺序排列数据框中的行
order <- c("1", "2", "3A", "3B", "4", "R1", "R2", "O", "L")
df <- data.frame(name = letters[1:4], value = c("
当我的答案为真或假时,如何使用ggplot创建绘图
这是我的代码:
t.obese<-master1%>%
filter(Income>0,obese==TRUE)%>%
select(Income,obese)
> head(t.obese)
Income obese
1 21600 TRUE
2 4000 TRUE
3 12720 TRUE
4 26772 TRUE
使用您共享的数据(这是最小的),尝试以下操作:
我有三个dfp1,P2,P3,每三列。我想用一个循环将第二列从每个df更改为D1、D2、D3,但没有任何效果。我错过了什么
C1 <- c(12,34,22)
C2 <- c(43,86,82)
C3 <- c(98,76,25)
C4 <- c(12,34,22)
C5 <- c(43,86,82)
C6 <- c(98,76,25)
C7 <- c(12,34,22)
C8 <- c(43,86,82)
C9 <- c(98,76,2
上一页 1 2 ...
4 5 6 7 8 9 10 ...
下一页 最后一页 共 8044 页