R在使用函数DIST（110 GB向量）时中止_R_Macos_Ram_Hierarchical Clustering_Hierarchical - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/matlab/14.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R在使用函数DIST（110 GB向量）时中止_R_Macos_Ram_Hierarchical Clustering_Hierarchical - Fatal编程技术网

R在使用函数DIST（110 GB向量）时中止

r macos

R在使用函数DIST（110 GB向量）时中止,r,macos,ram,hierarchical-clustering,hierarchical,R,Macos,Ram,Hierarchical Clustering,Hierarchical,我需要在一个包含173000行和17列的数据集上运行R中的分层聚类算法。在数据集上运行函数dist（）时，R将中止。我也曾在一台Windows pc上试用过，收到的错误消息是“无法分配大小为110.5 Gb的向量” 我的Mac和Windows pc有4 GB内存有没有办法在R中继续这样做？我知道分层算法对于大型数据集不是最好的，但是大学作业需要它谢谢首先，非常感谢您提供一个reprex（可复制的示例）。以后一定要做说到这个问题，您可以使用sample\u frac函数（如果我没有弄错的话

我需要在一个包含173000行和17列的数据集上运行R中的分层聚类算法。在数据集上运行函数dist（）时，R将中止。我也曾在一台Windows pc上试用过，收到的错误消息是“无法分配大小为110.5 Gb的向量”

我的Mac和Windows pc有4 GB内存

有没有办法在R中继续这样做？我知道分层算法对于大型数据集不是最好的，但是大学作业需要它

谢谢

首先，非常感谢您提供一个reprex（可复制的示例）。以后一定要做

说到这个问题，您可以使用

sample\u frac

函数（如果我没有弄错的话，这是来自

tidyverse

软件包的函数）。例如，

sample\u frac（您的\u数据，.5）

将对数据帧的50%进行采样。它将减少要群集的数据的大小，并使您的笔记本电脑更方便

另一种方法是扩展

内存.limit（size=n）

，其中

是以兆字节为单位的数字。

首先，非常感谢您提供一个reprex（可复制的示例）。以后一定要做

说到这个问题，您可以使用

sample\u frac

函数（如果我没有弄错的话，这是来自

tidyverse

软件包的函数）。例如，

sample\u frac（您的\u数据，.5）

将对数据帧的50%进行采样。它将减少要群集的数据的大小，并使您的笔记本电脑更方便

另一种方法是扩展

内存.limit（size=n）

，其中

是一个以兆字节为单位的数字。

这个问题可以通过编写一个函数来解决，该函数可以计算数据集列之间的成对欧几里德距离，下面假设为表格形式。对于其他距离，可以编写类似的函数

dist2 <- function(X){
  cmb <- combn(seq_len(ncol(X)), 2)
  d <- matrix(NA_real_, nrow = ncol(X), ncol = ncol(X))
  if(!is.null(colnames(X)))
    dimnames(d) <- list(colnames(X), colnames(X))
  
  for(i in seq_len(ncol(cmb))){
    ix <- cmb[1, i]
    iy <- cmb[2, i]
    res <- sqrt(sum((X[, ix] - X[, iy])^2))
    d[ix, iy] <- d[iy, ix] <- res
    diag(d) <- 0
  }
  
  d
}

dist2这个问题可以通过编写一个函数来解决，该函数用于计算数据集列之间的成对欧几里德距离，下面假设为表格形式。对于其他距离，可以编写类似的函数
dist2 <- function(X){
  cmb <- combn(seq_len(ncol(X)), 2)
  d <- matrix(NA_real_, nrow = ncol(X), ncol = ncol(X))
  if(!is.null(colnames(X)))
    dimnames(d) <- list(colnames(X), colnames(X))
  
  for(i in seq_len(ncol(cmb))){
    ix <- cmb[1, i]
    iy <- cmb[2, i]
    res <- sqrt(sum((X[, ix] - X[, iy])^2))
    d[ix, iy] <- d[iy, ix] <- res
    diag(d) <- 0
  }
  
  d
}

dist2尝试从数据中提取一个子样本进行聚类。如果此解决方案不适用于您的目的，请扩展memory.limit（）
欢迎使用Stackoverflow：请提供一个从您的数据中提取子样本进行聚类的尝试。如果此解决方案无法满足您的需要，请扩展memory.limit（）
欢迎使用Stackoverflow：请提供一个奇妙的解决方案，但是我认为您在测试后忘记将for循环中的m
对象更改回X
@你好，朋友好，谢谢！更正。@RuiBarradas非常感谢您！！！但是我得到了这个错误：矩阵中的错误（r，nrow=len.r，ncol=count）：无效的“ncol”值（太大或NA）另外：警告消息：在combn中（沿（X），2）：矩阵中的错误（r，nrow=len.r，ncol=count）：无效的“ncol”值（太大或NA）你知道我为什么会得到这个结果，以及是否有办法解决它吗？@Msms你的数据集有多少列。@RuiBarradas 17列的理想解决方案，但是我认为你在测试后忘记将for循环中的m
对象改回X
@你好，朋友好，谢谢！更正。@RuiBarradas非常感谢您！！！但是我得到了这个错误：矩阵中的错误（r，nrow=len.r，ncol=count）：无效的“ncol”值（太大或NA）另外：警告消息：在combn中（沿（X），2）：矩阵中的错误（r，nrow=len.r，ncol=count）：无效的“ncol”值（太大或NA）你知道我为什么会这样吗？是否有办法解决它？@Msms你的数据集有多少列。@ruibradas 17列




[macos]相关文章推荐



                                                        
Macos 登录时自动装载DMG文件
macos 
Macos 如何在Mac上键入Outlook 2011时禁用自动大写？
macosoutlook 
Macos Can'；t禁用系统键盘快捷键
macoscocoa 
Macos -找不到bash:otool:command，您能教bash一个默认位置来查找命令吗？
macosbashshell 
Macos 如何访问TWRequest.h
macostwitter 
Macos 使用MAMP Pro php.ini代替OSX php
macosphp 
Macos Can'；t在mac上打印mpdf生成的pdf文件
macospdfprinting 
Macos 如何通过Entity1与Cocoa绑定的关系在Entity2中设置核心数据属性
macoscore-data 
Macos 在MAC上安装Clang
macosc++11clangllvm 
Macos DrawRect和NSPROGRESS指示器
macoscocoa 
Macos 如何显示所有应用程序实例的流程信息？
macosprocess 
Macos 使用NSTextStorage和UNDO跟踪修改的状态
macos 
Macos Mac应用程序安装：安装应用程序时如何获取目标磁盘？
macosinstallation 
Macos VisualSFM构建
macosbuild3d 
Macos 我们可以通过命令行更改mac中的默认网关和接口吗
macosinterfaceroutes 
Macos mac OS X上的SocialPushAgent是什么？它的作用是什么？
macos 
Macos Shaders.metal仅获取鼠标的y值
macos 
Macos 如何安装bower.json和package.json依赖项osx
macosasp.net-coreasp.net-core-mvc 
如何在MacOs中向文件添加版本和版权信息
macosgo 
Macos 如何在Mac上打印x86汇编（NASM）中的有符号整数
macosassembly 
                                       





随机文章推荐


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
在R中使用system（）
									R
							 
R 哪些组包含值更优雅的代码？
									R
							 
R 将向量的唯一元素映射到另一个集合
									R
							 									Vector
							 
如何将R中的所有行合并为一行？
									R
							 									Matrix
							 									Dataframe
							 
R：计算重叠球体的体积
									R
							 
使用OFFSET可获得更多的结果！代码的其余部分也是我的当前状态，这并不是我要查找的结果。请注意，结果是以服务器选择的任意顺序返回的，这可能随每次执行而变化，因此，在使用LIMIT+OFFSET@Martin Dabbel Ju melter时，您应该始终
									R
							 									Sparql
							 
R 彩色图例
									R
							 
R 如果时间差小于id和类型的值，则求和
									R
							 									Dataframe
							 									Time
							 
如何基于rs.surv（R中的相对生存率）生成图形
									R
							 									Graphics
							 
R 最大长度或常数
									R
							 									Indexing
							 
R 饼图标签
									R
							 
R 找不到绘图函数对象时出错
									R
							 
R 检查单选按钮并按下操作按钮后打印
									R
							 									Shiny
							 
R 艾布琳赢得'；不显示
									R
							 									Graph
							 									Graphics
							 
R中时间序列方差和均值变化的检测
									R
							 
R 具有每个条形图的堆叠百分比的分组条形图
									R
							 
R 如何将日期格式化为日期名称+；周数
									R
							 									Date
							 
如何从R运行Stack Exchange Data Explorer查询并将结果返回到R会话？
									R
							 
I'；我试图将excel文件上载到我的RStudio服务器时出错
									R
							 
R 如何安装gpclib？
									R
							 
如何在使用rChart软件包中的nplot时向x轴添加标签
									R
							 
Rcpp：未定义符号：创建包时的BaseStream
< >我想创建一个R包，包含其他人编写的C++代码。它是poppler的一个实验分支，还没有被纳入到poppler的主版本中。这些变化涉及几个C++文件，原因是：

我需要创建一个包
我无法创建一个具有所需功能的.cpp文件，也无法使用配置文件（例如R包PDFtools）将R包链接到poppler的本地安装
									R
							 
R 摆脱NA'；它在一列中吗？
									R
							 
R 数据帧中列的条件更改
									R
							 									Dataframe
							 									If Statement
							 
R 蒙古特子串查询
									R
							 									Mongodb
							 
R 使用循环对数据集进行子集-将文件拆分为更小的多个数据集
									R
							 									Database
							 									Loops
							 									Parsing
							 
R 如何将多元线性回归方程添加到绘图底部？
									R
							 
生成模拟时使用for循环时出错
									R
							 									For Loop
							 
为什么我的嵌套ifelse在R中不能正常工作
									R
							 									If Statement
							 
R根据后续观察结果创建新变量/列
									R
							 									Vector
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Ipad
Vb6
Tomcat
Automated Tests
Proxy
Pine Script
Fullcalendar
Wso2
Post
Scikit Learn
Smtp
Cobol
Apache Pig
Wicket
Laravel 5
D
Arangodb
Interface
Autodesk Forge
Tfs
Delphi
Nhibernate
Google Analytics
Bootstrap 4
Image
Qt
Amazon Ec2
Haskell
Rss
Sequelize.js
Gis
Cygwin
Sdk
Arrays
Sparql
Cmd
Join
Flash
Events
Php
C# 3.0
Ubuntu
Cors
Visual Studio 2017
Azure Service Fabric
Odoo
Office365
Joomla
Geometry
Sql Server 2005
Java
Language Agnostic
Excel
Graph
Codeigniter
Azure Data Factory
Jmeter
Asp.net Mvc
Breeze
Botframework
Activerecord
Unicode
Docusignapi
Ios7
Openshift
Loops
Parsing
Memory Management
Ajax
Keycloak
Date
Firefox Addon
Identityserver4
Cucumber
Search
Internet Explorer
Android Layout
Typescript
Collections
Authentication
Protractor
Youtube
Jasper Reports
Google Bigquery
Eclipse Plugin
Jsp
Jqgrid
Sed
Kernel
Linker
Hbase
Couchbase
Openerp
Hash
Pip
Llvm
Python 2.7
Azure Sql Database
Exception Handling
Markdown
Socket.io
Awk
Lotus Notes
Apache Spark
Recursion
Opencv
Amazon Cloudformation
Terminal
Model View Controller
Autocomplete
Vbscript
Optimization
Ffmpeg
Logging
Mdx
Routing
Julia
Xcode
Jestjs
Web Services
Svn
Sublimetext3
Memory
Material Ui
Web
Teamcity
Yii2
Qml
Pointers
Elm
Cordova
Xsd
Sharepoint 2013
Android Fragments
Mercurial
Junit
Migration
Snowflake Cloud Data Platform
Vim
Google Cloud Storage
Terraform
Phpstorm
Android Ndk
Exception
Android Studio
Blazor
Django Models
Virtualbox
Liferay
Axapta
Ruby On Rails 3.2
Google Plus
Azure Ad B2c
Db2
Python
Reporting Services
Xmpp
Opengl
Bison
Node.js
EmptyTag
Menu
Ember.js
Google Compute Engine
Cluster Computing
Emacs
Ios
Kendo Ui
Algorithm
Shiny
Configuration
Vmware
Testing
Facebook
Intellij Idea
Plone
Gps
Twig
Javafx 2
Validation
Mongoose
Nuget
Dynamics Crm 2011
Azure Functions
Url
Yii
Webstorm
Permissions
Sharepoint 2007
Asterisk
Openid
Scheme
Synchronization
Asp.net Mvc 3
Enums
Air
Ibm Mq
Monitoring
Sugarcrm
Antlr4
Isabelle


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网