R 数据性能。较小数据集汇总统计表_R_Data.table - Fatal编程技术网

R 数据性能。较小数据集汇总统计表

r

R 数据性能。较小数据集汇总统计表,r,data.table,R,Data.table,当使用data.tablej表示法在较小的数据集（例如100000行或更少）上计算整列（无需分组处理）的汇总统计信息时，与直接访问元素相比，性能似乎出人意料地慢： library(microbenchmark) library(data.table) df <- data.frame(x=rnorm(10000, 0, 0.05)) dt <- data.table(df) microbenchmark(prod(df$x + 1)^(12 / NROW(df)) - 1,

当使用data.table

表示法在较小的数据集（例如100000行或更少）上计算整列（无需分组处理）的汇总统计信息时，与直接访问元素相比，性能似乎出人意料地慢：

library(microbenchmark)
library(data.table)
df <- data.frame(x=rnorm(10000, 0, 0.05))
dt <- data.table(df)

microbenchmark(prod(df$x + 1)^(12 / NROW(df)) - 1,
               prod(dt$x + 1)^(12 / NROW(dt)) - 1,
               dt[,prod(x + 1)^(12 / .N) - 1], times=10000)

Unit: microseconds
                             expr     min       lq      mean   median       uq
 prod(df$x + 1)^(12/NROW(df)) - 1  51.210  58.0725  85.34422  62.0715  69.8885
 prod(dt$x + 1)^(12/NROW(dt)) - 1  68.514  76.4710 107.49639  80.6950  89.5425
    dt[, prod(x + 1)^(12/.N) - 1] 777.879 829.9515 951.92379 852.7325 916.0155

库（微基准）
库（数据表）
df不使用10k迭代，使用更大的数据集。如果我确实使用df，它似乎在100万行左右收支平衡，因此似乎有一个固定的开销。我编辑了这个问题以反映这一点。问题是，有没有办法避免这些开销，或者在某些情况下最好避免使用[.data.table
语法，例如当它在一个函数中使用时，该函数在许多较小的数据集上被多次调用。好的。即使在这种情况下，仍然需要几微秒（…将在…）来编辑它.我想如果你使用的是数百万人使用的某个在线应用程序，这可能很重要…？这不是我在正常统计工作中能想象到的问题。它是在迭代过程中调用的，通过算法生成了许多小数据集。这在这一点上不是一个主要问题，但因为我不是一个真正的数据收集者.餐桌专家，我想知道我是否遗漏了什么。




[c# 3.0]相关文章推荐



                                                        
C# 3.0 将不可为null的类型转换为可为null类型的基础知识
c#-3.0 
C# 3.0 从服务器（套接字）解压缩gzip响应
c#-3.0 
C# 3.0 如何更好地重写这个repeat函数
c#-3.0 
C# 3.0 我们可以使用c检查远程计算机上的文件夹权限吗#
c#-3.0 
C# 3.0 为什么B类抛出错误
c#-3.0 
                                       





随机文章推荐



                                                        
If statement 不会像我想的那样工作
if-statementlua 
If statement 在awk命令中使用用户设置变量
if-statementawk 
If statement 咖啡手稿：“我喜欢咖啡。”；否则"；数组内理解
if-statementcoffeescript 
If statement 查找最大值+；ve/-ve Matlab中变量的值？如果变量不低于0，如何返回0，反之亦然？
if-statement 
If statement 我的电子程序不工作了
if-statementfor-looppython-3.xinput 
If statement 如何使用jinja的if语句在jade中添加类
if-statement 
If statement 处理时出错[TRUE==FALSE]
if-statementtestingjmeter 
If statement 在GW-BASIC中嵌套IF…THEN…ELSE
if-statement 
If statement If-then-else在Ocaml中简化
if-statementocaml 
If statement 何时使用；如果；及；什么时候；在Clojure？
if-statementclojure 
If statement 如果Else+JOption，为什么我的JOption窗格不显示？
if-statement 
If statement “更新”操作在以下情况下不起作用；如果条件是“；以活动形式YII2引入
if-statementyii2 
If statement 如何连接C++；使用三元运算符生锈的代码？
我如何将C++代码移植到锈蚀：< /p>
auto sgnR = (R >= 0.) ? 1. : -1.;
if-statementrust 
If statement 如果，那么，表中的ELSEIF语句
if-statementtableau-api 
If statement 根据另一列的内容，使用其他工作表中的数据填充列
if-statementgoogle-sheets 
If statement 为什么IF公式中的my TODAY函数返回的值不是0？
if-statementgoogle-sheets 
If statement Katalon记录器：如果变量包含一些文本-真/假
if-statement 
If statement SUBSTR IF语句中的何处
if-statement


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
在哪些情况下，人们更愿意从重塑中熔化，而不是从plyr中使用ddply？I'；我正在努力学习它们，它们看起来很相似
									R
							 
使用for循环匹配R中的数据帧对
									R
							 									For Loop
							 									Merge
							 
用gridExtra安排GGally地块？
									R
							 
有没有办法阻止表格在R中排序
									R
							 									Sorting
							 									Csv
							 
&引用；参数表示不同的行数：475055938“；predict（）中的错误？
									R
							 									Dataframe
							 
函数获取类R映射中两个矩阵的行
									R
							 
如何在R中执行引导配对t检验？
									R
							 									Statistics
							 
R ggplot2-仅对记号使用x值的子集
									R
							 
R中一行矩阵中的多个替换
									R
							 									Matrix
							 
命令行相当于；“运行文档”；对于R版本>；=3.2.2以便标记文件可以访问全局环境
									R
							 									Shiny
							 
使用knitr将R标记为pdf
									R
							 									Pdf
							 
R中的标记似然等高线图
									R
							 
如何从R连接到.accdb数据库
									R
							 									Ms Access
							 
R 如何传递参数列表以部分匹配函数'；s参数？
									R
							 
按子集取消缩放R中的子集数据
									R
							 									Loops
							 
要求r函数在全局环境中使用对象，而不是对象的副本
									R
							 									Function
							 									Memory
							 
R 未显示ggplot2中的几何图形文字
									R
							 									Plot
							 
参数默认为“0”的dplyr函数&引用；
									R
							 
R-如何将时间戳列添加到数据帧定义中
									R
							 									Dataframe
							 
闪亮：当EventResponsive函数将另一个EventResponsive函数的输出作为输入时，ignoreNULL不工作？
									R
							 									Shiny
							 
如何保持合并和编织期间创建的合并Rmd文件
									R
							 
需要帮助安装R3.3.3的VGAM包吗
									R
							 
R write.table in for循环-跳过第一次迭代
									R
							 									For Loop
							 
R 有光泽的绘图不显示数据
									R
							 									Shiny
							 
R中的堆叠钢筋和普通钢筋
									R
							 									Plot
							 
如何在R中的多个列上使用具有多个模式的grepl筛选data.table
									R
							 
R ifelse使因子'；忘记'；其级别顺序
									R
							 
如何按r中的连接组进行筛选
boys
									R
							 
R中mutate（）函数的子集矩阵
									R
							 									Dataframe
							 									Matrix
							 
R 如何添加ggplot2网格线或颜色以通过变量（y轴）显示多个打印点？
									R
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Jetty
Cobol
Tags
Parallel Processing
E Commerce
Qt4
Cucumber
Kubernetes
Google Visualization
Deep Learning
Couchdb
Python
Localization
Linq
Mono
Qml
Python Sphinx
Opencl
Web Scraping
Streaming
Asp.net Mvc
Junit
Gatsby
Mariadb
Vuejs2
Discord.py
Vim
Winforms
Memory
Mod Rewrite
Symfony1
Combobox
Ios5
Sdk
Zsh
Apache Nifi
Parse Platform
.net Core
Ethereum
EmptyTag
Wix
C++11
Nhibernate
Ibm Mq
Spring
Xna
Checkbox
Here Api
Identityserver4
Eclipse
Javafx 2
Routes
Scala
Excel Formula
Gps
Gulp
System Verilog
Laravel 4
Dependency Injection
Logstash
Ibm Cloud
Map
Xsd
Sugarcrm
Primefaces
Visual Studio
Firebase
Openstack
Wordpress
Apache Zookeeper
Ios
Curl
Botframework
Razor
X86
Dynamics Crm
Automated Tests
Yii2
Silverlight
Directx
Drupal
Asynchronous
Sql
Gis
Iphone
Redis
Latex
Class
Elixir
Sparql
Printing
Sublimetext2
Leaflet
Cakephp
Silverstripe
Glsl
Nosql
C++
Mapreduce
Unit Testing
Material Ui
Udp
Timer
Codeigniter
Fortran
Wicket
Rss
Jboss
Webstorm
Uwp
Sqlite
Asp.net
Logic
Puppet
Sonarqube
Arduino
Angularjs
Properties
Routing
Autocomplete
Next.js
Linq To Sql
Docker Compose
Resharper
Ms Word
File
Cryptography
Image
Stream
Dynamics Crm 2011
Postman
Facebook
Oracle10g
Object
Time Complexity
Command Line
Windows Phone 8
Datetime
Button
Ionic Framework
Workflow
Awk
Encoding
C#
Weblogic
Struct
Bluetooth
Tomcat
Sass
Scheme
Alfresco
Camera
Keyboard
Subsonic
Typo3
Wcf
Ssis
Bazel
Transactions
Audio
Fiware
Nativescript
Jdbc
Twilio
Npm
Angular Material
Navigation
Actionscript 3
Blazor
F#
Mysql
Oracle
Umbraco
Teradata
Proxy
Processing
Linux Kernel
Cygwin
Openssl
Jasper Reports
Neural Network
Azure Data Factory
Data Binding
Sip
Dynamic
Visual Studio 2012
Session
Aurelia
Network Programming
Menu
Aws Lambda
Ssas
Wso2
Ssh
Hadoop
Matplotlib
Google Cloud Storage
Floating Point
Google Colaboratory
Antlr
Install4j


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网