Python 如何在R中加载和处理超大数据文件_Python_R_Statistics_Bigdata - Fatal编程技术网

Python 如何在R中加载和处理超大数据文件

python r statistics

Python 如何在R中加载和处理超大数据文件,python,r,statistics,bigdata,Python,R,Statistics,Bigdata,我必须在一个项目中处理一些非常大的数据文件，这些文件确实很大，每个文件的大小都>50G。这些文件的格式各不相同： type1 vaue1:123 type2 vaue1:234 type2 vaue1:234 type1 vaue1:234 type3 vaue1:234 ....... 我想找出一个特定类型的值，并计算该类型的平均值和中值。我使用python一个接一个地读取数据文件，最后进行计算，但速度非常慢。我想用R来帮助我，但我想知道R是否能处理这些大数据。我怀疑R能否将这些

我必须在一个项目中处理一些非常大的数据文件，这些文件确实很大，每个文件的大小都>50G。这些文件的格式各不相同：

type1  vaue1:123
type2  vaue1:234
type2  vaue1:234
type1  vaue1:234
type3  vaue1:234
.......

我想找出一个特定类型的值，并计算该类型的平均值和中值。我使用python一个接一个地读取数据文件，最后进行计算，但速度非常慢。我想用R来帮助我，但我想知道R是否能处理这些大数据。我怀疑R能否将这些数据读入数据帧

如果有人知道使用R或其他工具处理大数据的一些技巧。我现在真的需要一些建议

一种相对快速的读取数据的方法是使用包

data.table中的fread

d <- fread("myfile.txt", header = FALSE, sep = ":")
summary(d$V2)

d“我真的需要一些建议”不是一个合适的问题（或者，就此而言，根本不是一个问题）。互联网上其他地方有很多使用R处理“大数据”的资源，我建议你做一些研究。




[r]相关文章推荐



                                                        
在R中，根据匹配的行值将数据从一个数据帧提取到另一个数据帧中
rmergedataframe 
R optim在最终迭代之后做什么？
r 
迭代数据帧，然后根据R中的相同名称对数据集应用函数
rloopsdataframe 
tm软件包中不再支持Dictionary（）。如何修订代码？
r 
R 如何创建从两个导入的csv文件返回数据帧的函数
r 
R 创建标识组中最小字符的列，并标记领带
r 
R 日期，润滑增加1个月
r 
R 如何在使用均值时忽略NA？
r 
使用SparkR和SPARKYR在Spark数据帧上运行-不现实的设置？
rapache-spark 
pdf到txt电视或R、ubuntu中的vcf
rpdf 
R、 web抓取、rvest、transfermarkt数据
rweb-scraping 
如何在r中按组生成汇总表？
r 
R Web抓取网站的多个级别
rweb-scraping 
拟合由'leaps:：regsubsets'选择的多项式回归模型`
r 
当匹配所有数字时，r代表循环
rfor-loopdataframe 
tidyr gather（）有问题
r 
使用purl从Rnw文件中生成.Rmd文件
r 
R 带ggplot的一个图中的两个图
r 
使用Google Sheets4在R中使用访问令牌访问电子表格
r 
R 按相同ID对所有列求和
r 
                                       





随机文章推荐



                                                        
Android fragments 更快地改变碎片的屏幕方向
android-fragmentsandroid 
Android fragments 为什么可以'；嵌套片段是否使用XML？
android-fragments 
Android fragments Android:Viewpager，带有调用asynctask的片段
android-fragments 
Android fragments 无法从preference.xml检索android首选项
android-fragments 
Android fragments 仅在Android活动或片段中加载项目一次
android-fragments 
Android fragments 单击按钮从另一个片段调用片段
android-fragments 
Android fragments 如何使用getLoaderManager（）；使用片段？-。。。实现LoaderManager.LoaderCallbacks<；光标>；
android-fragments


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python 检查脚本用户是否具有类root权限的最佳方法是什么？
									Python
							 
Python 如何关闭pyPDF“；“PdfFileReader”；类文件句柄
									Python
							 
Python numpy数组中的索引混淆
									Python
							 									Arrays
							 									Numpy
							 
Python：日志模块-全局
									Python
							 									Logging
							 									Module
							 
Python 使用数组生成随机文本
									Python
							 									Arrays
							 
Python 检测字符串中的重复
									Python
							 									Regex
							 
Python 使用Django使用RESTful API
									Python
							 									Django
							 									Django Models
							 
来自Python的7zip命令
									Python
							 
Python 你能解释一下这个“递归”吗；n选择“k”；对我说什么？
									Python
							 									Recursion
							 
如何在python中只比较日期（而不是时间）
									Python
							 									Date
							 									Datetime
							 
python subprocess.call（）；没有这样的文件或目录；
									Python
							 
Python 如何从局域网上的另一台PC访问瓶子开发服务器？
									Python
							 									Windows
							 									Web Services
							 
Python 将浮点数转换为特定精度，然后复制到字符串
									Python
							 									String
							 									Floating Point
							 
列表理解中的Python异常处理
									Python
							 									Exception Handling
							 
python:sys未定义
									Python
							 
Python 如何测试函数的相等性或一致性？
									Python
							 
Python 如何从电子邮件中获取csv附件并保存
									Python
							 									Csv
							 									Python 2.7
							 
Python OpenCV-waitKey（0）没有响应？
									Python
							 									Opencv
							 
Python 更改胡须末端在matplotlib'中的表示形式；s箱线图函数
									Python
							 									Matplotlib
							 
Python 具有多索引列的数据帧-合并级别
									Python
							 									Pandas
							 
Python代码覆盖率和多处理
									Python
							 
使用Python创建shell命令行应用程序并单击
									Python
							 
Python 有没有'；从生成器'；产生所有输出；？
									Python
							 									Python 2.7
							 
Python 为什么空白集的显式测试不起作用
									Python
							 									Python 3.x
							 
使用python在Elasticseach中进行批量部分升级
									Python
							 
Python 基于numpy/scipy的快速b样条算法
									Python
							 									Numpy
							 
Python 如何使用numpy阵列创建pydub音频段？
									Python
							 									Numpy
							 									Audio
							 
Python 为什么在更新字典时却一无所获？
									Python
							 									Dictionary
							 
Python 在列表中查找numpy数组的索引
									Python
							 									Arrays
							 									List
							 									Numpy
							 
Python可以实现依赖类型吗？
									Python
							 									Types
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Fonts
Core Data
Python 3.x
Combobox
Synchronization
Makefile
Programming Languages
Hibernate
Jekyll
Prestashop
Typo3
Migration
Grid
Reporting Services
Azure Service Fabric
Jhipster
Assembly
Common Lisp
Unit Testing
Hyperlink
Sqlalchemy
Vba
Email
Collections
Ibm Cloud
Mysql
Video Streaming
.htaccess
Mvvm
Zend Framework
Keras
Unix
Oauth 2.0
Sprite Kit
Opencl
Ruby
Jsp
Kubernetes
Apache Pig
Stanford Nlp
Nativescript
Image Processing
Npm
Cakephp
Webrtc
Coding Style
Google Analytics
Embedded
Compilation
Compiler Construction
Ms Office
Plone
Spring Batch
Elixir
Google Sheets
Osgi
Windows Installer
Netsuite
Sql Server 2012
Raspberry Pi
Sublimetext2
Events
Gps
Ibm Mq
Computer Science
Spring
Spring Integration
Aurelia
Ant
Prometheus
Yaml
Windows Phone 7
Sugarcrm
Xpath
Dependency Injection
Arduino
Encryption
Docusignapi
Fortran
Transactions
Shell
Snmp
Hbase
Gridview
Wolfram Mathematica
Tensorflow
Ios4
Stored Procedures
Variables
D
Time Complexity
Gstreamer
Amp Html
Salesforce
Ios6
Entity Framework
Less
Android Ndk
Datatables
Parallel Processing
Sitecore
Rabbitmq
Cassandra
Ffmpeg
Validation
Grafana
Colors
Couchbase
Sharepoint 2007
Gmail
Keycloak
Corda
Nestjs
Ethereum
Inno Setup
Big O
Qt4
Selenium
Antlr
Xml
C# 3.0
Pip
Mariadb
Iis 7
Jdbc
Linux
Dataframe
Wix
Twilio
Ember.js
Scripting
Twitter Bootstrap 3
Ruby On Rails 4
Netlogo
Ubuntu
Ipad
Methods
Web Applications
Gdb
Groovy
Asp.net
Functional Programming
Tabs
Powerbi
Github
Orientdb
Google Maps Api 3
Facebook Graph Api
Cryptography
Marklogic
User Interface
Glassfish
Proxy
Model
Sms
Umbraco
Qt
Telerik
Checkbox
Maps
Robotframework
Soap
Replace
Cocoa
Playframework
Asp.net Mvc
Csv
Nest
Actionscript
Odata
Iphone
Macos
Merge
Windows Runtime
Ocaml
Google Apps Script
Webview
Antlr4
Google Cloud Storage
Mobile
Firefox
Laravel 5
X86
Jqgrid
Uwp
Unicode
Phpmyadmin
Api
Cucumber
Sql
Openlayers
C
Reflection
Spring Cloud
Autohotkey
Android
Pointers
Angular
Css
Tree
Time


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网