Python 内存和磁盘上的文件大小不同_Python_Pandas - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/305.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/date/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 内存和磁盘上的文件大小不同_Python_Pandas - Fatal编程技术网

Python 内存和磁盘上的文件大小不同

python pandas

Python 内存和磁盘上的文件大小不同,python,pandas,Python,Pandas,我刚刚使用pandas函数编写了一个csv文件。我可以看到磁盘上这个文件的大小是13GB。我想使用pd.read\u csv将此文件读回pandasdataframe。在中读取此文件时，我监视服务器的内存使用情况。结果表明，在中读取此文件所消耗的内存为30GB+并且该文件从未被读取。我的jupyter笔记本的内核死了，我必须再次启动这个过程我的问题是，为什么会发生这种行为？写和读文件是一段非常简单的代码，为什么空间要求不同呢？最后，如何读取此文件？在加载时使用块来最小化内存使用 import

我刚刚使用

pandas

函数编写了一个csv
文件。我可以看到磁盘上这个文件的大小是13GB。我想使用pd.read\u csv
将此文件读回pandas
dataframe
。在中读取此文件时，我监视服务器的内存使用情况。结果表明，在中读取此文件所消耗的内存为30GB+并且该文件从未被读取。我的jupyter笔记本的内核死了，我必须再次启动这个过程
我的问题是，为什么会发生这种行为？写和读文件是一段非常简单的代码，为什么空间要求不同呢？最后，如何读取此文件？
在加载时使用块来最小化内存使用
import pandas as pd
chunksize = 10 ** 8
chunks=pd.read_csv(filename, chunksize=chunksize):
df=pd.concat(chunks, ignore_index=True)

如果这不起作用，这将调用for循环内的垃圾收集器，可能会有一些轻微的性能改进
import pandas as pd
import gc
chunksize = 10 ** 8
dfs = []
for chunk in pd.read_csv(filename, chunksize=chunksize):
    dfs.append(chunk)
    gc.collect()
final_df = pd.concat(dfs)

as问题的可能重复也表明了很多问题。我得到错误NameError:未定义名称“进程”
。我相信它需要导入。因此我使用了完全相同的代码，并对chunksize的值进行了一些调整，我仍然遇到MemoryError
。这是我的代码：chunks=pd.read\u csv（'filename.csv'，chunksize=10000）f=pd.DataFrame（）%time df=pd.concat（chunks，ignore\u index=True）




[pandas]相关文章推荐



                                                        
Pandas 用python从yahoo finance自动下载历史股价
pandas 
Pandas 如何转置数据帧？
我有一个DATAFRAME（GROMPBY PAR“NR”）的结果
pandasdataframe 
Pandas 熊猫及；AWS Lambda
pandasaws-lambda 
Pandas 分组计算百分比
pandas 
Pandas 熊猫：前n组，前n组
pandas 
Pandas 根据索引字符串中的字符删除行
pandas 
Pandas 如何使用wb api选择最近提取的值
pandasdataframeindexing 
Pandas 熊猫数据阅读器为谷歌金融服务
pandas 
Pandas 熊猫通过索引提取数据
pandasindexing 
Pandas 重命名列返回str对象没有属性'；重命名'；
df3.rename（列={'Impressions'：'Impressions Served'}，inplace=True）
重命名（列={'Impressions'：'Impressions Served'}，inplace=True）
---------------------------------------------------------------------------
AttributeError回溯（最近一次呼叫上次）

pandas 
Pandas 计算两个日期之间的周末数（周六和周日）
pandas 
Pandas 查找Dataframe.plot.kde（）的x，y坐标

我试图确定kde/高斯分布的峰值坐标（x，y）
曲线
如何从中获取X值和Y值
丢失_mae.plot.kde（…），以便获取argmax（）
pandasdataframe 
Pandas 如何使用pd.date\u range筛选行？
pandas 
Pandas 左合并后令人困惑的索引更改
pandas 
pandas to_拼花地板：在写入之前清理现有目录
pandas 
Pandas 数据帧的ram大小v.s.xlsx保存的大小
pandas 
即使使用.loc方法，pandas中的CopyWarning也会出现意外设置
pandas 
Pandas 如何在大熊猫的深层嵌套“groupby”中聚合一些级别？
pandas 
Pandas 给定时间点观测值和子集之间的最大Doc2vec相似性
pandasfunctionparallel-processing 
Pandas 如何减去熊猫列表中的元组元素并应用条件？
pandaslistnumpy 
                                       





随机文章推荐


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Exchange Server
Acumatica
Android Studio
Cocos2d X
Vba
Less
Architecture
Maps
Datatables
Gdb
Apache Storm
Svg
Dojo
Yii
Ionic Framework
Extjs
Nativescript
Puppet
Neural Network
Uitableview
Jhipster
Maven 2
Wso2
Webstorm
Java Me
Ruby On Rails 3
Ada
Elixir
Asp.net Mvc 4
Xamarin.forms
Netty
Opencl
Selenium Webdriver
Oracle
Sublimetext3
Parallel Processing
Xamarin.ios
Awk
Teamcity
Windows Installer
Video Streaming
Ide
Model View Controller
Ftp
Testing
Ssl
Formatting
Google Cloud Platform
Shopify
Ethereum
Design Patterns
Python Sphinx
Automation
Ibm Cloud
Hibernate
Collections
Jvm
Wxpython
Linq To Sql
Postgresql
Jquery Mobile
Android Emulator
Doctrine Orm
React Native
Sbt
Windows Phone
Directory
Couchbase
Csv
Cassandra
Build
Select
Drupal 6
Menu
Jmeter
Twitter Bootstrap
Oop
Udp
Combobox
Zurb Foundation
Fonts
Algorithm
Instagram
Markdown
Phpstorm
Sms
Oracle Apex
Bison
Validation
Cypress
Influxdb
Sass
Documentation
Rest
Opengl Es
Ibm Mq
Meteor
Logging
Reference
Redirect
Robotframework
Microservices
Amazon Web Services
Types
Apache Flink
Playframework
Orchardcms
Vhdl
Jupyter Notebook
Encryption
Amp Html
Leaflet
Biztalk
Entity Framework Core
Windows Runtime
Requirejs
Sugarcrm
Android
Cygwin
Identityserver4
Google Calendar Api
Stripe Payments
Mobile
Ecmascript 6
Wpf
Graphql
Sharepoint 2013
Sql Server
Ssh
Responsive Design
Spring Boot
Qt
Ruby On Rails 3.2
Sencha Touch 2
Vb6
Scala
Cobol
Gnuplot
Autodesk Forge
Apache Nifi
Github
Recursion
Xquery
Moodle
Camera
Resharper
Utf 8
Playframework 2.0
Adobe
Woocommerce
Gulp
Omnet++
Sublimetext2
Binary
Io
Wix
Wolfram Mathematica
Postman
Breeze
Wcf
Selenium
Asterisk
Subsonic
Yaml
Webgl
Network Programming
Python 2.7
Protocol Buffers
Razor
Fiware
Lucene
Sml
Linq
Maven
Mips
Compiler Construction
Haskell
Tkinter
Rabbitmq
Doctrine
Uwp
Ms Access
Electron
Docker
Azure Service Fabric
Jquery Plugins
System Verilog
Asp.net Mvc 2
Speech Recognition
Asp Classic
Asp.net Core Mvc
Windows 7
Json
Post
Scrapy
Pdf
Struct
Email
Testng
EmptyTag
Workflow


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网