Python 如何保持大熊猫的记忆效率？_Python_Python 3.x_Pandas_Memory Management_Garbage Collection - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/293.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/18.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何保持大熊猫的记忆效率？_Python_Python 3.x_Pandas_Memory Management_Garbage Collection - Fatal编程技术网

Python 如何保持大熊猫的记忆效率？

python python-3.x pandas memory-management

Python 如何保持大熊猫的记忆效率？,python,python-3.x,pandas,memory-management,garbage-collection,Python,Python 3.x,Pandas,Memory Management,Garbage Collection,我有一个数据集，它有一个文本数据列，大约有600k行所以我尝试只将文本数据保存为H5格式，以便将来更快地加载，我尝试使用垃圾收集器这是我的密码 import pandas as pd import numpy as np import gc df = pd.read_csv('Reviews.csv') text = df['Text'] df = None gc.collect() text.to_hdf('text.h5','data',format='table') text

我有一个数据集，它有一个文本数据列，大约有600k行

所以我尝试只将文本数据保存为H5格式，以便将来更快地加载，我尝试使用垃圾收集器

这是我的密码

import pandas as pd
import numpy as np
import gc

df = pd.read_csv('Reviews.csv')

text = df['Text']

df = None
gc.collect()

text.to_hdf('text.h5','data',format='table')
text = None
gc.collect()


print("Done")

但不幸的是，这会产生内存错误，即使我有16gb的内存，我如何在不放弃内存的情况下做到这一点

分块阅读大的
csv
文件（根据经验调整
chunksize
）

使用
append=True
模式将块（一组行）追加到指定的HDFStore中

for chunk in pd.read_csv('Reviews.csv', chunksize=10**5): chunk['Text'].to_hdf('text.h5', 'data', format='table', append=True)

[python 3.x]相关文章推荐

随机文章推荐

Jboss 关于OSGI问题的ATG标签库 jboss osgi

用SAML和JBoss实现SSO jboss

JBoss中的jndi.properties jboss

如何将JBoss上的Netty升级为6.1？ jboss netty

Jboss 没有可用于处理的EJB接收器 jboss

将EJB注入JBoss 7.1.1下的web java类 jboss

Jboss 初始化sessionContext和上下文 jboss

Jboss “非法国家例外”；“无池注释”； jboss activemq

在JBoss EAP 6.1上使用EclipseLink MOXy作为JAX-WS的JAXB提供程序 jboss jaxb

詹金斯__已重定向。“未找到SAXParserFactory”；关于JBoss eap 6.1 jboss jenkins

Can'；t登录到jboss管理员控制台 jboss

maven提供了如何将jar文件部署到JBoss EAP以及依赖项 jboss

带JBoss的ISO8583中间件 jboss

Jboss 我们可以在没有用户名和密码的情况下设置JMS通信吗？ jboss jms activemq

Jboss 在wildfly 10上部署kie drools wb 6.5.0 jboss drools

Jboss javax.jms.InvalidDestinationException:MQJMS2008:无法打开MQ队列----MQJE001:完成代码2，原因2085 jboss websphere ibm-mq

如何在JBoss AS或Glassfish服务器中为HSQLDB存储过程加载Java类 jboss glassfish

在JBoss EAP 7访问日志上执行每小时日志轮换 jboss

Jboss KeyClope：如何导入具有客户端角色的服务帐户 jboss keycloak

jboss eap 7-使用资源适配器向IBM MQ发布消息 jboss ibm-mq

[python]相关推荐

Tags

Actions On Google Caching Openid Combobox Html Sharepoint 2007 Android Layout Ember.js Crystal Reports C# Webpack Python Applescript Configuration Windows Installer Pascal Laravel Mapping Visual Studio 2013 Boost D3.js Symfony1 Socket.io Memory Graph Python 3.x Telegram Error Handling Scala Login Android Fragments Automation Activemq Telerik Oracle Kdb Passwords Camera Wso2 Azure Cosmosdb Hyperledger Fabric Graphviz Workflow Mpi Path Image Google Chrome Tensorflow Interface Download Chart.js Binary Variables Lambda Apache Pig Microservices Documentation Devexpress Menu Mobile Vhdl Erlang Replace Playframework 2.0 Binding Oracle10g Tomcat Reporting Services Ios4 Timer Data Structures Xampp Entity Framework Core Jekyll Sequelize.js Drupal 6 Frameworks Grid .net 4.0 Zsh Exchange Server Testng Windbg Linq Firebase Postgresql Pytorch Glassfish Openstack Mono Iframe Ubuntu Odata Antlr4 Exception Handling User Interface E Commerce Webgl Optimization Linux Dotnetnuke Post Regex Oauth 2.0 Swagger C Printing Vector Routes Spring Boot Installation Racket Speech Recognition Google Chrome Extension Module Chef Infra Autodesk Forge Hazelcast Orientdb Raspberry Pi Triggers Openshift Codenameone Ssrs 2008 Apache Storm Vmware Signalr Cuda Verilog Windows Phone 8 Umbraco Discord Gruntjs Ibm Cloud Apache Zookeeper Types Encoding Arduino Lotus Notes Notepad++ Svg Solr Twig Zend Framework Haskell Nlp Join Gis Wix Cron Elixir Cygwin Gstreamer Ios Razor Cakephp Jira Kernel Google Bigquery Netbeans Jersey Perl Mapreduce Push Notification Knockout.js Select Gatsby Qml Routing Gremlin Actionscript 3 Octave Notifications Stata Netlogo Sass Windows Mobile Azure Functions Jar Uiview Serialization Angularjs Vaadin Vue.js Windows 8 Dependency Injection Iis 7 Dynamic Cmake Jquery Ui Asp.net Mvc 3 Compiler Construction Amazon Dynamodb Winforms Omnet++ Virtual Machine Jhipster Recursion Redux Itext Animation

Copyright © 2024. All Rights Reserved by - Fatal编程技术网