Python 在非常大的数据帧上提高迭代的性能_Python_Pandas_Dataframe_Iteration_List Comprehension - Fatal编程技术网

Python 在非常大的数据帧上提高迭代的性能

python pandas dataframe

Python 在非常大的数据帧上提高迭代的性能,python,pandas,dataframe,iteration,list-comprehension,Python,Pandas,Dataframe,Iteration,List Comprehension,我有一个熊猫数据框架，它由300万行和50列组成，所有这些行和列都包含整数（正数或负数）。我想创建一个名为“feature”的新列，它从现有的50列中获取最大的负数例如，如果给定行的50列包含值 -25、-24、-23、-1,1、-23,24,25 “feature”列应返回-1 因为我的数据帧太大，所以我尝试的解决方案花费的时间太长。例如，我曾尝试使用列表理解，但因为我使用的是ItErrorws（），所以速度太慢（itertuples（）的性能并没有显著提高）：将numpy导入为np 作为

我有一个熊猫数据框架，它由300万行和50列组成，所有这些行和列都包含整数（正数或负数）。我想创建一个名为“feature”的新列，它从现有的50列中获取最大的负数

例如，如果给定行的50列包含值

-25、-24、-23、-1,1、-23,24,25

“feature”列应返回-1

因为我的数据帧太大，所以我尝试的解决方案花费的时间太长。例如，我曾尝试使用列表理解，但因为我使用的是ItErrorws（），所以速度太慢（itertuples（）的性能并没有显著提高）：

将numpy导入为np
作为pd进口熊猫
从TQM导入TQM
df=pd.read\u csv（\u file.csv的名称）
对于idx，tqdm中的行（df[list（np.arange（0,50,1）））。ItErrors（）：
df.loc[idx，'特征']=max（[n如果n<0，则n代表行中的n]）

对于如此大的数据帧，不必使用线程来计算此功能的最快方法是什么？

您可以使用

dataframe。其中将0
以上的所有值设置为NaN
，并返回按行max
：
df['feature'] = df.iloc[:,:50].where(df.iloc[:,:50].lt(0)).max(1)

我想你把你的部分搞错了，应该是[：，：50]真的谢谢@IanS不知道我脑子里为什么会有行，更新了！
df['feature'] = df.iloc[:,:50].where(df.iloc[:,:50].lt(0)).max(1)




[pandas]相关文章推荐



                                                        
Pandas 列的排序统计
pandas 
如何为pandas groupby对象实现聚合功能？
pandas 
Pandas 如何在panda'；s数据帧
pandas 
Pandas py2exe setup.py不工作
pandassqlalchemy 
Pandas 基于降序窗口的最大值（以熊猫为单位）
pandas 
Pandas 数据帧聚合不同的列组
pandasdataframe 
Pandas 通过平均值将数据分组到数据帧中？
pandas 
Pandas 停止熊猫重命名同名列，以便我可以使用从宽到长
pandas 
Pandas 替换数据帧中的值
pandas 
Pandas HDFStore:当min_itemsize设置为字符串列的最大值时，追加失败
pandas 
Pandas Seaborn boxplot定制标签盒
pandasmatplotlib 
比较基于pandas中两列组合的两个数据帧
pandas 
Pandas 将散布映射为数据帧中的子地块
pandas 
如何使用pandas中其他列的信息创建新列？
pandas 
Pandas 熊猫在两列内重新采样数据
pandas 
Pandas 如果任何人熟悉Andrew ng'；具有一个隐藏层的平面数据分类
pandasdeep-learning 
Pandas 如何将dataframe文本列拆分为布尔列
pandasdataframe 
Pandas 为dataframe单元格中的列表元素编写if语句
pandasstringlistdataframeif-statement 
Pandas，轴函数中不同值的不同aggfunc
pandasdataframe 
Pandas Python：不包括纽约证券交易所在早盘收盘日的盘后交易
pandascalendar 
                                       





随机文章推荐



                                                        
Ubuntu web服务器上的Scrapy出现417错误
scrapy 
Win10刮片安装
我有Python安装以及C++编译器。当我从命令行运行“pip install scrapy”时，它会开始安装，但在libxml和libxslt周围会出现一些错误
scrapyinstallationwindows-10 
为什么我的scrapy ItemLoader失败了？
scrapy 
Scrapy 刮皮不'；t下载图片
scrapy 
Scrapy response.follow查询
scrapy 
Scrapy 在另一个Spider上解析页面后调用另一个Spider
scrapy 
Scrapyd部署：未找到SPIDER_模块
scrapy 
Scrapy-从表中提取数据
scrapy 
我能'；t使用scrapy提取链接
scrapy 
scrapy Pipeline TypeError:只能将str（而不是“dict”）连接到str
scrapy


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
我的python程序总是在运行数小时后关闭我的internet连接，如何调试和修复此问题？
									Python
							 									Multithreading
							 									Network Programming
							 
Python 分析标记集的最佳方法？
									Python
							 									Sql
							 									Excel
							 									Ms Access
							 
如何判断python实例是否编译为框架？
									Python
							 									Macos
							 
Python 从instagram'；获取趋势标签；s api
									Python
							 									Api
							 									Instagram
							 
这个python函数在寻找什么？
									Python
							 									Linux
							 									Bash
							 
Python 龙卷风-对象内存处理
									Python
							 									Numpy
							 									Pandas
							 
Python列表不自觉地更新附加列表
									Python
							 
Python 如何在mac上使用cx\U冻结？
									Python
							 									Macos
							 
Python PYODBC MS Access插入错误-参数太少
									Python
							 									Twitter
							 
Python，可能是一个带有字典和函数的简单解决方案，但不知道如何使用
									Python
							 									Dictionary
							 									Raspberry Pi
							 
使用Python从事件日志文件中提取所需变量
									Python
							 									Pandas
							 
Python 使numpy对象数组成为内部字符串的有效方法
									Python
							 									Numpy
							 
如何使用python从网页中提取ID和类？
									Python
							 									Html
							 									Web Scraping
							 
Python 如何使用唯一名称透视表并避免空值？
									Python
							 									Pandas
							 
Python xticks值作为matplotlib plot中的数据框列值
									Python
							 									Pandas
							 									Matplotlib
							 									Dataframe
							 
Python 使用置信区间以交互方式重新着色Matplotlib条形图中的条形图
									Python
							 									Matplotlib
							 
Python 使用Mautic API，如何发送参数；列表“；在创建电子邮件时？
									Python
							 
Python 帕斯卡三角形最大路径
									Python
							 									Arrays
							 
Python 获取不包含AttributeError的类成员的值
									Python
							 
Python 计算π到第n位
									Python
							 									Python 2.7
							 
Python 除了库特定的错误外，如何使用try？
									Python
							 
无法运行以下Python代码
									Python
							 
在python中绘制图形-pydotplus错误
									Python
							 									Graphviz
							 
在Python中生成3个不同的随机数
									Python
							 									Numpy
							 									Random
							 
Python 在buildrozer中，Scikit映像为64位而不是32位
									Python
							 
Python 从并集的基数计算所有不相交子集的基数
									Python
							 
Python 如何在带有输入参数的函数中命名参数？
									Python
							 									Python 3.x
							 									Function
							 
Python 如何判断使用子进程打开的exe是否已完成启动？
									Python
							 
Python 在过去三个月内，每月获得前5名用户Django
									Python
							 									Django
							 
Python 使用Pandas筛选DatetimeIndex
									Python
							 									Pandas
							 									Filter
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Javafx
Vbscript
Debian
Linq To Sql
Youtube Api
Dotnetnuke
Swift
Formatting
Umbraco
Elm
Isabelle
Alfresco
Ecmascript 6
Dataframe
Scikit Learn
Unix
Stored Procedures
Tkinter
C# 4.0
Programming Languages
Netbeans
Servlets
Sockets
Reference
Yaml
Apache Zookeeper
Struts2
Actionscript
Json
Apache Flink
Compilation
Chef Infra
Url
Deep Learning
Pytorch
Nosql
C++11
Ip
Math
Azure Sql Database
Angular Material
Google Cloud Storage
Gmail
Woocommerce
Phpstorm
Asp.net Mvc 3
Scroll
Nuget
Robotframework
Openerp
Doctrine
Chart.js
Big O
Ssrs 2008
Process
Jboss
Ajax
Couchbase
Uiview
Ionic2
Jekyll
Tfs
Vagrant
Phpunit
Python Sphinx
Gruntjs
Sencha Touch 2
Ruby
Ipad
Numpy
Itext
Pentaho
Reporting Services
List
Networking
Rest
Protocol Buffers
Nsis
Hibernate
Tabs
Drupal 6
Jakarta Ee
Discord
Electron
Notifications
Git
Embedded
Opengl
Github
Grid
3d
Perforce
Antlr
Web Crawler
Jenkins
.htaccess
.net 4.0
Linker
Graphql
File Io
Select
Cmd
Opencl
Nest
Hyperledger Fabric
Csv
Combobox
Jquery Mobile
Permissions
Blazor
Dll
Solr
Excel Formula
Webstorm
Phantomjs
Time
Templates
Functional Programming
Random
Asp.net Core
Anaconda
Entity Framework Core
Batch File
Common Lisp
Ada
Angularjs
Doxygen
Kibana
Stream
Google Maps
Php
Service
Parsing
Soap
Encoding
Ionic Framework
Data Structures
Visual Studio 2010
Wso2
Azure
Scripting
Llvm
Windows 10
React Native
Hadoop
Cloud
Openstack
Snmp
Omnet++
Smalltalk
Keras
Streaming
Oracle11g
Tableau Api
Tcl
Jquery Ui
Amazon Cloudformation
Cobol
Primefaces
Apache Camel
Salesforce
Colors
Configuration
Flask
Rspec
Google Analytics
Spring Cloud
Requirejs
Autohotkey
Zend Framework2
Gridview
Mercurial
Iframe
Signalr
Terraform
Kernel
Reflection
Spring
Udp
Oracle Apex
Swing
Ruby On Rails
Webpack
Frameworks
Arm
Qt4
Geolocation
Awk
Neural Network
Cygwin
Asp Classic
Visual C++
Osgi
Jupyter Notebook
Command Line
Tags
.net
Windows Phone 7
Discord.js
Cakephp
Rally


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网