Python 消除给定百分位上的所有数据_Python_Pandas_Filtering_Percentile - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/324.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 消除给定百分位上的所有数据_Python_Pandas_Filtering_Percentile - Fatal编程技术网

Python 消除给定百分位上的所有数据

python pandas

Python 消除给定百分位上的所有数据,python,pandas,filtering,percentile,Python,Pandas,Filtering,Percentile,我有一个名为data的pandasDataFrame和一个名为ms的列。我想消除data.ms高于95%百分位数的所有行。就目前而言，我正在这样做： limit = data.ms.describe(90)['95%'] valid_data = data[data['ms'] < limit] limit=data.ms.descripe（90）['95%] 有效数据=数据[数据['ms']

我有一个名为

data

的pandas

DataFrame

和一个名为

ms

的列。我想消除

data.ms

高于95%百分位数的所有行。就目前而言，我正在这样做：

limit = data.ms.describe(90)['95%']
valid_data = data[data['ms'] < limit]

limit=data.ms.descripe（90）['95%]
有效数据=数据[数据['ms']<限制]

这是可行的，但我想把它推广到任何百分位。最好的方法是什么？

使用以下方法：

要筛选出

df

中

df.a

大于或等于第95百分位的行，请执行以下操作：

In [72]: df[df.a < df.a.quantile(.95)]
Out[72]:
       a      b      c
0 -1.044 -0.247 -1.149
2  0.395  0.591  0.764
3 -0.564 -2.059  0.232
4 -0.707 -0.736 -1.345
5  0.978 -0.099  0.521
6 -0.974  0.272 -0.649
7  1.228  0.619 -0.849
8 -0.170  0.458 -0.515
9  1.465  1.019  0.966

[72]中的

：df[df.a

numpy在这方面比熊猫快得多：

numpy.percentile(df.a,95) # attention : the percentile is given in percent (5 = 5%)

相当于，但比以下速度快3倍：

df.a.quantile(.95)  # as you already noticed here it is ".95" not "95"

因此，对于您的代码，它提供：

df[df.a < np.percentile(df.a,95)]

df[df.a

使用pandas，如果我想比较不同的col和特定的分位数，是否有类似numpy广播的快速方法？当删除所有列时，它是否也起作用，即

df[df

？如果不在范围内，我希望所有值都被过滤掉，并在需要时替换为NaN
。基本相同但更简洁：df.query（'a
。如果列名很长，可以提高可读性：col='some_verbose_metric_name'；df.query（f'{col}<{col}.quantile（.95）
可以确认，如果您能够提供列提取，numpy的实现会更快cost@2diabolos.com是否有一种方法可以在多个列上实现百分位筛选。类似于df[numpy.logical_和（df.adf[df.a < np.percentile(df.a,95)]




[pandas]相关文章推荐



                                                        
Pandas 未找到熊猫系列groupby col
pandas 
Pandas 获取数据帧的一小部分时，不会释放内存
pandas 
Pandas 熊猫|传播所有日期的值
pandas 
Pandas 将批数据从BigQuery读取到Datalab
pandasgoogle-bigquery 
Pandas 选择至少有一个值高于阈值的所有列
pandas 
Pandas 每月分发'；把数量平均分为几周
pandas 
Pandas 在Matplotlib中绘制预测线的最佳方法
pandasmatplotlib 
Pandas 多层次分组（按子总体百分比）
让我们考虑下面的数据框：
df = {'Location': ['A','A','B','B','C','C','A','C','A'],
'Gender'['M','M','F','M','M','F','M','M','M'],
'Edu'['N','N','Y','Y','Y','N','Y','Y','Y'],
'Access1': [1,0,1,0,1,0,1,1,1], 'Access2': [1,1,1,0,0,1,0,0,1] }
df = pd
pandas 
Pandas 熊猫群比：一整行/总行？
pandas 
Pandas 加载模型和预测数据之间的特征不匹配-scikit学习SVC
pandasscikit-learn 
Pandas 使用时间戳在时间之间标记行
pandas 
Pandas Panda DataFrame在两列中组合唯一值，以实现OrdinalCoder拟合
pandasdataframe 
Pandas 熊猫多个“分组依据”和对值的操作
pandas 
Pandas 如何在seaborn的Swarmlot中设置x坐标？
pandas 
Pandas 在Keras中阅读Python词典
pandaskeras 
Pandas 如何按月为日期时间和绘图值创建箱子？
pandasplot 
Pandas 从数据帧创建列（含部分）字典
pandasdataframedictionary 
Pandas 如何将索引列名放在第一行？
pandasdataframe 
Pandas Can'；t构建包含熊猫的spark py文件
pandasapache-sparkpyspark 
Pandas 在多索引数据帧上生成新列
pandasdataframe 
                                       





随机文章推荐



                                                        
Laravel 4 在浏览器URL中调用Laravel 4 Restful curl
laravel-4 
Laravel 4 使用：：find（）加载Laravel 4
laravel-4 
Laravel 4 拉威尔质量更新
laravel-4 
Laravel 4 发送邮件时发生火灾事件-Laravel 4
laravel-4 
Laravel 4 如何在laravel中对预加载关系进行分页
laravel-4 
Laravel 4 错误重定向和保存Laravel 4
laravel-4 
Laravel 4 会话集（变量）计数Laravel
laravel-4 
Laravel 4 Laravel 4 beanstalkd异常捕获作业处理中的问题
laravel-4 
Laravel 4 如何使用laravel 4检查数据库记录计数
laravel-4 
Laravel 4 从4.2升级到5的Laravel应用程序中的多态关系
laravel-4laravel-5


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Oracle10g
Elm
Rx Java
Liferay
Twilio
Azure Data Factory
Apache
Maven 2
Eclipse Plugin
.net 4.0
Tabs
Directory
Asp.net Core
Cakephp
C#
Modelica
Logging
Pandas
Google Chrome
Timer
Lisp
Javafx 2
Jira
Xcode4
Webview
Shell
Xpath
Quickbooks
Push Notification
Windows
Database
Macos
Arrays
Assembly
Haskell
Android Studio
Codeigniter
Rspec
Yii2
Uitableview
Prestashop
Sonarqube
Hyperlink
Three.js
Spotify
Login
D
Atom Editor
Domain Driven Design
Snmp
Html5 Canvas
Cluster Computing
Mobile
Dotnetnuke
Windows Phone 8.1
Perl
Centos
Logstash
Maps
Arangodb
Design Patterns
Sdk
Twig
Jasmine
Sharepoint
Twitter Bootstrap 3
Vaadin
Windows Store Apps
Ruby
Opencv
Sapui5
Coq
Xamarin.forms
Variables
Ipython
C
Navigation
Wso2
Akka
Kendo Ui
Url Rewriting
Amazon Ec2
Openstack
Oracle
Python Sphinx
Subsonic
Activerecord
Vbscript
Webrtc
Discord.js
Vb.net
Mule
Sas
Class
Logic
Grep
Ruby On Rails 3.2
Windbg
Netty
Replace
Qt
Keyboard
Machine Learning
Polymer
Django Rest Framework
Wix
Notepad++
Outlook
Calendar
Artificial Intelligence
Laravel 5
Coffeescript
Matlab
Apache Kafka
Libgdx
Redux
Alfresco
Paypal
Twitter Bootstrap
Hibernate
Electron
If Statement
Kentico
Math
Jestjs
Sails.js
Apache Camel
Gdb
Wpf
Android Emulator
Data Structures
Tfs
Excel
Formatting
Java Me
Eclipse Rcp
Glassfish
Jekyll
Ios7
Youtube Api
Methods
Facebook Graph Api
Doctrine Orm
Amazon Dynamodb
Kibana
Gruntjs
Snowflake Cloud Data Platform
Here Api
Report
Memory Leaks
Jvm
Workflow
Opengl
Solr
Google Analytics
Git
Teamcity
Cocos2d X
Java 8
Open Source
Umbraco
Service
Firebase
Azure
Regex
Mvvm
Deep Learning
Notifications
Visual Studio 2015
Shiny
Inno Setup
Multithreading
Floating Point
Authentication
Wordpress
Tree
Server
Angular Material
Jdbc
Types
Apache Flink
Pip
Symfony1
Anaconda
Internet Explorer
Jwt
Spring Boot
Redirect
Kubernetes
Ignite
Kdb
Command Line
Hybris
Api
Gwt
Video
Appium
Serialization
Redis
Amazon Cloudformation
Google App Maker


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网