Python 基于另一个熊猫数据帧有条件地提取熊猫行_Python_Pandas_Indexing_Dataframe_Conditional Statements - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/278.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 基于另一个熊猫数据帧有条件地提取熊猫行_Python_Pandas_Indexing_Dataframe_Conditional Statements - Fatal编程技术网

Python 基于另一个熊猫数据帧有条件地提取熊猫行

python pandas indexing dataframe

Python 基于另一个熊猫数据帧有条件地提取熊猫行,python,pandas,indexing,dataframe,conditional-statements,Python,Pandas,Indexing,Dataframe,Conditional Statements,我有两个数据帧： df1: col1 col2 1 2 1 3 2 4 df2: col1 2 3 我想提取df1中的所有行，其中df1的col2不在df2的col1中。因此，在这种情况下： col1 col2 2 4 我首先尝试： df1[df1['col2'] not in df2['col1']] 但它返回： TypeError:“Series”对象是可变的，因此无法对其进行散列然后我试着： df1[df1['col2'

我有两个数据帧：

df1:

col1    col2
1       2
1       3
2       4

df2:

col1
2
3

我想提取

df1

中的所有行，其中

df1

的

col2

不在df2
的col1
中。因此，在这种情况下：
col1    col2
2       4

我首先尝试：
df1[df1['col2'] not in df2['col1']]

但它返回：
TypeError:“Series”对象是可变的，因此无法对其进行散列
然后我试着：
df1[df1['col2'] not in df2['col1'].tolist]

但它返回：
TypeError:类型为“instancemethod”的参数不可iterable
您可以与~
一起使用以反转布尔掩码：
print (df1['col2'].isin(df2['col1']))
0     True
1     True
2    False
Name: col2, dtype: bool

print (~df1['col2'].isin(df2['col1']))
0    False
1    False
2     True
Name: col2, dtype: bool

print (df1[~df1['col2'].isin(df2['col1'])])
   col1  col2
2     2     4

计时：
In [8]: %timeit (df1.query('col2 not in @df2.col1'))
1000 loops, best of 3: 1.57 ms per loop

In [9]: %timeit (df1[~df1['col2'].isin(df2['col1'])])
1000 loops, best of 3: 466 µs per loop

使用方法：
更大DFs的时机：
In [44]: df1.shape
Out[44]: (30000000, 2)

In [45]: df2.shape
Out[45]: (20000000, 1)

In [46]: %timeit (df1[~df1['col2'].isin(df2['col1'])])
1 loop, best of 3: 5.56 s per loop

In [47]: %timeit (df1.query('col2 not in @df2.col1'))
1 loop, best of 3: 5.96 s per loop

In [44]: df1.shape
Out[44]: (30000000, 2)

In [45]: df2.shape
Out[45]: (20000000, 1)

In [46]: %timeit (df1[~df1['col2'].isin(df2['col1'])])
1 loop, best of 3: 5.56 s per loop

In [47]: %timeit (df1.query('col2 not in @df2.col1'))
1 loop, best of 3: 5.96 s per loop




[pandas]相关文章推荐



                                                        
Pandas 熊猫中的HDF5字符串序列化详细信息？
pandas 
Pandas 熊猫群比的加速
pandas 
Pandas 为数据帧中的每个子组添加总行
pandas 
Pandas 组合csv文件，按时间对其排序，并平均列数
pandasmerge 
Pandas sklearn TimeSeriesSplit错误：KeyError:&x27；[0 1 2…]不在索引中'；
pandasscikit-learn 
Pandas 多行数据帧到多列
pandasdataframe 
Pandas 如何合并或处理dataframe中的重复列？
pandasmerge 
Pandas 基于dataframe中的列表比较列值
pandasdataframe 
Pandas Pyspark等效于df.groupby（'；id'；）.resample（'；D'；）.last（）
pandasapache-sparkpyspark 
Python和Pandas：按多个列应用
pandas 
Pandas groupby max-多列
pandas 
Pandas Python dict，元组索引为缩进dict
pandasdataframedictionary 
Pandas 通过列表列中的公共字符串元素映射两个数据帧
pandasdictionarymerge 
Pandas 向熊猫系列添加新值
pandas 
Pandas 从2行中交织行
pandas 
Pandas 在xlsx中递归写入不同的DFs，而不使用Jupyter进行覆盖
pandasdataframejupyter-notebook 
Pandas 大熊猫的分组年数总和
pandasmatplotlib 
Pandas 如何将inf修改为索引
pandasdataframematplotlibindexing 
Pandas Python：包含列表和字典的数据框架
pandasdataframedictionary 
Pandas 在数据帧中创建列，传递不同数据帧中.iloc列的值
pandasdataframe 
                                       





随机文章推荐



                                                        
Backbone.js 如何在Coffeescript中创建匿名类？
backbone.jscoffeescript 
Backbone.js 主干网设计
backbone.js 
Backbone.js-为什么我的delegateEvents选择器不工作？
backbone.js 
Backbone.js 主干能否以相反的顺序呈现集合？
backbone.js 
Backbone.js 主干关系模型与集合长度
backbone.js 
Backbone.js 如何向视图添加新模型以自动重新渲染模板
backbone.js 
Backbone.js 带pushState的Express和主干路由
backbone.jsexpress 
Backbone.js集合中的传单标记？
backbone.jsleaflet 
Backbone.js 如何使用速记'；事件'；对象
backbone.js 
Backbone.js 构建一个月内天数集合的最佳方式是什么（主干日历）
backbone.jsmodel 
Backbone.js 使用分页加载数据数量
backbone.js 
Backbone.js Backbonejs-根据类型属性返回不同的模型
backbone.js 
Backbone.js 您可以向木偶应用程序对象添加模型吗？
backbone.js 
Backbone.js 用Jasmine监视主干视图回调方法
backbone.jsviewjasmine 
Backbone.js $.fn.dataTable.Editor不是构造函数-带DataTables的RequireJS
backbone.jsrequirejs 
Backbone.js model.has方法不适用于子对象
backbone.js 
Backbone.js 返回主干集合并遍历-不使用视图
backbone.js 
Backbone.js 如何通过Marionette.TemplateCache加载外部模板
backbone.js 
Backbone.js 如何显示每个对象（handlebar.js）的键和值？
backbone.js 
Backbone.js-在devTools中获取要打印的childElementCount值
backbone.js


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Jmeter
Continuous Integration
Windows 7
Maven
Quickbooks
Git
Mfc
Arrays
Mediawiki
Process
Swift
Bots
.net 4.0
Magento2
Raspberry Pi
Robotframework
Hibernate
Lucene
Svg
Types
Windows Phone 8
Linkedin
Sdk
Visual Studio 2012
Netbeans
Validation
Android Fragments
Mqtt
Sockets
Installation
Clearcase
Protocol Buffers
Lua
File Io
Openlayers
Gis
Wcf
Mdx
Phpmyadmin
Orm
Asp.net Core Mvc
C# 4.0
Mvvm
Java 8
Material Ui
Google Plus
Actionscript
Codenameone
Sip
Next.js
Umbraco
Extjs
Configuration
Network Programming
Osgi
Migration
Google Cloud Dataflow
Dependencies
Notifications
For Loop
Orchardcms
Racket
Webview
Bootstrap 4
Vba
Corda
Ip
Airflow
Xcode
Jpa
Multithreading
Zurb Foundation
Ide
Ajax
Prometheus
Visual C++
Odoo
Binary
Dart
Blackberry
Windows 10
Hybris
Python 3.x
Eclipse Plugin
Visual Studio 2013
Pycharm
Ckeditor
Netty
Rest
D3.js
Directory
Ios8
Nativescript
Polymer
Performance
Coldfusion
Responsive Design
Layout
Microsoft Graph Api
Ipython
Libgdx
Dll
Dataframe
Apache Pig
Dojo
Entity Framework Core
Webrtc
Nlp
Google Maps
Cocos2d X
Openlayers 3
Silverlight
Reporting Services
Xslt
Ios
Nservicebus
Gdb
Algorithm
Drupal
Browser
Llvm
Authentication
Wxpython
Design Patterns
Actions On Google
Keyboard
Powerbi
Nsis
Apache Spark
Css
Artifactory
Url
Latex
Sql
Gnuplot
Silverstripe
Hazelcast
Ocaml
Workflow
Teradata
Login
Unity3d
Oracle Apex
Xamarin.ios
Date
Extjs4
Jetty
Matrix
Jqgrid
Serialization
Here Api
Pyspark
Asp.net Mvc 4
Cordova
Google App Maker
File
Debian
Serial Port
Mapbox
Ms Word
Jsf
Service
Azure Ad B2c
Listview
X86
Cobol
Passwords
Geolocation
Jquery
Coding Style
Anaconda
Kentico
Monitoring
Parallel Processing
Join
Vector
Pascal
Three.js
Testng
Numpy
Cookies
Navigation
Database Design
Nuget
Ada
Mpi
Jquery Mobile
Binding
Gruntjs
Sml
Chart.js
Time Complexity
Kubernetes
Cmd
List
Macros
Android Emulator
Bazel
Memory Management
Angular6
Jsp


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网