Python 如何使用DataFrame.isin而不必同时匹配索引和值？_Python_Pandas - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/356.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何使用DataFrame.isin而不必同时匹配索引和值？_Python_Pandas - Fatal编程技术网

Python 如何使用DataFrame.isin而不必同时匹配索引和值？

python pandas

Python 如何使用DataFrame.isin而不必同时匹配索引和值？,python,pandas,Python,Pandas,我有两个文件，一个有600万条，另一个有500万条。我想比较两个数据帧中的特定列值。这是我使用的代码： print(df1['Col1'].isin(df2['col3']).value_counts()) 这对我来说很重要，因为我希望看到真（相同）和假（不同）的数量。我得到的大多数条目大约95%为真，但有5%的数据为假。我使用to_csv提取了这些数据，并使用vimdiff比较了这些列，它们都是相同的，那么为什么代码将它们标记为false（不同）？有更好、更全面的方法吗注意：我也检查了列中

我有两个文件，一个有600万条，另一个有500万条。我想比较两个数据帧中的特定列值。这是我使用的代码：

print(df1['Col1'].isin(df2['col3']).value_counts())

这对我来说很重要，因为我希望看到真（相同）和假（不同）的数量。我得到的大多数条目大约95%为真，但有5%的数据为假。我使用to_csv提取了这些数据，并使用vimdiff比较了这些列，它们都是相同的，那么为什么代码将它们标记为false（不同）？有更好、更全面的方法吗

注意：我也检查了列中的空格。没有空格

PS.Pandas.isin文件规定索引和值必须匹配。由于1个文件中有更多的条目，因此索引与这些条目不匹配，如何删除该约束？

首先，将

isin（）方法中用作参数的列转换为列表
然后将其解析为df1
dataframe的副本，因为您需要获取筛选的同一列的值计数
从你的例子来看：
print(df1[df1['Col1'].isin(df2['col3'].values.tolist())]['Col1'].value_counts())

请尝试再次运行该命令。
您可以过滤掉错误记录，然后进行相应的调试。另外，您可以共享一个示例数据帧吗？我已经取出了错误记录，并通过vimdiff进行了比较。它们都一样。数据帧有编号的ID（两个数据帧中都有5位数字），即使您删除了索引约束，您将如何比较两个大小不同的列？对于无法比较的100万个条目，什么是正确的（相同）？和什么一样？




[pandas]相关文章推荐



                                                        
Pandas 按小时索引熊猫系列
pandas 
Pandas 基于条件选择数据帧的列
pandas 
Pandas 有没有办法选择作为熊猫索引的列？
pandasdataframe 
Pandas 基于另一列/类型更新dataframe列错误：字符串索引必须为整数
pandasdataframelambdatypes 
Pandas 数据帧中的程序合并
pandas 
Pandas 将多个列表转换为一个数据帧
pandaslist 
Pandas 根据现有列的条件创建新列的最干净方法是什么？
pandas 
Pandas 如何从DataFrame.groupby.rolling.apply返回多个值？
pandas 
Pandas 熊猫-从Groupby系列中查找详细信息
pandas 
Pandas 用Altair绘制多索引数据帧
pandas 
Pandas 按其他数据帧对数据帧进行排序
pandasnumpy 
Pandas 在np.nan的熊猫中，为什么是；mul（）；不等于__mul_uquo；？
pandas 
Pandas 列作为字典的数据透视表
pandasdataframedictionary 
Pandas dataframe python从年、月、日转换为工作日
pandasdatetime 
Pandas 如何查找列连续月数为6的索引？
pandas 
Pandas 更改Excel日期（作为整数）并在单个列中混合时间戳-已尝试str.extract
pandasdatetime 
pandas-使用字典映射dataframe元素-如何访问值列表的第n个元素
pandasdataframedictionary 
Pandas-将一列映射到另一列并对行应用乘法
pandas 
Pandas 如何将一个数据帧迭代/转置/附加到另一个数据帧？
pandasloops 
Pandas 如何从熊猫中看起来像字典的列中提取数据？
pandasdataframe 
                                       





随机文章推荐



                                                        
如何使用自己的许可证密钥在AWS EC2上运行MarkLogic？
marklogic 
Marklogic XDMP-XDQPINVREQ错误
marklogic 
Marklogic 在大型数据库上使用谓词？
marklogic 
Marklogic 是否可以从索引中解析对标点符号敏感的搜索？
marklogic 
MarkLogic 8-日志文件中的信息
marklogic 
Marklogic：对Marklogic的第一个请求需要时间
marklogic 
如何克隆MarkLogic数据库
marklogic 
Marklogic 如何使用xquery检查数据库状态？
marklogic 
如何将所有主机映射到MarkLogic中的特定appserver或端口？
marklogic 
Marklogic 当辅助数据库位于群集中时，我们是否需要为它们配置本地磁盘故障切换
marklogic 
Marklogic cts：用于比较日期的字段值查询
marklogic 
Marklogic 在特定文件中进行标记逻辑搜索
marklogic 
Marklogic MCLP uri_id，如何在聚合xml中指定xml标记的属性
marklogic 
Marklogic cts问题：字段词查询
marklogic 
如何加快MarkLogic数据中心的协调
marklogic 
MarkLogic-在数组的每个引用中搜索
marklogic 
Marklogic Cloudformation模板-替换群集，保留卷（和VPC）
marklogic 
如何查询MarkLogic以确定重新索引的成本？
marklogic 
Marklogic 如何区分没有http应用程序命中ML和ML没有响应？
marklogic 
Marklogic 为什么在添加新林时出现重新平衡错误
marklogic


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Ipad
Vb6
Tomcat
Automated Tests
Proxy
Pine Script
Fullcalendar
Wso2
Post
Scikit Learn
Smtp
Cobol
Apache Pig
Wicket
Laravel 5
D
Arangodb
Interface
Autodesk Forge
Tfs
Delphi
Nhibernate
Google Analytics
Bootstrap 4
Image
Qt
Amazon Ec2
Haskell
Rss
Sequelize.js
Gis
Cygwin
Sdk
Arrays
Sparql
Cmd
Join
Flash
Events
Php
C# 3.0
Ubuntu
Cors
Visual Studio 2017
Azure Service Fabric
Odoo
Office365
Joomla
Geometry
Sql Server 2005
Java
Language Agnostic
Excel
Graph
Codeigniter
Azure Data Factory
Jmeter
Asp.net Mvc
Breeze
Botframework
Activerecord
Unicode
Docusignapi
Ios7
Openshift
Loops
Parsing
Memory Management
Ajax
Keycloak
Date
Firefox Addon
Identityserver4
Cucumber
Search
Internet Explorer
Android Layout
Typescript
Collections
Authentication
Protractor
Youtube
Jasper Reports
Google Bigquery
Eclipse Plugin
Jsp
Jqgrid
Sed
Kernel
Linker
Hbase
Couchbase
Openerp
Hash
Pip
Llvm
Python 2.7
Azure Sql Database
Exception Handling
Markdown
Socket.io
Awk
Lotus Notes
Apache Spark
Recursion
Opencv
Amazon Cloudformation
Terminal
Model View Controller
Autocomplete
Vbscript
Optimization
Ffmpeg
Logging
Mdx
Routing
Julia
Xcode
Jestjs
Web Services
Svn
Sublimetext3
Memory
Material Ui
Web
Teamcity
Yii2
Qml
Pointers
Elm
Cordova
Xsd
Sharepoint 2013
Android Fragments
Mercurial
Junit
Migration
Snowflake Cloud Data Platform
Vim
Google Cloud Storage
Terraform
Phpstorm
Android Ndk
Exception
Android Studio
Blazor
Django Models
Virtualbox
Liferay
Axapta
Ruby On Rails 3.2
Google Plus
Azure Ad B2c
Db2
Python
Reporting Services
Xmpp
Opengl
Bison
Node.js
EmptyTag
Menu
Ember.js
Google Compute Engine
Cluster Computing
Emacs
Ios
Kendo Ui
Algorithm
Shiny
Configuration
Vmware
Testing
Facebook
Intellij Idea
Plone
Gps
Twig
Javafx 2
Validation
Mongoose
Nuget
Dynamics Crm 2011
Azure Functions
Url
Yii
Webstorm
Permissions
Sharepoint 2007
Asterisk
Openid
Scheme
Synchronization
Asp.net Mvc 3
Enums
Air
Ibm Mq
Monitoring
Sugarcrm
Antlr4
Isabelle


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网