Python 熊猫：在groupby'中删除重复项；日期'；_Python_Pandas_Duplicates_Unique_Pandas Groupby - Fatal编程技术网

Python 熊猫：在groupby'中删除重复项；日期'；

python pandas

Python 熊猫：在groupby'中删除重复项；日期'；,python,pandas,duplicates,unique,pandas-groupby,Python,Pandas,Duplicates,Unique,Pandas Groupby,在下面的数据框中，我想消除重复的cid值，以便df.groupby（'date'）.cid.size（）的输出与df.groupby（'date'）.cid.nunique（）的输出匹配我已经研究过这个问题，但它似乎没有一个解决问题的可靠办法 df = pd.read_csv('https://raw.githubusercontent.com/108michael/ms_thesis/master/crsp.dime.mpl.df') df.groupby('date').cid.size

在下面的数据框中，我想消除重复的

cid

值，以便

df.groupby（'date'）.cid.size（）的输出与df.groupby（'date'）.cid.nunique（）的输出匹配
我已经研究过这个问题，但它似乎没有一个解决问题的可靠办法
df = pd.read_csv('https://raw.githubusercontent.com/108michael/ms_thesis/master/crsp.dime.mpl.df')

df.groupby('date').cid.size()

date
2005       7
2006     237
2007    3610
2008    1318
2009    2664
2010     997
2011    6390
2012    2904
2013    7875
2014    3979

df.groupby('date').cid.nunique()

date
2005      3
2006     10
2007    227
2008     52
2009    142
2010     57
2011    219
2012     99
2013    238
2014    146
Name: cid, dtype: int64

我尝试过的事情：
df.groupby（[df['date']]）.drop_duplicates（cols='cid'）
给出此错误：AttributeError:无法访问'DataFrameGroupBy'对象的可调用属性'drop_duplicates'，请尝试使用'apply'方法
df.groupby（（'date'）.drop\u duplicates（'cid'））
给出此错误：AttributeError:'str'对象没有属性'drop\u duplicates'
不需要groupby根据几列删除重复项，您可以指定一个子集：
df2 = df.drop_duplicates(["date", "cid"])
df2.groupby('date').cid.size()
Out[99]: 
date
2005      3
2006     10
2007    227
2008     52
2009    142
2010     57
2011    219
2012     99
2013    238
2014    146
dtype: int64

谢谢你的评论！是的，成功了！我想知道一些类型的子集。您的第二个属性错误只是由执行以下命令引起的：（'date'）。删除重复项（'cid'）
，这与熊猫无关。事实上，错误消息告诉您，'date'
，一个str
类型对象，没有名为drop\u duplicates
的属性。




[pandas]相关文章推荐



                                                        
Pandas 数据帧到字典
pandas 
Pandas 按字典分组
pandasdictionary 
Pandas 如何在groupby.apply之后避免按索引透视？
pandas 
Pandas 从按唯一ID分组的多个类别中聚合（计算）特定类别的比率
pandas 
Pandas 在列表类型数据框中出现字符
pandas 
Pandas 有没有办法将边框添加到由to_latex（）生成的表中？
pandaslatex 
Pandas-将字符串值写入数据帧
pandas 
Pandas 熊猫为线性回归积累数据
pandasmatplotlibmachine-learning 
Pandas 使用'转换列；0%'；作为对象而不是作为浮点读取
pandas 
Pandas 当我们到达大熊猫的树丛时，移除行
pandas 
pandas.tseries.offset.DateOffset中实现的_添加_uu方法在哪里？
pandas 
Pandas 使用Dataframe查找局部最大值和最小值之和
pandasdataframe 
如何使用pandas中的公共列查找多个列的平均值
pandas 
Pandas 分组后填充熊猫中的NaN值
pandasdataframe 
Pandas 删除列值无效的行
pandasdate 
Pandas 熊猫：减去DF的后续行，并创建一个没有列的新DF来分组
pandas 
Pandas 如何在数据框中包装文本'；s表（转换为.png）
pandasdataframenumpy 
Pandas Plotly Dash：链式回调工作正常，但总是抛出ValueError。如何修复或保持沉默？
pandas 
Pandas 如何按计数和条件查询
pandasdataframe 
Pandas 如何在大熊猫的条件下进行分组？
pandasdataframe 
                                       





随机文章推荐



                                                        
Continuous integration Cruisecontrol自定义图表
continuous-integration 
Continuous integration 是否有可公开访问的竹子实例在任何地方运行？
continuous-integration 
Continuous integration 仅当另一个项目成功生成时，CCNet计划生成
continuous-integration 
Continuous integration 将DBDeploy.Net与Rake一起使用
continuous-integration 
Continuous integration 如果评论更改，阻止TeamCity构建
continuous-integrationteamcity 
Continuous integration 可以用竹子做自动回滚吗
continuous-integration 
Continuous integration TRAVIS-CI上的JEST测试错误
continuous-integrationjestjs 
Continuous integration Travis在自定义ftp中使用nodejs构建
continuous-integration 
Continuous integration 多个项目的持续集成
continuous-integration 
Continuous integration TeamCity CI server从本地文件夹创建项目
continuous-integrationteamcity 
Continuous integration 带sudo的VSTS构建代理
continuous-integrationazure-devops 
Continuous integration 由于项目没有'；没有任何跑步者在线分配给它。转到跑步者页面
continuous-integrationgitlab 
Continuous integration Lighhouse服务器无效令牌-LHCI无效令牌
continuous-integration 
Continuous integration Browserstack服务/webdriverIO/Automation/Session名称在测试期间发生更改
continuous-integration 
Continuous integration 如何在github操作中使用create file安装构建工具
continuous-integration


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
在Python2.4中，如何使用csh而不是bash执行外部命令？
									Python
							 									Shell
							 
Python Django: ；如何在列表显示中包括内联模型字段？
									Python
							 									Django
							 									Django Models
							 
Python 你有一个py poppler qt的例子吗？
									Python
							 									Qt
							 
什么类型的可变对象集合允许我快速删除python中的项？
									Python
							 									Optimization
							 
Python WMI调用在Windows 7下不起作用
									Python
							 
Python cursor.execute（"；INSERT INTO im#entry.test（"；&x2B；entrym&&x2B；）值（&x27&x2B；p&&x2B；&x27；）
									Python
							 									Database
							 									Postgresql
							 
如何'；打印'；Ironpython（Python.net）中除法的结果是什么？
									Python
							 									Printing
							 									Random
							 
Python 需要可见元素的xpath定位器
									Python
							 									Xpath
							 									Selenium
							 									Selenium Webdriver
							 
Python 我怎样才能模仿“我的生活”包括「；使用BeautifulSoup？
									Python
							 									Google App Engine
							 
Python 将数据追加到未声明的列表中
									Python
							 									Python 3.x
							 
Python：检查两个Linux路径是否在同一个物理磁盘上
									Python
							 									Linux
							 
Python 为什么collections.MutableSet不授予更新方法？
									Python
							 									Collections
							 
在python 3.4中连接字符串和int
									Python
							 									String
							 
Python Elastic Beanstalk中.pid文件的权限被拒绝
									Python
							 									Django
							 									Amazon Web Services
							 
Python 如何将具有交错数组的字典列表转换为数据帧
									Python
							 									Pandas
							 
Python 如何在Scrapy中使用Downloader中间件
									Python
							 									Python 2.7
							 									Scrapy
							 
Python 将多个列表压缩缩减为单个语句
									Python
							 
Python 未指定Pycharm Vagrant实例文件夹
									Python
							 									Ide
							 									Pycharm
							 
Python 如何仅为失败的任务启用ansible冗余？
									Python
							 									Ansible
							 
python模拟模块是否通过依赖项注入工作？
									Python
							 									Design Patterns
							 									Dependency Injection
							 
Python 无需刷新页面的AJAX POST表单
									Python
							 									Ajax
							 									Flask
							 
Python 熊猫：数据文件中没有列名
									Python
							 									Python 2.7
							 									Numpy
							 									Pandas
							 
用户在MacOS上安装python包的路径应该是什么？
									Python
							 									Macos
							 									Pip
							 
Python 提取注释行
									Python
							 									Pandas
							 
Python 弹性Beanstalk部署错误：AttributeError:'；非类型'；对象没有属性'；拆分'；
									Python
							 									Macos
							 									Amazon Web Services
							 
Python Mypy：使用抽象类作为值的映射的类型注释
									Python
							 
如何获得pandas（python）中每行的数组长度？
									Python
							 									Pandas
							 									Dataframe
							 
Python—创建不可能的问题
									Python
							 
Python 自动S.O.S.游戏表示和游戏结果提取
									Python
							 									Arrays
							 									List
							 
Python 将二维列表更改为字典。图形相关问题
									Python
							 									List
							 									Graph
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Installation
Stripe Payments
Oracle10g
Web Services
Google Drive Api
Math
Firebase
Pytorch
Download
Google Compute Engine
Applescript
Office365
Bots
Android Layout
Webpack
Gatsby
Angular6
Hibernate
Xampp
Db2
Python
Sql
Websocket
Gwt
Activemq
Salesforce
Struct
Inheritance
Silverlight 4.0
Iis 7
Biztalk
Material Ui
Aem
Grafana
Centos
Ecmascript 6
Asp.net
Path
Playframework
Crystal Reports
Cakephp
Pentaho
Blazor
Polymer
Sphinx
Vb.net
Arangodb
Zend Framework
Embedded
Log4net
Xsd
Module
Maven
Webrtc
Tensorflow
Dynamic
Web Crawler
Joomla
Rdf
Emacs
Formatting
Date
Single Sign On
Ember.js
Umbraco
Gmail
Cryptography
Antlr4
Google App Maker
Calendar
Plone
Ionic2
Class
Sprite Kit
Asp.net Core
Inno Setup
Nhibernate
Linq
Netty
Extjs4
Notifications
Graphviz
Netbeans
Active Directory
Libgdx
Plugins
Ada
Fortran
Logic
Vue.js
Matlab
Artificial Intelligence
Teamcity
Winforms
Html5 Canvas
Openlayers
Checkbox
Sbt
Eclipse Plugin
Sap
Solr
Apache Zookeeper
Encoding
Sonarqube
Virtualbox
Google Chrome Devtools
Flutter
Asterisk
Java Me
Kdb
Apache Spark
Cuda
Puppet
Compiler Errors
.net
Multithreading
Mysql
Junit
Google Cloud Firestore
Notepad++
Windows Installer
Grep
Windows 8
Winapi
Silverlight
Qt
Opengl
Msbuild
Sugarcrm
Wso2
Unicode
Asp.net Mvc 3
Ruby On Rails 3
Apache Nifi
Big O
Silverstripe
Mongodb
Tree
Extjs
Dataframe
Network Programming
Computer Science
Actionscript
Windows Mobile
Nestjs
Apache Pig
Node.js
Doxygen
Drupal 6
Apache2
Fonts
Shopify
Gstreamer
Terminal
Signalr
Model
Ipad
Python Sphinx
Appium
Qt4
Couchdb
Rss
Bash
Flask
Google Chrome Extension
Apache Flex
Concurrency
Memory
Mqtt
Generics
Dask
Kendo Ui
Statistics
C++
Uml
Powershell
Twig
Geometry
Anaconda
Project Management
Doctrine Orm
Architecture
Github
Drop Down Menu
Elixir
Entity Framework Core
Excel
Ruby On Rails
Jquery Mobile
Vim
Import
Omnet++
Cors
View
Markdown
Lisp
Ffmpeg
Memory Leaks
Bison
Titanium
Apache Storm


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网