Python:Groupby转换和唯一性_Python_Pandas_Numpy_Pandas Groupby - Fatal编程技术网

Python:Groupby转换和唯一性

python pandas numpy

Python:Groupby转换和唯一性,python,pandas,numpy,pandas-groupby,Python,Pandas,Numpy,Pandas Groupby,我在PANDAS中创建了一个透视表，在这种情况下，单独计算字段更有意义，只需在透视步骤中使用.pivot_table（）。然而，我在计算百分比的分母时遇到了一些困难。本质上，由于数据格式的原因，我似乎需要在下面第二行执行类似“groupby transform unique sum”的操作（这正是我遇到的问题）：我很抱歉不能提供任何虚假数据，但如果我希望提供足够的详细信息来说明原因，我将非常感谢任何提示。我认为需要具有唯一性和总和的lambda函数： df = pd.DataFrame({'n

我在PANDAS中创建了一个透视表，在这种情况下，单独计算字段更有意义，只需在透视步骤中使用.pivot_table（）。然而，我在计算百分比的分母时遇到了一些困难。本质上，由于数据格式的原因，我似乎需要在下面第二行执行类似“groupby transform unique sum”的操作（这正是我遇到的问题）：

我很抱歉不能提供任何虚假数据，但如果我希望提供足够的详细信息来说明原因，我将非常感谢任何提示。

我认为需要具有

唯一性和总和的lambda函数：
df = pd.DataFrame({'numerator':[3,1,1,9,2,2],
                   'category2':list('aaabbb')})

#print (df)

df['denominator']=df.groupby(['category2'])['numerator'].transform(lambda x: x.unique().sum())

具有set
s和sum
s的替代解决方案：
df['denominator']=df.groupby(['category2'])['numerator'].transform(lambda x: sum(set(x)))


哇，非常感谢你的洞察力和这么快！啊，我现在明白我的错误了。我最初尝试过.transform（lambda x:sum（x.unique（）））。一如既往地谢谢你。
df['denominator']=df.groupby(['category2'])['numerator'].transform(lambda x: sum(set(x)))

print (df)
  category2  numerator  denominator
0         a          3            4
1         a          1            4
2         a          1            4
3         b          9           11
4         b          2           11
5         b          2           11




[pandas]相关文章推荐



                                                        
Pandas 如何选择系列而不是数据帧
pandas 
Pandas 根据条件删除数据帧中的行
pandasdataframe 
Pandas seaborn或matplotlib折线图，线条颜色取决于变量
pandasmatplotlib 
Pandas 如何在一列中创建多个列表
pandasdataframe 
Pandas Pyspark、dask或任何其他python：如何在不损坏笔记本电脑的情况下旋转一张大桌子？
pandaspysparkdask 
Pandas 是否根据条件更改数据帧的所有值？
pandas 
Pandas 在数据帧的所有行中保存命名元组
pandas 
Pandas groupby：在创建具有两列的groupby时，如何按正确的顺序对工作日进行排序？
pandas 
如何将Google工作表的行导入Pandas，但要使用列名？
pandas 
Cloud9部署达到numpy和pandas的大小限制
pandasaws-lambda 
Pandas 熊猫-格式化柱形图标签
pandas 
Pandas 如何在循环Python中修改dataframe列表元素？
pandasfor-loop 
Pandas 检测两个累积和之间不断增加的差异
pandas 
使用Pandas读取.data文件
pandas 
Pandas 带IntEnum的PANDS值_counts（）引发递归错误
pandasdataframe 
Pandas 循环将数据帧与groupby sum合并在一起
pandasdataframe 
pandas groupby中的apply函数能否返回多个数据帧？
pandas 
Pandas 从数据库中的dataframe列中删除特定对象类型的值
pandasdataframe 
Pandas 按数组中的元素选择数据帧
pandasdataframe 
Pandas 对时间数据列执行mod函数
pandasdataframecsvdatetime 
                                       





随机文章推荐



                                                        
Maps 谷歌地图-信息窗口用计时器关闭
maps 
Maps 从数组中检索坐标
maps 
Maps 如何从谷歌地图api获取波兰所有街道的列表
maps 
使用Mapstraction拖动（移动）多边形
mapsopenlayers 
Maps 以MBTiles格式导出Tilemill，显示无限导出时间
mapsgismapbox 
Maps 从嵌入的谷歌地图中提取坐标数据
maps 
Maps openlayers3以WFS格式加载矢量数据，但不显示它
mapsopenlayers-3


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python 如何将图像写入数据存储？
									Python
							 									Google App Engine
							 
Python 加上我们的国家'；开放式ERP 7日历中的假日
									Python
							 									Python 2.7
							 									Openerp
							 
Python AttributeError对象属性是只读的
									Python
							 
如果python赋值不'；t返回一个值我们怎么做a=b=c=42
									Python
							 
Python 泡沫定制头
									Python
							 									Python 2.7
							 									Soap
							 
Python 我在C-TAB上收到延迟错误：（error关键字参数：触发的不是（：requires:force init））之一
									Python
							 									Emacs
							 
Python中的向量化平均K近邻距离
									Python
							 									Numpy
							 
Python 寻找循环模式
									Python
							 									Regex
							 									Python 3.x
							 
Python 什么'；s更快，a==2==b，或a==2和b==2
									Python
							 									Performance
							 									Optimization
							 
Python 运行多个外部程序
									Python
							 
Python Travis CI PyPI部署解释器
									Python
							 
在python中返回列表索引而不循环的优雅方法是什么？
									Python
							 									List
							 
Python Django-从表单小部件中删除添加新记录>；
									Python
							 									Django
							 
安装Python3.6的GDAL时导入错误
									Python
							 									Python 3.x
							 									Sqlite
							 									Anaconda
							 
Python 使用Gensim shows“；正在使用gensim.models.doc2vec的慢速版本；
									Python
							 									Python 3.x
							 
Python 具有多个输出列的聚合函数
									Python
							 									Pandas
							 
Python matplotlib.pyplot.xticks（）的问题
									Python
							 									Matplotlib
							 
Python TensorFlow：优化推断由估计器导出的保存模型
									Python
							 									Machine Learning
							 									Tensorflow
							 
带有pexpect的stanford corenlp python错误
									Python
							 									Stanford Nlp
							 
Python 在Flask中返回包含HTTP错误响应代码的消息？
									Python
							 									Flask
							 
如何使python脚本给sudo提示我的密码
									Python
							 									Linux
							 
Python 如何使用GeoDataFrame生成叶状图？
									Python
							 									Json
							 
Python 如何在分配整数时将其替换为其他类
									Python
							 
Python 最小化Gurobi优化中的最大值
									Python
							 
Python 如何在Anaconda上安装Selenium，以及如何在Anaconda的Spyder IDE上使用含Scrapy的Selenium？
									Python
							 									Selenium
							 									Scrapy
							 									Anaconda
							 
Python 根据条件的数据帧滤波器
									Python
							 									Pandas
							 									Numpy
							 									Dataframe
							 
Python 如何迭代切片？
									Python
							 									Python 3.x
							 									Loops
							 
Python 什么'；文档中的这段代码中发生了什么？
									Python
							 									Pandas
							 
Python 无法使用pyaudio访问Mac Mojave上的麦克风
									Python
							 									Macos
							 
Python 在哪里可以找到函数的kwargs/args文档
									Python
							 									Pandas
							 									Matplotlib
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Instagram
Resharper
Maven 2
Tridion
Drupal
Mule
Dialogflow Es
Parse Platform
Coding Style
Opencart
Antlr
Corda
Sms
Sqlalchemy
Azure Data Factory
Phpunit
Uwp
Session
Javafx 2
Directory
Windows Phone 8.1
Opengl Es
Design Patterns
Jboss
Variables
Dependencies
Fortran
C
Entity Framework Core
Kentico
Nunit
Ruby
Xampp
Sencha Touch
Alfresco
Websphere
Elm
Dom
Weblogic
Ios4
Moodle
Visual Studio 2010
Single Sign On
Google Chrome
Mono
Amp Html
File Upload
Rx Java
Oauth 2.0
Testng
Properties
Socket.io
Network Programming
Twitter Bootstrap
Liferay
Exception
Merge
Symfony1
Floating Point
Amazon Dynamodb
Windows Installer
Asp.net Mvc 3
Struct
Compression
Internet Explorer 8
Wcf
Hazelcast
Macos
Neo4j
Authentication
Xquery
Inheritance
Database
Yii2
Netlogo
Amazon Ec2
Servlets
Artifactory
Vbscript
Google Cloud Storage
Doxygen
Gstreamer
Ios6
Html5 Canvas
Powerbi
Npm
Webpack
Gwt
Loopbackjs
Discord.py
Directx
Talend
Computer Science
Junit
Ios
Asp.net Mvc 5
Vuejs2
Gridview
Graph
Sip
Database Design
Scroll
Ignite
Graphics
Web Crawler
Linkedin
Mqtt
Unicode
Visual Studio 2012
Protractor
Azure Active Directory
Gatsby
Apache Kafka
Cuda
Sorting
Joomla
Synchronization
Web Scraping
Video Streaming
E Commerce
Flutter
Serial Port
Join
Virtual Machine
Imagemagick
Java 8
Clang
Pandas
Nsis
Canvas
Playframework 2.0
Lambda
Speech Recognition
Javascript
Arrays
Ftp
Gtk
Jaxb
Modelica
Smalltalk
Shiny
Drop Down Menu
Ssl
Build
Import
Excel
Macros
Testing
Facebook Graph Api
Tabs
Ssas
If Statement
Yocto
Datatables
Jar
Entity Framework 4
Linq To Sql
Camera
Here Api
Winforms
R
Math
Ms Access
Generics
Routing
Mercurial
Post
Ssh
Hive
Encoding
Doctrine Orm
Mips
Ruby On Rails 3
Openshift
Arm
Menu
Ecmascript 6
Opencv
Java
Ionic Framework
Xamarin.forms
Transactions
Mongodb
Windows Runtime
Ios8
Hybris
Docker
Libgdx
Flask
Pycharm
Cmd
Emacs
Tkinter
Bluetooth
Windows
Python 2.7
Jhipster
Autodesk Forge
Llvm
Scrapy
Orchardcms


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网