Python 根据其他列的唯一组合更改dataframe列值_Python_Pandas - Fatal编程技术网

Python 根据其他列的唯一组合更改dataframe列值

python pandas

Python 根据其他列的唯一组合更改dataframe列值,python,pandas,Python,Pandas,我有以下数据框： df=pd.DataFrame([[1,11,'a'],[2,12,'b'],[1,11,'c'],[3,12,'d'],[3,7,'e'], [2,12,'f']]) df.columns=['id','code','name'] print(df) id code name 0 1 11 a 1 2 12 b 2 1 11 c 3 3 12 d 4 3

我有以下数据框：

 df=pd.DataFrame([[1,11,'a'],[2,12,'b'],[1,11,'c'],[3,12,'d'],[3,7,'e'],
    [2,12,'f']])
 df.columns=['id','code','name']

 print(df)


     id  code name
  0   1    11    a
  1   2    12    b
  2   1    11    c
  3   3    12    d
  4   3     7    e
  5   2    12    f

对于上面的数据帧，对于列

id

和

code

的任何唯一组合，我只希望列'name'有一个值。对于eq，第0行和第2行的

名称应相同。此外，第1行和第5行的名称也应相同
       id  code name
   0   1    11    a
   1   2    12    b
   2   1    11    a
   3   3    12    d
   4   3     7    e
   5   2    12    b

请让我知道如何通过编程实现这一点。我有两个人在100000多行上做这个手术
谢谢
让我们先使用groupby
、transform
、和first
：
df.assign(name=df.groupby(['id','code'])['name'].transform('first'))

输出：
   id  code name
0   1    11    a
1   2    12    b
2   1    11    a
3   3    12    d
4   3     7    e
5   2    12    b

或者您不需要groupby

A=df.sort_values(['id','code','name']).drop_duplicates(['id','code'],keep='first').index
df.loc[~df.index.isin(A),'name']=np.nan
df.sort_values(['id','code','name']).ffill().sort_index()


Out[603]: 
   id  code name
0   1    11    a
1   2    12    b
2   1    11    a
3   3    12    d
4   3     7    e
5   2    12    b

这是使用join
和drop\u duplicates
解决问题的另一种方法。然而，我更喜欢@ScottBoston的解决方案
cols = ['id', 'code']
df.drop('name', 1).join(df.drop_duplicates(cols).set_index(cols), on=cols)

   id  code name
0   1    11    a
1   2    12    b
2   1    11    a
3   3    12    d
4   3     7    e
5   2    12    b

是的，你领先了10秒：）很好地使用了groupby
和transform
@VenkateshMalhotra，这样编程比我的答案更好。这是一个更像python解决问题的方法的答案，祝你好运。回答得好，文+1这也是非常创新的。非常感谢。




[pandas]相关文章推荐



                                                        
Pandas 将数据帧的所有非数字行折叠为一行
pandasdataframe 
Pandas 如何折叠数据框列并连接字符串
pandasdataframe 
Pandas 大数据帧中的条件联接结果计数
pandasapache-sparkhiveapache-pig 
Pandas 将条形图边绘制为短划线
pandasmatplotlib 
Pandas 熊猫：基于列中的多个对象值选择行
pandasdataframe 
Pandas 每个组合都有一个数据帧
pandascsvdataframemerge 
Pandas 计算当前行和未来行匹配条件之间的值的DataFrame列
pandas 
Pandas 哪些行彼此重复
pandas 
将来自Athena的数据加载到AWS中Cloud9/Lambda中的Pandas数据帧中，用于ETL
pandasaws-lambda 
Pandas 如何使用熊猫组和总和
pandasdataframe 
Pandas 熊猫从下至上排列扁平的层次结构
pandas 
Pandas 根据数据帧的大小动态选择行
pandas 
Pandas 在数据末尾插入空行
pandas 
Pandas 排序日期值；在数据帧中不'；行不通
pandassortingdate 
Pandas 在pyspark中使用大数据集获取相关矩阵
pandasapache-sparkpyspark 
Pandas 使用shift时创建引用不同行中的值的函数时出错
pandasfunctiondataframe 
Pandas 查找列值相等的数据FRMAE的最小索引
pandasindexing 
Pandas 使用StandardScaler缩放列子集时SettingWithCopyError
pandas 
Pandas-如何合并/连接/合并两个数据帧以拥有值的元组对
pandasdataframe 
布尔过滤器geopandas数据帧在
pandas 
                                       





随机文章推荐



                                                        
如何使用awk将行转换为列？
awk 
AWK&x2014；如何改进此示例
awk 
使用awk分割文件
awk 
Awk未将字段值分配给变量
awk 
Awk 基于第一列合并多个以制表符分隔的文件的某些列
awkmerge 
Can'；t使用awk在每行的开头添加行号
awk 
Awk 我将如何匹配正好'/'；在；安装在；专栏？
awk 
带正则表达式的awk分裂函数
awk 
Awk 如何筛选多个字符串的nmap结果并输出到文件？
awk 
如何用awk替换一行中的第n个匹配项
awk 
Awk 在向表中添加新列时，我得到了一个新行
awksed 
Awk 每一个grep结果都被保存到不同的文件中
awkgrep 
使用awk查找操作时间
awksed 
将awk输出传输到另一个awk命令
awk 
Awk 根据bash中的另一个文件删除文件的特定部分
awk 
Awk 是否有一个字段存储正则表达式中使用的确切字段分隔符FS，相当于RS的RT？
awk 
Awk 在巴黎字符串后添加括号
awksed 
awk将空格后的信息复制到新列
awk 
Awk：比较两个文件的内容，打印匹配项和非匹配项
awk 
在AWK中的一行中合并标志之间的多行
awk


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python在不使用第三方库的情况下操作和保存XML
									Python
							 									Xml
							 
Python 值错误：没有后端
									Python
							 									Usb
							 
Python 具有相同github帐户和SSH密钥的多台笔记本电脑
									Python
							 									Git
							 									Github
							 
Python表错误
									Python
							 									Python 2.7
							 
Python 需要使用random.randint命令制作猜字游戏的帮助吗
									Python
							 
Eclipse Pydev导入问题和pythonpath
									Python
							 									Eclipse
							 
Python 提供CSV文件供下载
									Python
							 									Csv
							 
如何使用python在tkinter中拖放图像
									Python
							 									Canvas
							 									Tkinter
							 
Python 如何优雅地防止QThread被破坏或垃圾收集？
									Python
							 
Python：如何绘制三维数组的正态分布
									Python
							 									Arrays
							 									Graph
							 									Statistics
							 
ThinkPython-ex4.5——编写一个绘制阿基米德螺旋（或其他类型）的程序
									Python
							 
Python 在数据帧中使用类别变量，在绘图版散点图中沿直线绘制颜色线
									Python
							 
Python 基准流。检索数据访问
									Python
							 									Firebase
							 
Python 属性错误：'；DatetimeIndexResampler'；对象没有属性'；滚动'；
									Python
							 									Pandas
							 									Dataframe
							 
如何使用python在google cloud fire store中添加字段
									Python
							 									Json
							 									Database
							 									Firebase
							 									Google Cloud Firestore
							 
Python 如何通过pandas.factorize识别多个条件？
									Python
							 									Pandas
							 									Dataframe
							 
用Python从teachable.com批量下载视频的最佳方式是什么？
									Python
							 
使用python线程为Maya创建GIF
									Python
							 
Python Beautifulsoup-如何从<；span>'；s
									Python
							 
Python 相关性是否是无监督学习（聚类）中的重要因素？
									Python
							 									Machine Learning
							 
Python 需要在许多模块中连接到Azure SQL DB-如何？
									Python
							 									Sql
							 									Azure
							 									Azure Sql Database
							 
Python Pygame不会抛出错误，但不会'；我不能播放任何音频
									Python
							 									Audio
							 
Python 如何在从数据集中提取保存的数据后将其可视化
									Python
							 									Pandas
							 									Matplotlib
							 
Python 在字典中的两个for循环内存储数据帧
									Python
							 									Pandas
							 									Dataframe
							 									Dictionary
							 									For Loop
							 
Python pd.concat是在循环中组合这两个数据帧的正确函数吗？
									Python
							 									Pandas
							 									Api
							 									Dataframe
							 
Python 限制芹菜中同时执行特定任务的数量
									Python
							 
Python 读取输入（nummbers），直到给出输入（Stop）
									Python
							 									For Loop
							 
Python 有没有办法将int或string赋值给字典中没有指定为键的特定值？
									Python
							 									Dictionary
							 									Pycharm
							 
元素在Python中不可交互-Selenium
									Python
							 									Selenium
							 
有没有一个C#等价于Python'；什么是pprint？
									Python
							 									C#
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Windows Phone 7
Sql
Visual Studio 2013
Visual Studio 2010
Sorting
Karate
Air
Gmail
Ember.js
Error Handling
Google Maps Api 3
Loopbackjs
Azure Ad B2c
Combobox
Cmake
Windows 7
Apache Pig
Testing
Redirect
Processing
Apache2
Sugarcrm
Anaconda
Responsive Design
Collections
Ms Office
Resharper
Reporting Services
Excel
Blockchain
Coding Style
Liferay
Typo3
Matlab
C
Lotus Notes
C# 3.0
Azure Data Factory
Jhipster
.net Core
Kubernetes
Xpages
Vb.net
Google Apps Script
Asp.net Mvc 3
Xmpp
Grep
Swift2
Database
Openstack
Pyspark
Wicket
Puppet
Nsis
Amazon S3
Identityserver4
Datatables
Tensorflow
Cryptography
Alfresco
Azure
Encryption
Zurb Foundation
Stata
Flask
Breeze
Ssas
Boost
Jquery Mobile
Installation
Terminal
Graphql
R
Ruby On Rails
Xquery
Blazor
Eclipse
Discord
Activerecord
Notifications
Replace
Macros
Gstreamer
Sql Server 2012
Video
Character Encoding
Project Management
Sprite Kit
Stripe Payments
Smalltalk
Bootstrap 4
Virtualbox
Activemq
Python
Open Source
Razor
Kendo Ui
Dependencies
Deployment
Session
Leaflet
Vba
Camera
Ssh
Actions On Google
Entity Framework 4
Iis
Jersey
Ios5
Snowflake Cloud Data Platform
Pdf
Struts2
Google Calendar Api
Omnet++
Model
Arduino
Ipython
Websocket
Mdx
Autocomplete
Compiler Construction
Jmeter
Msbuild
Variables
Scala
Octave
Web Crawler
Shiny
Zend Framework2
Cygwin
Programming Languages
Scrapy
Prometheus
Grid
Vue.js
Jestjs
Ibm Mobilefirst
Filesystems
Mfc
Odata
Mvvm
Sonarqube
Apache
Crystal Reports
Pagination
Xampp
Magento
Dataframe
Xpath
Linker
Gis
Arangodb
Lambda
Xcode
Jaxb
Debugging
Wcf
Autohotkey
Google Analytics
Charts
Build
Json
Highcharts
User Interface
.net
Graphics
Random
Doctrine Orm
Function
Swing
Next.js
Mongodb
Asp.net Core Mvc
Jsp
Plone
Datetime
Mapping
Openlayers 3
Bison
Spring Boot
Wolfram Mathematica
Cobol
Google Colaboratory
Hive
Twitter Bootstrap 3
Jasmine
Sql Server
Rx Java
Gcc
Version Control
Extjs4
Sdk
Cmd
Magento2
Css
Svn
Cassandra
Dynamic
Rally
Windows Installer
Java Me


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网