Python 从具有相同ID的行创建列_Python_Pandas_Bigdata - Fatal编程技术网

Python 从具有相同ID的行创建列

python pandas

Python 从具有相同ID的行创建列,python,pandas,bigdata,Python,Pandas,Bigdata,我有这样一个df： Id username age 1 michael. 34 6. Mike. 65 7. Stephanie. 14 1. Mikael. 34 6. Mick. 65 Id username username_2 Age 1 michael. mikael. 34 6.

我有这样一个df：

Id      username  age

1       michael.     34
6.      Mike.          65
7.      Stephanie.  14
1.      Mikael.        34
6.      Mick.           65

Id      username      username_2    Age

1       michael.         mikael.           34
6.      Mike.             Mick.              65
7.      Stephanie.                           14

正如您所看到的，用户名对于相同的id写得不一样。我想将所有用户名重新组合到同一行，如下所示：

Id      username  age

1       michael.     34
6.      Mike.          65
7.      Stephanie.  14
1.      Mikael.        34
6.      Mick.           65

Id      username      username_2    Age

1       michael.         mikael.           34
6.      Mike.             Mick.              65
7.      Stephanie.                           14

谢谢

您可以为重复的计数

Id

创建

多索引，然后可以通过重塑，最后通过以下方式进行一些数据清理：
或重命名从1开始的列：
df1 = (df.set_index(['Id', df.groupby('Id').cumcount()])['username']
         .unstack(fill_value='')
         .rename(columns = lambda x: f'username_{x+1}')
         .reset_index())
print (df1)
    Id username_1 username_2
0  1.0    michael     Mikael
1  6.0       Mike       Mick
2  7.0  Stephanie        

干得好！你现在知道我如何在不删除df的所有其他行的情况下实现这一点吗？@YoavTaieb-S有多个列，如username
，需要对它们进行与列username
相同的输出数据处理？是的，但我还想保留df中以前的数据。你看，我还有其他不需要此处理的列，我想保留它们。@YoavTaieb-你能用预期的输出更改有问题的数据吗？@YoavTaieb-所以更改df.set_索引（['Id'，df.groupby（'Id'）.cumcount（）]）['username']
到df.set_索引（['Id'，'age'，df groupby（'Id'）.cumcount（））['username']
，但与数据示例中的一样，每行需要相同的值。




[pandas]相关文章推荐



                                                        
Pandas 处理数据帧中丢失和重复的数据时间字段
pandasdataframe 
Pandas 在大熊猫中本地化时间戳
pandaslocalization 
Pandas Bug-插入列表序列化为字符串时出错
pandas 
Pandas 熊猫：将列值追加为新行
pandas 
Pandas 为什么我无法清理使用read\html属性提取的表？
pandas 
Pandas 如何在AWS EC2上安装QUANDL？
pandasnumpy 
基于pandas中的元素切片连续列的便捷方法？
原始列如下所示：
pandas 
Pandas 熊猫的加入是缓慢的
pandas 
Pandas 将两个数据帧合并为一个数据帧
pandas 
Pandas 迭代检查列名是否等于另一列'；s值
pandasloops 
Pandas 计算在NaN之前Dataframe中有多少列
pandasdataframe 
Pandas 合并行计算平均值/总和
pandasdataframe 
Pandas 如何找到数据帧中极少数项之间的相关性
pandasdataframemachine-learning 
Pandas 停止将日期时间和时间戳数据的时间序列绘制为秒
pandas 
如何使用AWS KMS加密Pandas/Spark数据帧中的列
pandasencryptionpyspark 
Pandas 压缩行的元素并循环它们
pandasfor-loop 
Pandas 如何将我的输出转换为数据帧类型而不是系列
pandas 
Pandas 从数据帧列的字符串中提取数值，并用该数值替换该字符串
pandas 
Pandas 利用列车数据统计在熊猫中填充NaN值
pandasdataframe 
Pandas pd.read\u excel进程/线程安全？
pandasmultithreading 
                                       





随机文章推荐



                                                        
Visual studio 2010 针对特定主题配置VS 2010帮助
visual-studio-2010 
Visual studio 2010 删除设置相同的表FK'；s为空
visual-studio-2010entity-framework 
Visual studio 2010 NMAKE：致命错误U1077：返回代码'；0xc0000135'；
visual-studio-2010qt 
Visual studio 2010 xml文档的设置语言
visual-studio-2010documentation 
Visual studio 2010 VS 2010无法删除继承的其他依赖项
visual-studio-2010 
Visual studio 2010 用于VS的代码脚手架工具
visual-studio-2010fluent-nhibernate 
Visual studio 2010 在VisualStudio2010中添加命令并使其保持不变
visual-studio-2010 
Visual studio 2010 OOTB在运行VS2010安装程序MSI之前检查管理员权限的方法？
visual-studio-2010installationwindows-installer 
Visual studio 2010 在Visual Studio designer中向文本框用户控件添加右键单击？
visual-studio-2010events 
Visual studio 2010 是否有VisualStudio键盘快捷键来隐藏查找结果windw？
visual-studio-2010 
Visual studio 2010 如何删除"；“调试”；及；“释放”；Visual Studio中每个项目的文件夹
visual-studio-2010 
Visual studio 2010 在visual studio中启动调试器时通过属性表更改路径
我有一组属性表，它定义了C++项目中常用的第三个部分库的包含和链接路径。
当我在调试器中启动可执行文件时，是否有办法在这些页面中定义路径，以便可执行文件找到二进制文件
visual-studio-2010visual-c++pathmsbuild 
Visual studio 2010 如何确定SQL Server Compact表的版本？
visual-studio-2010 
Visual studio 2010 测试失败时向MsTest添加自定义操作
visual-studio-2010visual-studiocommand-line 
Visual studio 2010 如何从应用程序中删除windows.h调用？
visual-studio-2010winapivisual-c++ 
Visual studio 2010 在VisualStudio中调试MapReduce程序
visual-studio-2010hadoopmapreduce 
Visual studio 2010 帧指针寄存器'；ebx&x27；由内联汇编代码修改
visual-studio-2010visual-c++visual-studio-2012 
Visual studio 2010 Crystal Report创建收据登记报告2
visual-studio-2010crystal-reports 
Visual studio 2010 SQL Server Express与C应用程序的部署
visual-studio-2010c#-4.0 
Visual studio 2010 在VS2013下使用VS2010进行远程调试的最佳实践
visual-studio-2010visual-studio-2013


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python 有没有办法让Tkinter看起来不像windows 95？
									Python
							 									Tkinter
							 
现有的开源Python WxWidgets设计器是什么？
									Python
							 									Wxpython
							 
Python 如何减少打印在绘图中的图例框中文本的字体？
									Python
							 									Matplotlib
							 
Python optpass和字符串
									Python
							 									Parsing
							 
Python 通过从单个列表中提取内容创建多个列表
									Python
							 
Python “我怎么能？”；捕获；导入F2Py模块时出现seg故障？
									Python
							 									Import
							 									Module
							 
虚拟说唱歌手->；更新python二进制文件
									Python
							 									Django
							 
Python 使用熊猫重采样功能对每小时值进行上采样时出现意外结果
									Python
							 									Pandas
							 
Python 学习IMAP编程的好资源
									Python
							 									Email
							 
Python 检查repo是否脏时出错
									Python
							 									Windows
							 									Git
							 
用Python抓取网页
									Python
							 									Selenium
							 									Web Scraping
							 
Python 从django数据库检索数据并显示在表中
									Python
							 									Django
							 									Sqlite
							 
在python中使用静态方法优于实例方法
									Python
							 									Methods
							 
为什么IPython在目录it'；中执行code.py；是从哪里开始的？
									Python
							 									Python 3.x
							 									Ipython
							 
Python django.db.models字段默认值未定义可调用
									Python
							 									Django
							 									Python 3.x
							 									Django Models
							 
Python 从高到低
									Python
							 
启动一个子流程，等待它完成，然后用Python检索数据
									Python
							 									Linux
							 
Python 即使未找到匹配项，Pandas itertuples第一行也返回true
									Python
							 									Pandas
							 									Dataframe
							 
python中关于gabor过滤器的代码
									Python
							 
Python 熊猫条件性切片（优雅的方式）
									Python
							 									Pandas
							 
不能同时启动多个python进程
									Python
							 
python中的简单L系统
									Python
							 									Python 3.x
							 									Function
							 
使用带有span元素的contains文本时出现Python selenium问题
									Python
							 									Selenium
							 									Selenium Webdriver
							 									Xpath
							 
Python 并行化具有多个输入的函数
									Python
							 									Parallel Processing
							 
Python 烧瓶api和U注射器
									Python
							 									Flask
							 									Dependency Injection
							 
使用add_dll_directory（）从Windows上的Python 3.8 pyd加载dll
									Python
							 									C++
							 									Windows
							 									Dll
							 
Python Tensorflow.batch无法正确分离张量
									Python
							 									Tensorflow
							 
在不打开Windows命令提示符的情况下从Python执行子流程
									Python
							 									Windows
							 
（Python/Flask_SQLAlchemy）无法使用'；sqlite:////tmp/test.db'
									Python
							 									Flask
							 									Sqlalchemy
							 
Python 如何在Django请求处理程序线程中执行SIGTERM上的代码
									Python
							 									Django
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Streaming
Cron
Sugarcrm
Php
Regex
Dependency Injection
Opengl
Bazel
Google Maps
Amazon Dynamodb
Webview
Responsive Design
Devexpress
Visual Studio 2010
Couchdb
Twilio
Struts2
Webrtc
Isabelle
Visual Studio 2017
Python 3.x
Openlayers
.net
Virtual Machine
Embedded
Mips
Yaml
Geolocation
Xcode
Language Agnostic
Gps
Mod Rewrite
Ms Office
Ibm Midrange
Mono
Javafx
Magento2
Programming Languages
Sencha Touch 2
Model
Nativescript
Material Ui
Swift2
Visual Studio 2013
Log4j
Pandas
Cocoa
Clojure
Opencv
Map
Netlogo
Symfony1
Compression
Xmpp
Outlook
Asp.net Core
Seo
Jenkins
Text
Aem
Nunit
Parallel Processing
Exchange Server
Mapreduce
Reference
Angular6
Synchronization
Youtube Api
Eclipse Plugin
Openstack
Google App Maker
Enums
Pdf
Clang
Openssl
Wcf
Filter
Triggers
Ecmascript 6
Docker Compose
Apache Zookeeper
Vb.net
Nginx
Workflow
Telegram
Cocos2d X
Multithreading
Utf 8
Xampp
Sql
Influxdb
Wxpython
Networking
Dart
Google Maps Api 3
Orm
File
Google Cloud Platform
Merge
Playframework 2.0
Xamarin.android
Internet Explorer 8
Redux
Encoding
Security
Windows Services
Wolfram Mathematica
Elixir
Adobe
Checkbox
Sed
Eclipse
Atom Editor
Blackberry
Jasmine
Maps
Dialogflow Es
Visual Studio 2015
Vim
X86
Laravel 5
Unit Testing
Protocol Buffers
Service
Frameworks
Spring Boot
Npm
Node.js
Openid
Coldfusion
Gruntjs
Matrix
Big O
Logic
Pytorch
Aframe
Drupal
Dotnetnuke
Jetty
Selenium
Install4j
Marklogic
For Loop
Orientdb
Sqlite
Login
Google Calendar Api
Sass
Sharepoint 2010
Testing
Requirejs
User Interface
Sms
Pyspark
Junit
Tkinter
Project Management
Julia
Automated Tests
Loopbackjs
Typo3
Vuejs2
Django Models
Polymer
Google Drive Api
Camera
Linux
Button
Tomcat
Cryptography
Windows Runtime
Tridion
Sap
Ckeditor
Moodle
Apache
Timer
Amazon S3
If Statement
Amazon Cloudformation
Mapbox
Certificate
Exception Handling
Openerp
Leaflet
Apache2
Scheme
C# 4.0
Scripting
Ldap
Recursion
Facebook Graph Api
Perl
Jboss
Class
Entity Framework
Azure Functions
Ffmpeg
Prometheus
Zsh
Oop


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网