Pandas 将数据帧groupby行保存为正好两行_Pandas_Dataframe_Pandas Groupby_Python 3.8 - Fatal编程技术网

Pandas 将数据帧groupby行保存为正好两行

pandas dataframe

Pandas 将数据帧groupby行保存为正好两行,pandas,dataframe,pandas-groupby,python-3.8,Pandas,Dataframe,Pandas Groupby,Python 3.8,我得到了一个数据帧，我想根据一个特定的列按行分组。每组中的行数至少为4行，最多为50行。我想将组中的一列保存为两行。如果groupsize是偶数，我们假设2n，那么n行在一行，其余的n行在第二行。如果是奇数，n+1和n或n和n+1就可以了比如说, import pandas as pd from io import StringIO data = """ id,name 1,A 1,B 1,C 1,D 2,E 2,F 2,ds 2,G 2, dsds "

我得到了一个数据帧，我想根据一个特定的列按行分组。每组中的行数至少为4行，最多为50行。我想将组中的一列保存为两行。如果groupsize是偶数，我们假设

2n

，那么

行在一行，其余的

行在第二行。如果是奇数，

n+1

和

或

和

n+1

就可以了

比如说,

import pandas as pd
from io import StringIO

data = """
id,name
1,A
1,B
1,C
1,D
2,E
2,F
2,ds
2,G
2, dsds
"""
df = pd.read_csv(StringIO(data))

我要分组方式

id

df.groupby（'id'，sort=False）

然后得到一个数据帧，比如

    id  name
0   1   A B
1   1   C D
2   2   E F ds
3   2   G dsds

这是一个有点复杂的方法，但它做的工作

def func(s: pd.Series):
    mid = max(s.shape[0]//2 ,1)
    l1 = ' '.join(list(s[:mid]))
    l2 = ' '.join(list(s[mid:]))
    return [l1, l2]

df_new = df.groupby('id').agg(func)

df_new["name1"]= df_new["name"].apply(lambda x: x[0])
df_new["name2"]= df_new["name"].apply(lambda x: x[1])


df = df_new.drop(labels="name", axis=1).stack().reset_index().drop(labels = ["level_1"], axis=1).rename(columns={0:"name"}).set_index("id")

可能不是最有效的解决方案，但它可以：

将numpy导入为np
df=df.sort_值（'id'）
#接下来的3行：为每组找到分隔符
df['range_idx']=范围（0，df.shape[0]）
df['mean\u rank\u group']=df.groupby（['id']）['range\u idx']变换（np.mean）
df['separate_column']=df['range_idx']

你能试试df.groupby（[df.index//2，df['id']]）.agg（'，'.join）@Manakin我需要每个组的行。您的解决方案为id 2提供了3行




[dataframe]相关文章推荐



                                                        
dataframe创建整数的新列
dataframejulia 
Dataframe 根据一个数据帧与另一个数据帧的日期获取差异
数据集A
dataframe 
Dataframe 使用条件awk语句创建具有附加值的新字段
dataframeawk 
Dataframe 如何在pyspark数据帧中将时间戳转换为bigint
dataframepyspark 
Dataframe pyspark中是否有计算唯一值的方法
dataframeapache-sparkpyspark 
Dataframe Panda数据帧从一行绘制直方图
dataframe 
Dataframe 使用静态日期值筛选数据帧
dataframeapache-sparkpyspark 
Dataframe 删除配置单元列的前导字符和尾随字符
dataframehive 
Dataframe 在if测试中使用数据帧
dataframeif-statement 
Dataframe 聚合大多数为空的列的最佳spark查询计划
dataframeapache-spark 
Dataframe 将第一个数据帧值STARTS与第二个数据帧值中的任何一个进行检查
dataframeapache-sparkpyspark 
Julia Dataframe group by在另一个group by中
dataframejulia 
Dataframe 如何在julia数据帧中对分组记录进行分组和排序
dataframejulia 
Dataframe 无重复R的测向中的频率
dataframe 
Dataframe 从julia中大小不规则的字典创建数据帧？
dataframejulia 
Dataframe 将数据帧中的列聚合到某个值
dataframe 
                                       





随机文章推荐



                                                        
C DMA将RAM传输到RAM
cwindowsx86 
在递归函数中使用libpcre
crecursion 
警告：忽略返回值'；scanf'；，用属性warn\u unused\u result声明
#包括
int main（）{
int t；
scanf（“%d”、&t）；
printf（“%d”，t）；
返回0；
}
c 
C 装配时是否严格要求；“最低”；操作系统的一部分？
cassemblyoperating-system 
为什么我们需要'；外部'；如果文件范围声明默认具有外部链接，是否在C中使用关键字？
c 
C中Memmove和SIGSEGV的问题
c 
C Printf函数参数
#包括
int main（）
{
printf（5+“阿披舍克达斯”）；
返回0；
}
c 
C MPI通信大型二维阵列
carraysmpi 
如何在c中从txt输入中分割字符串
cstringio 
C 字符常量太长，无法使用'；s型
cxcodemacos 
C 替换文本文件中的单词，然后输出被覆盖的版本
c 
从lua调用c代码
clua 
C 字符串创建中的分段错误
cstring 
C语言中的二叉搜索树级顺序遍历
calgorithmdata-structurestree 
C 在运行时定义数组大小
carrays 
组合字符数组&；C中的一个常量字符指针，指向单个常量字符*
carrayspointers 
C 从uint8\u t指针强制转换到uint32\u t整数编译错误
cpointers 
为什么time（）报告的时间有时比C代码中timespec_get（）的seconds组件晚1秒？
ctime 
C 絮凝物和RETSIGTYPE在生成源中
c 
C 与'有关的问题；对于'；简单高斯消去码中的循环
c


                                        

                                        
                                        


                                                
                                                        [pandas]相关推荐
                                                        
基于Pandas中的公共列值合并两个数据帧
									Pandas
							 									Dataframe
							 
Pandas 如何确定TQM进度？你在Jupyter申请熊猫？
									Pandas
							 									Jupyter Notebook
							 
Pandas 打印数据帧时缺少xticklabels的第一个值
									Pandas
							 									Matplotlib
							 
Pandas 在函数中应用np.average
									Pandas
							 
Pandas 选择具有组的最小值的所有dataframe行
									Pandas
							 
Pandas 为什么我会得到一个'；无'；打印透视表时，是否在图例标题中？
									Pandas
							 									Matplotlib
							 
Pandas 将日期时间列向后移动一小时
									Pandas
							 									Date
							 
Pandas 在累积条形图的每个步骤添加标签
									Pandas
							 									Matplotlib
							 
Pandas 如何使用iterrows修复ValueError
									Pandas
							 									Dataframe
							 
Pandas 使用熊猫，我试图保持；日期“；列作为索引列，但该列被复制，是否有人可以帮助修复它？
									Pandas
							 									Indexing
							 
Pandas 替换列中的尾随空格
									Pandas
							 									String
							 									Lambda
							 									Replace
							 
Pandas 从数据框中删除除索引和第n列以外的所有列
									Pandas
							 
Pandas 添加百分比列
									Pandas
							 									Numpy
							 
在pandas中使用DataFrame.to_标记时，如何控制浮点格式？
									Pandas
							 									Dataframe
							 
Pandas 如何使用colab从数据集创建网络图？
									Pandas
							 									Google Colaboratory
							 
Pandas 按有序组排序
									Pandas
							 
Pandas 合并两个数据帧而不复制列
									Pandas
							 									Dataframe
							 									Merge
							 
Pandas 如何将csv列转换为数据帧
									Pandas
							 									Dataframe
							 
Pandas 从基于位置的列的DataFrame写入TXT文件
									Pandas
							 									Dataframe
							 
使用pandas管理包装中的args和kwargs，以进行StochRSI计算
									Pandas
							 
Pandas SAS在创建新变量时循环到熊猫
									Pandas
							 									Dataframe
							 
Pandas 组内成员的顺序计数和总和
									Pandas
							 									Dataframe
							 
Pandas 在数值条件下合并或联接数据帧
									Pandas
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Maps
Programming Languages
User Interface
Hadoop
Google Cloud Storage
Amazon Dynamodb
Apache Storm
Windbg
Animation
Internet Explorer 8
Twilio
Continuous Integration
Windows Services
Fortran
Logstash
Netsuite
Excel Formula
D3.js
Typescript
Ios8
Awk
Drupal 6
Swagger
Jsf
Zend Framework2
Sublimetext3
Opengl Es
Tkinter
Protractor
Database
Yocto
Uwp
Android Layout
.net
String
Tags
Algorithm
Serialization
Google Bigquery
Internet Explorer
Kernel
Multithreading
Timer
Hash
Anaconda
Responsive Design
Django
Coffeescript
Docker Compose
Amazon Web Services
Ckeditor
Dom
Vector
Floating Point
Azure Active Directory
Sencha Touch
Image
Indexing
Reference
R
Dynamic
Exchange Server
Single Sign On
Doctrine Orm
Plone
Jsf 2
Scripting
Menu
Graphviz
Ios5
Kendo Ui
Devexpress
Svn
Java
Orm
Ruby On Rails 3.2
Angular Material
Autohotkey
Keyboard
Jvm
Swing
Ios4
Ruby
Actionscript 3
Talend
Weblogic
Bison
Binding
Gis
Go
Sed
Chart.js
Oauth 2.0
Drupal 7
Less
Postgresql
Sap
Smtp
Mapreduce
Oracle11g
Swift3
Applescript
Quickbooks
Directx
Lucene
Computer Vision
Requirejs
Arrays
Common Lisp
Stata
Cookies
Scroll
Keycloak
Antlr
Webpack
Transactions
Grails
Arm
Asp.net
Sorting
Stanford Nlp
Rally
Django Rest Framework
Material Ui
C# 3.0
Google Chrome Devtools
Symfony
Browser
Outlook
Tfs
Teradata
Wcf
Visual C++
Highcharts
Apache Zookeeper
Google Api
Windows Store Apps
Ldap
Activemq
Sonarqube
Atom Editor
Ios6
Redux
Gremlin
Asp.net Mvc 5
Spring Cloud
Pyspark
Windows
Search
Winforms
Android
Numpy
Terraform
Csv
Composer Php
Qml
Kibana
Youtube
Php
Dataframe
Mysql
Matrix
Postman
Couchbase
Pascal
Variables
Internationalization
Opencl
Events
Windows 10
Io
Gps
Input
Service
Perl
Ssas
Scala
Asynchronous
Ubuntu
React Native
Angular6
Compilation
Url Rewriting
Signalr
Akka
Time
Unity3d
Certificate
Jboss
Alfresco
Colors
Android Ndk
Entity Framework Core
Sqlite
Grep
Ocaml
Url
Mediawiki
Selenium Webdriver
Gwt
Reactjs


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网