Python的Group-By技术与SQL-partition-By技术的比较_Python_Sql_Pandas_Dataframe - Fatal编程技术网

Python的Group-By技术与SQL-partition-By技术的比较

python sql pandas dataframe

Python的Group-By技术与SQL-partition-By技术的比较,python,sql,pandas,dataframe,Python,Sql,Pandas,Dataframe,我想问一个概念性的问题我有一张看起来像的桌子 UPC_CODE A_PRICE A_QTY DATE COMPANY_CODE A_CAT 1001 100.25 2 2021-05-06 1 PB 1001 2122.75 10 2021-05-01 1 PB 1002 212.75 5

我想问一个概念性的问题

我有一张看起来像的桌子

UPC_CODE    A_PRICE     A_QTY    DATE       COMPANY_CODE    A_CAT
 1001        100.25       2     2021-05-06      1             PB
 1001        2122.75      10    2021-05-01      1             PB
 1002        212.75       5     2021-05-07      2             PT
 1002        3100.75      10    2021-05-01      2             PB

我希望对于每个UPC_代码和公司代码，都应该获取最新的数据

为了实现这一点，我使用了SQL和Python

使用SQL：

WITH cte AS (
SELECT *, ROW_NUMBER() OVER (PARTITION BY UPC_CODE, COMPANY_CODE ORDER BY DATE DESC) rn
FROM yourTable)

SELECT UPC_CODE, A_PRICE, A_QTY, DATE, COMPANY_CODE, A_CAT
FROM cte
WHERE rn = 1;

使用Python：

df = df.groupby(['UPC_CODE','COMPANY_CODE']).\
     agg(Date = ('DATE','max'),A_PRICE = ('A_PRICE','first'),\
     A_QTY = ('A_QTY','first'),A_CAT = ('A_CAT','first').reset_index()

理想情况下，我应该得到以下结果表：

UPC_CODE    A_PRICE     A_QTY    DATE       COMPANY_CODE    A_CAT
 1001        100.25       2     2021-05-06      1             PB
 1002        212.75       5     2021-05-07      2             PT

然而，使用SQL我得到了上述信息，但Python不是这样

我在这里遗漏了什么？

upc\u code

和

date

列可能与

rank（method='first'，升序=False）

一起使用，例如，在确定第一行时按降序应用

dataframe.groupby（）

函数在将

date

列转换为datetime后，在Python中键入，以便筛选出

df['rn']1对应的行
df['date']=pd.to_datetime（df['date']）
df['rn']=df.groupby（'upc_code'）['date'].rank（method='first'，升序=False）
打印（df[df['rn']==1]）
@Vahram Daniyen:请详细说明。




[sql]相关文章推荐



                                                        
Sql 标题：无法绑定多部分标识符s.Company\u id
sqlsql-serversql-server-2005tsql 
SQL Datepart Where子句不起作用
sqlsql-servertsqlasp-classic 
实时Oracle SQL分析器工具
sqloracle 
SQL选择语句
sql 
SQL GroupBy对我的查询进行无序排序
sqlsql-server 
存储过程SQL错误不工作
sqlsql-server-2008stored-procedures 
Sql 从Access DB中的表中删除重复行
sqldatabase 
Sql 链接两组不带公共标识符的独立数据代码
sqldatabaseexcelms-access 
Sql 自然连接跳跃
sqloraclejoin 
Sql 基于多个表过滤器更新列
sqloracle 
Sql “如何替换”；a:1:{s:10:a:1:{s:10:subscriber"；b:1}"；和a:1:{s:10:subscriber"；b:1}"；？
sqlwordpress 
Sql 如何使用另一个表中的值填充表
sqloracle 
SQL Server排序奇数ASC和偶数DESC
sqlsql-servertsqlselect 
如果familyID不是4的倍数，则在SQL表中创建虚拟填充行，以使其成为4的倍数
sqlsql-servertsql 
如何使用纯SQL获取增量记录？
sqloracle 
Sql 仅选择列值在行之间更改的记录
sqloracle 
Sql 如何提取配置单元中字符串的一部分
sqlhadoophive 
Sql 在对多个列进行排序后，为每个id选择值
sqloraclesortingselect 
如何将SQL多对多数据模型转换为firebase数据模型
sqlfirebasegoogle-cloud-firestore 
Sql 双倍，
伯爵，
伯爵，
伯爵，
活跃的，
有效期至_max，
id_2
从y
)
挑选
现在（），
身份证件
客户
斯坎达，
单数1，
数到2，
伯爵，
伯爵，
伯爵，
活跃的，
有效期至_max，
id_2:：bigint，
现在（），
现在（）
从临时
sqlpostgresql 
                                       





随机文章推荐



                                                        
Tsql t-sql不包含多个列
tsql 
Tsql 周到日期数据过滤器
tsql 
TSQL-排除条件
tsql 
Tsql 使用游标检查T-sql中一年中每个月的值
tsql 
具有sum和多列的tsql group by子句
tsql 
Tsql 获取SQL Azure联合体中已使用/未使用的数据库容量
tsqlazure-sql-database 
Tsql 使用动态sql创建包含和的表
tsqlsql-server-2008-r2 
Tsql 如何在sql server 2008 R2中查找存储过程中的记录计数不匹配？
tsql 
Tsql 系统视图的表或视图
tsqlsql-server-2012 
Tsql 如何在单个存储过程中使用多个输出参数
tsqlstored-procedures 
TSQL组合多行和多列
tsql 
Tsql 搜索查询动态与静态-SQL Server 2012
tsqlsql-server-2012 
Tsql 重新排列排列的行
tsqlstored-proceduressql-server-2008-r2sql-server-2012 
Tsql 如何使用bat文件从用户获取数据并查询SQLServerDB
tsqlbatch-file 
Tsql 将变量与tmptable关联
tsql 
Tsql 将大写字母转换为小写字母
tsql 
Tsql T-SQL：如何从分组中获取最后修改的行
tsql 
Tsql 字符串或二进制数据将被截断nChar类型，如何取出电话号码格式
tsql 
Tsql 创建列以按工作量正确分组
tsql 
Tsql 找出添加了天数间隔的日期是否在周内
tsqldatesql-server-2012


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
在Python中测试类型错误和属性错误（LPTHW，练习48）
									Python
							 
在函数内的文件级导入？（Python 2）
									Python
							 									Import
							 
Python 为什么列表索引超出范围？
									Python
							 									List
							 
Python Django TestCase对象没有属性'；会议'；
									Python
							 									Django
							 
新的python版本将添加到现有版本中，而不是升级
									Python
							 									Macos
							 									Pip
							 
Python 测试列表中的值比堆叠try'；除'；s
									Python
							 									List
							 									Python 3.x
							 
用python从文本文件中筛选和提取字段
									Python
							 									Python 3.x
							 
python@property不覆盖类属性
									Python
							 									Oop
							 
在Python的特定列中添加所有值
									Python
							 
Python 为什么版本1.6.1的pyspark dataframe中的“where”与“select”的行为有所不同？
									Python
							 									Apache Spark
							 									Pyspark
							 
python Django如何将一些“u项”通过“可除性”进行划分；2“；工作
									Python
							 									Django
							 
Python 合并或迭代特定列上的行
									Python
							 									Pandas
							 
Python ValueError:'；太多的值无法解压缩'；关于尝试从数据库访问
									Python
							 									Database
							 
Python 如何在Django中实现PUT方法
									Python
							 									Django
							 
Python 如何从数据帧中删除除空格以外的特殊字符
									Python
							 									Regex
							 									Excel
							 									Pandas
							 									Dataframe
							 
python更改bash目录mac
									Python
							 									Django
							 									Python 3.x
							 									Python 2.7
							 
使用Python beautifulsoup选择除特定标记之外的所有内容
									Python
							 
Python 酸洗Cython装饰函数导致酸洗错误
									Python
							 
Python 基于索引在dataframe中查找特定列的值
									Python
							 									Pandas
							 
Python 在Matplotlib中并排绘制两个热图
									Python
							 									Matplotlib
							 
Python 计算到达头部的投掷次数
									Python
							 
Python Pandas Timeseries：仅保留一个值peer week和id
									Python
							 									Pandas
							 
Python 不同文件夹上的FastApi中间件不工作
									Python
							 									Api
							 									Rest
							 
Python 为什么Pytork中的正则化与scratch代码不匹配？Pytork中用于正则化的公式是什么？
									Python
							 									Pytorch
							 
Python 如何从PyTorch'；s时尚主义者数据集？
									Python
							 									Pytorch
							 
如何在Python dataframe中的任何行具有NaN值后删除列
玩具示例代码
									Python
							 									Pandas
							 									Dataframe
							 
永远运行asyncio事件循环的Python方式是什么？
									Python
							 									Python 3.x
							 									Asynchronous
							 
Python 映射两个嵌套列表的置换
									Python
							 
Python 调用动态引用函数的嵌套生成器表达式
									Python
							 
Python 如何从tkinter中的excel值中进行下拉？
									Python
							 									Excel
							 									Tkinter
							 									Combobox
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Acumatica
Pagination
Webstorm
Ruby On Rails
Bash
Formatting
Layout
Elixir
Streaming
Indexing
Sharepoint
Log4net
Silverlight
Ms Office
Visual Studio 2010
Sublimetext3
Gnuplot
Teamcity
Opencart
Weblogic
Ecmascript 6
Dialogflow Es
Pentaho
Jwt
Tomcat
Data Structures
Bison
Workflow
Iis
Stored Procedures
Mqtt
Html5 Canvas
Kernel
Ruby On Rails 3.1
Twitter Bootstrap
Tsql
Symfony1
Chef Infra
Drupal 6
Model
Forms
Configuration
Azure
Database Design
Websocket
Data Binding
Vagrant
Google Maps
3d
Jar
Download
Sugarcrm
Scala
Time
Charts
Sdk
Internet Explorer 8
Jhipster
Navigation
Silverstripe
Leaflet
Sharepoint 2007
R
Jasper Reports
Unity3d
Wicket
Nuget
Yaml
Spring Boot
Kubernetes
Interface
Mdx
Android Studio
Dask
Cassandra
Xslt
Tinymce
Big O
Regex
Antlr
Statistics
Yocto
Z3
Collections
Mapreduce
Twig
Discord.js
Sass
Open Source
Ignite
Postman
Oauth
Web Services
Listview
Asterisk
Flash
Entity Framework 4
Git
Netty
Plone
Google Drive Api
Appium
Sencha Touch
Stripe Payments
Common Lisp
Lua
Testng
Azure Functions
Video Streaming
Firefox
Sails.js
Imagemagick
C++
Content Management System
Ag Grid
Sapui5
Ios6
Generics
Multithreading
Glsl
Fullcalendar
Domain Driven Design
Ibm Mobilefirst
Sml
Swift2
Algorithm
Image
Javafx
Go
Monitoring
Python 3.x
Sharepoint 2013
Windows Mobile
Synchronization
Recursion
Shell
Openerp
Speech Recognition
.net 4.0
Vim
Nginx
Jakarta Ee
Select
Pine Script
Google Cloud Storage
Apache
Passwords
Webrtc
Stream
Puppet
Android
Javascript
Pointers
Openstack
.net Core
Sonarqube
Spotify
Url Rewriting
Html
Compiler Errors
Rx Java
Struts2
Tridion
Processing
Tags
Razor
Encryption
Proxy
Unix
Jquery Plugins
Bazel
Gis
Oracle Apex
Gdb
Php
Google Colaboratory
Exception Handling
List
Windows Phone 7
Jasmine
Webview
Instagram
Logic
Ibm Mq
Service
Map
User Interface
Actionscript 3
Google Plus
Cors
Colors
Mule
Xamarin.android
Mongoose
Google Chrome
Swiftui
Zend Framework
Hive
Time Complexity
Hyperledger Fabric
C# 4.0


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网