使用awk基于两个匹配字段的求和列_Awk - Fatal编程技术网

使用awk基于两个匹配字段的求和列

awk

使用awk基于两个匹配字段的求和列,awk,Awk,对于这个简单的任务，我似乎找不到一个awk解决方案。我可以根据一个匹配字段（$1）轻松地对一列（$3）求和：现在，如何基于两个字段来实现这一点？比如说1美元和2美元？以下是一个示例数据： P1,gram,10 P1,tree,12 P1,gram,34 P2,gram,23 ... 如果第一个字段和第二个字段匹配，我只需要对第3列求和谢谢你的帮助像这样 awk -F, '{array[$1","$2]+=$3} END { for (i in array) {print

对于这个简单的任务，我似乎找不到一个awk解决方案。我可以根据一个匹配字段（$1）轻松地对一列（$3）求和：

现在，如何基于两个字段来实现这一点？比如说1美元和2美元？以下是一个示例数据：

P1,gram,10  
P1,tree,12  
P1,gram,34  
P2,gram,23  
...

如果第一个字段和第二个字段匹配，我只需要对第3列求和

谢谢你的帮助

像这样

awk -F, '{array[$1","$2]+=$3} END { for (i in array) {print i"," array[i]}}' datas.csv

我的成绩

P1,tree,12
P1,gram,44
P2,gram,23

编辑

由于OP需要逗号保留在输出中，因此我使用@yi_H的“逗号修复”编辑了上面的答案。

针对需要更少内存但首先需要排序的解决方案（没有任何内容是免费的）：

谢谢你的回答Ray Toal，但我已经尝试过这个解决方案，但它不能满足我的需要，事实上我真的需要将我的字段分隔开来以便进一步处理…@yiuh的修复程序保留了三列输出；答案已编辑。这需要一个大文件的大量内存。观察得不错，@jfgagne。对于大文件，可以使用

排序。而mapreduce需要数十GB的时间。：）
P1,tree,12
P1,gram,44
P2,gram,23

sort datas.csv | awk -F "," 'NR==1{last=$1 "," $2; sum=0;}{if (last != $1 "," $2) {print last "," sum; last=$1 "," $2; sum=0;} sum += $3;}END{print last "," sum;}'




[sql server 2008]相关文章推荐



                                                        
Sql server 2008 需要帮助将sql 2008表上的字段分区到其他文件组吗
sql-server-2008 
Sql server 2008 SSRS报告自定义提示布局
sql-server-2008layoutreporting-services 
Sql server 2008 SSIS：如何在导入期间跳过行？
sql-server-2008ssis 
Sql server 2008 Reporting Services 2005能否在SQL Server 2008数据库上报告？
sql-server-2008reporting-services 
Sql server 2008 XML中的sql ORDER BY子句
sql-server-2008 
Sql server 2008 在SQL Server Management Studio 2008中编辑数据行时是否锁定？
sql-server-2008 
Sql server 2008 从何处获取SSAS实验室的vDateFeed视图定义？
sql-server-2008ssas 
Sql server 2008 插入到使用WHERE
sql-server-2008 
Sql server 2008 动态AX 2012财务维度
sql-server-2008ssrs-2008axapta 
Sql server 2008 将列同时用作单个更新查询的源和目标
sql-server-2008transactions 
Sql server 2008 SSI使用带有变量的数据流任务，而不是源数据库
sql-server-2008sqlitessis 
Sql server 2008 SQL Azure作为链接服务器->；获取插入行的标识
sql-server-2008azureazure-sql-database 
Sql server 2008 创建包含视图性能影响的视图？
sql-server-2008database-designview 
Sql server 2008 SQL Server比较AM和PM
sql-server-2008 
Sql server 2008 审核sp_配置SQL Server 2008标准版
sql-server-2008 
Sql server 2008 要获取选定的值吗
sql-server-2008 
Sql server 2008 如何从表中逐个获取值（id）
sql-server-2008 
Sql server 2008 减少bcp出口的产量
sql-server-2008 
Sql server 2008 从sql server 2008中声明的表中删除重复项
sql-server-2008 
Sql server 2008 如何合并单个表的单元格
sql-server-2008merge 
                                       





随机文章推荐



                                                        
Air stageVideo空中2.5
air 
AdobeAIR HtmlLoader-悄然失败
air 
单击Windows上Flash CS6上的另一个选项卡时，Air for iOS配置面板关闭
air 
Air 文件流安全错误
air 
Air depthAndStencil在应用程序XML中抛出错误103
air 
将Adobe Encore生成的带有外部视频的.swf文件嵌入到带有Flash Pro的Adobe AIR应用程序中
airflash


                                        

                                        
                                        


                                                
                                                        [awk]相关推荐
                                                        
linux/ubuntu awk匹配唯一值（而不是bash“sort unique grep”唯一值）
									Awk
							 									Grep
							 
Awk 在pdb文件中使用grep
									Awk
							 									Grep
							 
Awk 按列进行数据分区
									Awk
							 
Awk 如何用数字替换复杂ID？
									Awk
							 
在awk中打印字符串值会导致错误
									Awk
							 
我如何让awk（gawk）像IGNORECASE=0一样尊重case？
									Awk
							 
Awk 取第1列中最小值所在的整行
									Awk
							 
Awk 如何将稀疏矩阵数据转换为WEKA'；什么是arff文件格式？
									Awk
							 
比较awk中的变量
									Awk
							 
Awk 要处理多个不同的解除限制器格式，请执行以下操作：
									Awk
							 
Awk 删除一行，然后删除最后一行的逗号和匹配的模式
									Awk
							 									Sed
							 
带awk的递归函数
									Awk
							 
将行数设置为awk中的变量
									Awk
							 
如何使用awk获取两个文件之间的公共行
									Awk
							 
Awk 具有多列的相邻数据行之间的差异
									Awk
							 
如何在awk中将数组转换为字符串？
									Awk
							 
理解awk分隔符-在基于正则表达式的字段分隔符中转义
									Awk
							 
使用awk将字符串附加到输出文件中的空值
									Awk
							 									Merge
							 
Awk 转换文件并填充缺少的字段
									Awk
							 
Awk 使用sed删除冒号后不存在数据的记录
									Awk
							 									Sed
							 
用逗号替换行尾，并在sed/awk中插入括号
									Awk
							 									Sed
							 
awk文件列表-输出每个输入文件只打印一行
									Awk
							 
如何使用sed或awk删除在特定位置包含特定字符串的行？
									Awk
							 									Sed
							 
在awk中，可以同时使用图案和端块吗？
									Awk
							 
如何通过awk将两条连续线连接在一起
									Awk
							 
awk中的两个文件处理
									Awk
							 									Sed
							 
Awk sed匹配模式并插入换行符，后跟替换文本
									Awk
							 									Sed
							 
Awk打印列的最大值大于0.5的特定行
									Awk
							 
如何在awk中抑制换行
									Awk
							 
Awk 将每列除以另一列
									Awk
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Next.js
Clojure
Activemq
Amazon Redshift
Nhibernate
Computer Science
Ios8
Character Encoding
Shiny
Blockchain
Asp.net
Silverlight
Coffeescript
Sitecore
Apache Camel
Usb
Replace
Asp.net Core
Design Patterns
Omnet++
Random
Sip
Spotify
Rspec
Fluent Nhibernate
Glsl
Go
Maps
Cobol
Google Chrome Devtools
Jdbc
Opengl
Swagger
Corda
Octave
Stripe Payments
Pyspark
C# 3.0
Windows 10
Jboss
Magento
Entity Framework 4
Sql Server 2008
Properties
Path
Ubuntu
Yaml
Sqlite
Identityserver4
Processing
Akka
Discord.js
Prolog
View
Snmp
Material Ui
Java Me
Rest
Virtualbox
Azure Sql Database
Url
Jenkins
Socket.io
Instagram
Gnuplot
Android Fragments
Dask
Python 2.7
Scripting
Delphi
Menu
Webrtc
Gwt
Oauth
Jquery
Sapui5
Ssas
Content Management System
Azure Cosmosdb
Inheritance
Drools
Rdf
Architecture
Visual Studio 2012
Kdb
Plot
Npm
Yii
Dynamic
Syntax
Stream
Openshift
Spring Batch
Windows Phone 7
Perforce
Ms Word
Netbeans
C#
Kernel
Streaming
Internationalization
Google Cloud Storage
Visual Studio 2008
C++ Cli
Combobox
Openlayers 3
Markdown
Jupyter Notebook
Interface
Amazon Ec2
Clearcase
Curl
Hbase
Frameworks
Erlang
Msbuild
Charts
Botframework
Ignite
Assembly
Exception Handling
Date
Numpy
Reactjs
Pagination
Filter
Adobe
Nest
Python Sphinx
Function
Xsd
Tkinter
Jmeter
Windows
Coq
Tinymce
Ember.js
Cryptography
Bluetooth
Caching
Flutter
Ms Access
Azure Functions
Openssl
Backbone.js
Visual Studio
Python
Scala
Racket
Installation
Sas
Nativescript
Jar
Select
Automated Tests
Directx
Nosql
Airflow
Webgl
Sql
Passwords
Install4j
Arm
File
Tridion
Zend Framework
Authentication
Plone
Continuous Integration
Jakarta Ee
Mysql
Windows Store Apps
Rx Java
Lambda
Printing
Stanford Nlp
Google Visualization
Windows Phone
Memory Management
Log4j
Netty
Types
Eclipse Rcp
Colors
Asp.net Mvc 4
Layout
Wicket
Gatsby
Batch File
Powershell
Windbg
Safari
Vhdl
Telerik
Office365
Database Design
Version Control
Antlr4
Apache Storm
Proxy
Extjs


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网