javaspark数据集中的GroupBy和Aggregate函数_Java_Apache Spark_Group By_Aggregate Functions - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
javaspark数据集中的GroupBy和Aggregate函数_Java_Apache Spark_Group By_Aggregate Functions - Fatal编程技术网

javaspark数据集中的GroupBy和Aggregate函数

java apache-spark

javaspark数据集中的GroupBy和Aggregate函数,java,apache-spark,group-by,aggregate-functions,Java,Apache Spark,Group By,Aggregate Functions,我试图在一个数据集上执行以下操作，以便对列Expense进行分组和聚合，以使其相加。但这在RelationalGroupedDataset的正常数据集上不起作用。如何在普通数据集中实现以下操作 dataset.select.(col("col1"),col("col2"),col("expend")).groupBy(col("col1"),col("col2"),col("expend")).agg(sum("expend")) SQL查询看起来像按col1、col2从表组中选择col1、

我试图在一个数据集上执行以下操作，以便对列Expense进行分组和聚合，以使其相加。但这在RelationalGroupedDataset的正常数据集上不起作用。如何在普通数据集中实现以下操作

dataset.select.(col("col1"),col("col2"),col("expend")).groupBy(col("col1"),col("col2"),col("expend")).agg(sum("expend"))

SQL查询看起来像

按col1、col2从表组中选择col1、col2、SUM（expense）

当我尝试此代码时，这些列会重复出现。

dataset.columns（）

给我提供了

[col1，col2，expend，expend]

方法正确吗？

我用下面的代码来解决这个问题。创建一个列表

list aggCols
这将具有列的操作。
在这里，我添加为
aggCols.add(expr("sum(expend1)"));
addCols.add(expr("sum(expend2)"));

 dataset.select.(col("col1"),col("col2"),col("expend"))
.groupBy(col("col1"),col("col2"))
.agg(aggCols.get(0), JavaConverters.asScalaIteratorConverter(aggCols.subList(1,aggCols.size()).iterator()).asScala().toSeq());

当我只有一个列要求和时，我添加了一些检查，然后我直接进行求和
 你能提供错误信息吗？@ShankarKoirala我得到了副本Shankar@ShankarKoirala你想在这里加上什么吗？你想按col1和col2
分组并计算支出的总和吗？是@ShankarKoirala假设我有两行数据（item1，item2,4,4）
&（item1，item2,5,5）
我希望它被分组为（item1，item2，9，9）
这就是我想要的结果。有什么建议如何处理这个自定义项吗




[apache spark]相关文章推荐



                                                        
                                       





随机文章推荐



                                                        
Rally 特定用户的迭代燃尽图
rally 
Rally 回溯API\u项目层次结构未缩小范围
rally 
从RallyDev提取数据并将其显示在屏幕上
rally 
Rally 回望API删除未经授权的快照
rally 
Rally 初始化多对象选择器
rally 
Rally 我得到了回应'；未授权创建：TestCase"；
rally 
如何以Rally'；s网格是这样的
rally 
从Rally中检索拦截器历史记录
rally 
Rally 在自定义场地上集合简单的卡板应用程序
rally 
Rally 搜索所有工作空间对象类型
rally


                                        

                                        
                                        


                                                
                                                        [java]相关推荐
                                                        
Java Android：在Android Emulator上安装Wikitude
									Java
							 									Android
							 									Android Emulator
							 
Java 如何在没有初始化的情况下将映像转换为BuffereImage？
									Java
							 									Image
							 									Swing
							 									User Interface
							 									Graphics
							 
Java 如果我使用文件读取器读取文件，如何知道我在文件中的位置？
									Java
							 
Java （1.0/x）*x-1.0何时不计算为0.0？
									Java
							 
Java中对象类的继承
									Java
							 									Inheritance
							 
Java 除了不可变的值对象之外，我什么时候应该重写'equals（）`？
									Java
							 
Java 如何在ANT脚本中使用源命令加载文件？
									Java
							 									Ant
							 
Java GWT-编译错误：没有可用于类型的源代码
									Java
							 									Maven
							 									Gwt
							 									Compiler Errors
							 
Java 以良好的性能处理非常大的文件
									Java
							 									Database
							 									File Io
							 
Java 如何使用静态方法增加非静态变量？
									Java
							 
使用递归（java）查找给定数字是否是给定集合的和（允许重复）
									Java
							 									Recursion
							 
如何在java中读取和提取图像像素并进行比较
									Java
							 									Image Processing
							 
Java 在JSP中使用单个键和多个值呈现多值哈希映射
									Java
							 									Jsp
							 
Java 作为随机类种子的最佳数
									Java
							 									Random
							 
Java 有没有办法用Checkstyle强制执行枚举类型命名约定？
									Java
							 
Java 异步任务致命异常
									Java
							 									Android
							 
Java Jackrabbit WebDAV同步示例？
									Java
							 									Apache
							 
Java 试图理解设置方法的真/假格式的数据验证
									Java
							 									Arrays
							 									Validation
							 
Java 运行servlet时出现问题
									Java
							 									Tomcat
							 									Servlets
							 
Java'；s相当于C#Big Rational
									Java
							 
Java PowerMock+；TestNg |预期异常不起作用
									Java
							 									Unit Testing
							 									Testng
							 
Java 由于找不到包，无法编译
									Java
							 									Eclipse
							 									Ant
							 
如何使用带Selenium和Java的XPath提取迭代表中特定行的文本
									Java
							 									Selenium
							 									Selenium Webdriver
							 									Xpath
							 
Java 我能'；t使用“spring”组织消息的延迟发送
									Java
							 									Spring
							 									Rabbitmq
							 
Java Android studio共享youtube链接到我的应用程序
									Java
							 									Android
							 
Java 给定一个DSAPrivateKey，如何计算相应的DSAPublicKey？
									Java
							 									Cryptography
							 
Java 设置弹簧靴的最佳方法+；与Facebook营销API进行沟通
									Java
							 									Typescript
							 
Java Jackson注释@get:JsonValue，与GSON等效
									Java
							 									Json
							 									Spring
							 
Java @ControllerAdvice不允许显示虚张声势用户界面
									Java
							 									Spring
							 									Spring Boot
							 									Spring Security
							 
如何在Android中过滤RxJava中的数据
									Java
							 									Android
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Bluetooth
Ruby On Rails 4
Haskell
Nsis
.net 4.0
Ruby On Rails 3.2
Struts2
Unit Testing
Gitlab
Ibm Cloud
Actionscript
Nestjs
Erlang
Outlook
Mongoose
Ios6
Highcharts
Scala
Grep
Jupyter Notebook
Stanford Nlp
Plot
Graphql
Boost
Ssh
Android Fragments
D
Electron
C# 4.0
Apache Storm
Architecture
Join
Directx
Calendar
Forms
Build
Openstack
Graphics
Nginx
Binding
Sass
Dependency Injection
Sms
Stata
Extjs
Google Compute Engine
Amp Html
Firefox
Azure
Jqgrid
Aem
Command Line
Amazon Cloudformation
Ansible
Ruby On Rails 3.1
Autohotkey
Clearcase
Arangodb
Twig
Video
Automated Tests
Enums
Bots
Filter
Apache Nifi
Encoding
Atom Editor
Windows 7
Crystal Reports
Swiftui
Razor
Angularjs
Acumatica
Tcp
Install4j
Express
Facebook
Phantomjs
Timer
Gulp
Python Sphinx
Akka
Cuda
Netbeans
Sharepoint 2010
For Loop
Configuration
.net Core
Laravel 4
Gridview
Snowflake Cloud Data Platform
Openssl
Multithreading
Session
Drupal 6
Jquery Ui
Discord
Swift3
Nservicebus
Selenium
Class
File
Sml
Optimization
Import
Recursion
Google App Engine
Csv
Yaml
Mule
Ada
Android
Azure Devops
Laravel 5
Hbase
Dask
Io
X86
Appium
Verilog
Teradata
Netlogo
Activerecord
F#
Antlr
Composer Php
Pdf
Ftp
Jpa
Dynamic
Loops
Spring Boot
Ibm Mq
Methods
Latex
Matlab
Asterisk
Flutter
Ember.js
Authentication
Dll
Hyperlink
C++ Cli
Angular Material
Karate
Powershell
Actions On Google
Sencha Touch
Telerik
Netty
Openlayers 3
Google Analytics
Azure Functions
E Commerce
Function
Codenameone
Jwt
Couchbase
Office365
Parallel Processing
Excel
Npm
Kotlin
Notifications
Websocket
Sails.js
Tabs
Z3
Asp.net Mvc 3
Kernel
Mapbox
Jsp
Inheritance
Abap
Twitter Bootstrap
Jenkins
Rx Java
Google Calendar Api
Sip
Tridion
Protractor
Numpy
Parameters
Plone
Mediawiki
Ionic Framework
Java 8
Vector
Reporting Services
Asp.net Core
Rest
Linq
Tinymce
Kendo Ui
Linux
Routing
Geometry
Xamarin.android
Unicode
Prolog
Sublimetext3


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网