Apache spark Spark结构化流传输抛出错误中具有不同计数的聚合_Apache Spark_Spark Streaming - Fatal编程技术网

Apache spark Spark结构化流传输抛出错误中具有不同计数的聚合

apache-spark

Apache spark Spark结构化流传输抛出错误中具有不同计数的聚合,apache-spark,spark-streaming,Apache Spark,Spark Streaming,我正在尝试获取Spark结构化流媒体中Parentgroup、childgroup和MountingType组的唯一id 代码：下面的代码正在抛出错误 .withWatermark("timestamp", "1 minutes") val aggDF = JSONDF.groupBy("Parentgroup","childgroup","MountingType")

我正在尝试获取Spark结构化流媒体中Parentgroup、childgroup和MountingType组的唯一id

代码：下面的代码正在抛出错误

  .withWatermark("timestamp", "1 minutes")
          val aggDF = JSONDF.groupBy("Parentgroup","childgroup","MountingType")
       .agg(countDistinct("id"))

Error:
Append output mode not supported when there are streaming aggregations on streaming DataFrames/DataSets without watermark

请有人帮助我如何在结构化流媒体中聚合和写入csv。非常感谢

数据：

分组操作需要在spark streaming中指定窗口或时间段
试试这个

psuedo code val JSONDF = df.withWatermark("timestamp", "1 minutes") val aggDF = JSONDF.groupBy(window("timestamp", "5 minutes", "1 minutes")).agg(countDistinct("id"),$"Parentgroup",$"childgroup",$"MountingType")
参考：
请提供错误详细信息。@kavetiraviteja:在流式数据帧/数据集上存在无水印的流式聚合时，不支持追加输出模式@卡维蒂拉维特加：请帮助我……如果可能的话。请检查我的评论。非常感谢。。。。甚至我也导入了import org.apache.spark.sql.functions。。。。仍然出现类似“无法解析重载方法窗口。我使用了scala而不是python。请检查此处的窗口函数。”
psuedo code val JSONDF = df.withWatermark("timestamp", "1 minutes") val aggDF = JSONDF.groupBy(window("timestamp", "5 minutes", "1 minutes")).agg(countDistinct("id"),$"Parentgroup",$"childgroup",$"MountingType")

[processing]相关文章推荐

Processing 需要帮助以某种方式反转值吗 processing

Processing 如何在特定区域内绘制随机线。（处理） processing

Processing 加工中沿贝塞尔曲线的移动 processing

Processing 绘图到p5.图像，而不是画布 processing

Processing-loadStrings（）不区分大小写 processing

Processing 为什么ArrayList无法在处理过程中存储颜色？ List cr=new ArrayList（）； processing

Processing 处理3问题中莫尔斯电码编码器到解码器的转换 processing

Processing p5.js webgl多边形线连接解决方案？ processing

随机文章推荐

ANTLR语法文件可以模块化吗？ antlr

Antlr 如何使用lex 0。。255? antlr

Antlr初学者错配问题 antlr

在ANTLR中删除左递归 antlr

antlr 3.0中的错误处理 antlr

ANTLR：如何用lexer解析匹配括号内的区域 antlr

从ANTLR语法中剥离操作会更改其解析算法 antlr

用于DSL实现的ANTLR或SableCC？ antlr

antlr显示识别错误 antlr

&引用；“可读性”；ANTLR生成的代码？ antlr

如何在ANTLR3中匹配过于简单的字符串 antlr

如何提交到antlr v2？ antlr

Antlr 每次重复长度增加的数字块序列的语法规则 antlr antlr4

使用Antlr解析具有多个区域设置的公式 antlr

我的ANTLR语法在解析过于简单的Java文件时有什么问题？ antlr antlr4

[apache spark]相关推荐

Apache spark Spark MLlib-协作过滤隐式提要
Apache Spark

Apache spark 我应该合并spark输出文件吗？
Apache Spark

Apache spark Spark Thrift服务器-无法启动（配置单元错误）
Apache Spark Hive

Apache spark 连接Mesos的火花壳卡在sched.cpp上
Apache Spark

Apache spark 基于cassandra表分区键的spark数据集中
Apache Spark Cassandra

Apache spark 在哪里可以找到spark.ml dataframe实现的协作过滤
Apache Spark

Apache spark Spark SQL over Streaming-ArrayIndexOutOfBoundsException
Apache Spark

Apache spark 如何保存对广播变量的引用
Apache Spark

Apache spark pyspark：将数据帧的行合并到DenseVector中
Apache Spark Pyspark

Apache spark 读取包含4条记录的文件时，UI显示36K个任务
Apache Spark

Apache spark 如何在Spark SQL中使用外部表进行类似的筛选
Apache Spark

Apache spark 如何在pyspark中映射for循环中行的单列值
Apache Spark Pyspark

Apache spark 我的spark代码计算每个组织的员工有什么不对？
Apache Spark

Apache spark Spark:dataframe.repartition（num）从dataframe中删除第一行
Apache Spark

Apache spark 使用lambda架构和spark合并视图时是否会出现性能问题？
Apache Spark

Apache spark ApacheSpark应用程序框架
Apache Spark Pyspark

Apache spark Stream Stream在结构化流中与mapGroupswithState连接
Apache Spark

Apache spark 我可以指定某台机器作为火花纺纱机的驱动程序吗？
Apache Spark

Apache spark 执行索引地理空间查询的最低要求
Apache Spark

Apache spark ApacheSpark：如何将自定义消息从执行器发送到驱动程序
Apache Spark

Apache spark 如何将带有时区的奇怪日期时间字符串转换为时间戳（PySpark）
Apache Spark Pyspark

Apache spark 根据某些筛选条件比较两个数据帧的值，然后获得计数
Apache Spark Dataframe Pyspark

Apache spark GraphX和#x27；s基于内存的洗牌和Spark内核'；洗牌
Apache Spark

Apache spark 启用SSL时，Spark UI不会'；t使用HTTPS，但通过HTTP转发到端口0
Apache Spark

Apache spark 在配置单元S3表的情况下，pyspark命令行出错
Apache Spark Hadoop Pyspark Hive

Apache spark 在2列上进行spark快速范围查找
Apache Spark

Apache spark 将输入值拆分为Pyspark数据帧中的不同字段
Apache Spark Pyspark

Apache spark 从命令行配置Hortonworks数据平台沙盒2.6.5
Apache Spark Hadoop Hive

Apache spark 使用结构和数组类型定义架构
Apache Spark Pyspark

Apache spark 如何更新整个数据集行？
Apache Spark

Tags

Puppet Ajax Asp.net Mvc 2 Opencv Akka Terminal Netsuite Core Data Sharepoint Winapi Geometry Ibm Mobilefirst Sdk Concurrency Silverlight 4.0 Lisp Docusignapi Character Encoding Performance Triggers Google Cloud Storage Pdf Multithreading Hadoop Parameters Google Cloud Firestore Colors Next.js Certificate Cors Adobe Utf 8 Cygwin Spring Security Here Api File Io Artificial Intelligence Swiftui Fonts Chart.js Sms Drupal 7 Caching Docker Algorithm Node.js Windows Discord Oauth Function Nunit Azure Sql Database Db2 Teamcity Aem Ffmpeg Forms Keras Activerecord Mips Server Scripting Sharepoint 2010 Xml Security Web Applications Continuous Integration Delphi Sql Server 2008 R2 Ruby On Rails Enums Paypal Animation Clearcase Macos Vim Npm Mfc Kernel Gatsby Typo3 Sass Ipad Arrays Spring Cloud Joomla Push Notification Apache Pig Tsql Streaming Functional Programming Modelica Join .net Core Python 2.7 Apache Xquery For Loop Excel Database Deployment Gcc Prometheus X86 Ckeditor Azure Coding Style Pyspark Latex Ionic Framework Qt Pip Sql Server 2005 Microsoft Graph Api Emacs Influxdb Elixir Applescript Netlogo Telerik Tensorflow Sap Parallel Processing Ios7 Twig Merge Asp.net Air Flash Tags Build Drools Mongodb Apache Camel Google Analytics Youtube Install4j Telegram Nestjs Configuration Sapui5 Pycharm Jquery Mobile Google Cloud Dataflow Odoo Image Pine Script Report C++ Cli Log4net Jersey Eclipse Rcp Jpa Scikit Learn Windows 7 Apache Zookeeper Entity Framework 4 Tcp Tableau Api Matlab Office Js Bootstrap 4 Virtual Machine Discord.py Binding Visual Studio 2015 Xamarin.forms Routing Dll Llvm Lotus Notes Mysql Ip Protractor Gps Sparql Sql Server 2012 Rdf EmptyTag Api Directory Facebook Graph Api Date Zend Framework Linq Collections Playframework Web Crawler Asp.net Web Api Ada Google Sheets Three.js Windbg Facebook Dialogflow Es Azure Devops Ocaml Grafana Express Calendar Class

Copyright © 2024. All Rights Reserved by - Fatal编程技术网