Apache spark 将Spark SQL批处理源转换为结构化流接收器_Apache Spark_Apache Spark Sql_Spark Structured Streaming - Fatal编程技术网

Apache spark 将Spark SQL批处理源转换为结构化流接收器

apache-spark

Apache spark 将Spark SQL批处理源转换为结构化流接收器,apache-spark,apache-spark-sql,spark-structured-streaming,Apache Spark,Apache Spark Sql,Spark Structured Streaming,试图将org.apache.spark.sql.sources.createablerelationprovider转换为org.apache.spark.sql.execution.streaming.Sink，只需实现调用createRelation（…）的addBatch（…），但createRelation（…）中有一个df.rdd，这将导致以下错误： org.apache.spark.sql.catalyst.analysis.UnsupportedOperationChecker$.

试图将

org.apache.spark.sql.sources.createablerelationprovider

转换为

org.apache.spark.sql.execution.streaming.Sink

，只需实现调用

createRelation（…）

的

addBatch（…）

，但

createRelation（…）

中有一个

df.rdd

，这将导致以下错误：

org.apache.spark.sql.catalyst.analysis.UnsupportedOperationChecker$.org$apache$spark$sql$catalyst$analysis$UnsupportedOperationChecker$$throwError(UnsupportedOperationChecker.scala:374)

我们试图研究在流作业中如何从dataframe获取Rdd的

org.apache.spark.sql.execution.streaming.FileStreamSink

，它似乎在使用

df.queryExecution.executePlan.execute（）

生成Rdd，而不是调用

.Rdd

然而事情似乎并不是那么简单：

似乎需要注意输出顺序-

可能是一些迫不及待的执行问题？（不确定）

我遇到的问题的更多细节可以找到

想知道进行这种转换的惯用方法是什么吗？

Dataset.rdd（）

创建了一个新的计划，它打破了增量计划。由于StreamExecution使用现有计划收集指标并更新水印，因此我们不应创建新计划。否则，度量和水印将在新计划中更新，StreamExecution无法检索它们

下面是Scala中用于在结构化流媒体中转换列值的代码示例：

val convertedRows:RDD[Row]=df.queryExecution.toRdd.mapPartitions{iter:Iterator[InternalRow]=>
iter.map{row=>
val convertedValues:Array[Any]=新数组（conversionFunctions.length）
变量i=0
while（i




[cmd]相关文章推荐



                                                        
Cmd 如何在控制台中流畅地绘制我的简单2D游戏世界？
cmd 
CMD和windows ID
cmd 
Cmd 批处理文件中的双分号
cmdpath 
Cmd 删除file.txt中的所有双引号
cmd 
Cmd 'DR'只考虑长文件名
cmd 
Cmd 在控制台中使用cat/etc/hosts找不到广播地址
cmd 
Cmd 在静默模式和特定目录下安装带有msiexec的msi
cmdwindows-installer 
如何在ssh中执行cmd或sh文件
cmd 
Cmd 无声命令网络停止
cmd 
如何从cmd读取视频文件的长度
cmd 
CMD-从输入中删除文本
cmd 
Cmd ''；无法识别为windows 10的内部或外部命令
cmd 
Windows CMD-如何在Start中传递两个命令
cmd 
Cmd RDP并使用命令行在远程windows计算机上运行命令
cmd 
如何使用CMD/WMIC获得准确的CPU温度？
cmd 
Cmd 如何在Windows 10命令提示符下将*字符作为命令行参数传递？
cmdwindows-10 
在Windows cmd提示符下写入*nix命令
cmd 
从cmd到IBM服务器（db2）执行.sql文件
cmddb2 
                                       





随机文章推荐



                                                        
Events 服务级别中的Grails域类事件列表器
eventsgrails 
Events 在Drupal站点中注册
eventsdrupaldrupal-6module 
Events Swing以编程方式发送事件
eventsswing 
Events 如何使用Facebook Graph API为用户列出事件邀请和拒绝事件
eventsfacebook-graph-api 
Events 收集时触发模型的主干事件（双重触发）
eventsbackbone.jscoffeescript 
Events jQuery更改事件未从键盘触发？
eventsdomjquery 
Events 如何将一个事件传播给孩子们
eventsjavafx-2 
Events Datagrid事件在标题栏内不工作
eventsdojo 
Events 通过“CloudBlockBlob”类监控上传/下载进度？
events 
Events 当控制器/$scope被销毁时，如何解除外部事件的绑定？
eventsangularjs 
Events Rubymotion：如何为NSView定义mouseDown事件？
events 
Events PyQt应用程序加载完成事件
events 
Events 具有多个发件人的事件
eventsdesign-patterns 
Events Windows的OpenLayers 2触摸事件
eventsopenlayers 
Events OpenLayers 3捕获加载的平铺事件
eventsopenlayersgisopenlayers-3 
Events Vaadin：如何避免字段之间的级联valuechange事件
eventsrecursionvaadin 
Events 检测窗口关闭OCaml图形
eventsocaml 
Events ZF2从事件管理器中删除匿名函数
eventszend-framework2 
Events 读取击键并放入文本框
eventstkinter 
Events CQRS+；ES：与聚合无关的命令/事件，但对投影很重要
eventsdomain-driven-design


                                        

                                        
                                        


                                                
                                                        [apache spark]相关推荐
                                                        
Apache spark 使用Oozie（带色调）在纱线上运行Spark应用程序的正确方法是什么？
									Apache Spark
							 
Apache spark Spark：加入数据帧
									Apache Spark
							 									Dataframe
							 
Apache spark pyspark在每行打印一个项目
									Apache Spark
							 									Pyspark
							 
Apache spark 日志来找出为什么我的火花工作被纱线扼杀
									Apache Spark
							 
使用Apache Spark在ElasticSearch中索引数据
									Apache Spark
							 
Apache spark 火花执行器配置
									Apache Spark
							 
Apache spark Spark：在本地测试内存使用情况
									Apache Spark
							 									Amazon Ec2
							 
Apache spark 打开火花壳时出现问题
									Apache Spark
							 
Apache spark spark highcharts导出到文件（png或pdf）
									Apache Spark
							 									Highcharts
							 
Apache spark Windows（Spyder）：如何使用pyspark读取csv文件
									Apache Spark
							 									Pyspark
							 
Apache spark 齐柏林飞艇：如何在PYTHONPATH中添加python文件
									Apache Spark
							 
Apache spark 当我使用spark streaming将消息写入kafka主题时，它只是写入一个分区
									Apache Spark
							 									Apache Kafka
							 
Apache spark 为什么Spark每个执行器只使用一个内核？它如何决定使用除分区数以外的核心？
									Apache Spark
							 
Apache spark 卡夫卡流媒体读取第一批中的所有数据
									Apache Spark
							 
Apache spark 确定日期和时间
									Apache Spark
							 									Pyspark
							 
Apache spark pyspark rdd映射未调用函数
									Apache Spark
							 									Hadoop
							 									Pyspark
							 
Apache spark spark sql中的有状态UDF，或者如何在spark sql中获得mapPartitions性能优势？
									Apache Spark
							 									Optimization
							 									Pyspark
							 
Apache spark Spark结构化流媒体中是否有与reduceByKeyAndWindow等价的内容？
									Apache Spark
							 
Apache spark 从多列数据帧批量写入Kafka主题
									Apache Spark
							 									Apache Kafka
							 
Apache spark 将spark版本升级到2.4.3:java.lang.ClassNotFoundException:org.apache.hadoop.fs.StorageStatistics
									Apache Spark
							 
Apache spark 如何从QlikView连接到Databricks增量表？
									Apache Spark
							 
Apache spark 在加入之前，spark是否检查空数据集？
									Apache Spark
							 
Apache spark 如何将流式查询结果写入多个数据库表？
									Apache Spark
							 
Apache spark pyspark-在rdd.map（…）中实现帮助程序
									Apache Spark
							 									Pyspark
							 
Apache spark ApacheSpark——当内存不足时，Spark如何从源代码读取大分区
									Apache Spark
							 
Apache spark spark submit与hive shell中的查询性能
									Apache Spark
							 									Pyspark
							 									Hive
							 									Amazon Dynamodb
							 
Apache spark 火花拼花模式演变
									Apache Spark
							 
Apache spark 如何使用java编写分隔为文本文件的spark dataframe选项卡
									Apache Spark
							 
Apache spark java.lang.SecurityException：管理员已禁止在此群集上运行Scala UDF
									Apache Spark
							 									Pyspark
							 
Apache spark 从拼花地板读取的速度比csv-pyspark慢
									Apache Spark
							 									Pyspark
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Select
Pycharm
Plot
Ruby On Rails 3
Codeigniter
Lambda
C#
Mariadb
Symfony
Google Plus
Internet Explorer 8
Apache Zookeeper
Libgdx
Usb
Reactjs
Phpmyadmin
Netty
Perforce
Debian
Ibm Mobilefirst
Jquery Mobile
Nlp
Amazon Dynamodb
Web Applications
Triggers
Error Handling
Wix
Compiler Errors
Jersey
Entity Framework Core
Marklogic
Validation
Boost
Lotus Notes
Visual C++
Angular Material
Ios6
Titanium
Login
Http
Oracle10g
Ibm Mq
Less
Django Rest Framework
Hibernate
Ubuntu
Sonarqube
Adobe
Google Visualization
Ios5
Linq
Grep
X86
Windows 7
Amazon Ec2
Youtube Api
Qt
Image
Zurb Foundation
Notepad++
Apache Kafka
Joomla
Terraform
Kubernetes
Vagrant
Import
Compiler Construction
Graphics
Printing
Grafana
Z3
Apache Flex
Wolfram Mathematica
Shiny
Gatsby
Gtk
Asp.net Mvc 5
Xamarin.android
Github
Svn
Gradle
Maps
Sms
Pip
Project Management
Gis
Data Structures
Yaml
Documentation
Math
Heroku
Responsive Design
Nuget
Dojo
Dependencies
Django Models
Dependency Injection
Cassandra
Paypal
View
Sencha Touch
Reference
Shopify
Stanford Nlp
Date
Embedded
Graphql
Qt4
Checkbox
Vb.net
Tfs
Windows Store Apps
Keycloak
Mercurial
Visual Studio 2015
Netsuite
Openid
Jhipster
Android Fragments
Asynchronous
Azure Devops
Navigation
Php
Laravel 5
Facebook
Openstack
Quickbooks
User Interface
Git
Core Data
Sql Server 2005
Selenium Webdriver
File Upload
Safari
Mediawiki
Networking
Xpages
Ag Grid
Sphinx
Cocos2d X
Rx Java
Sublimetext3
Input
File
Magento2
Ada
.net
Outlook
Spring Security
Composer Php
Asp.net
Opencl
Oop
Operating System
Twitter
Orchardcms
Mvvm
Prolog
Gwt
Webgl
Openlayers 3
Formatting
Octave
Architecture
Actions On Google
Command Line
Silverlight
Google Sheets
Jboss
Aws Lambda
Websphere
Applescript
Camera
Windows Runtime
Jquery Ui
Sharepoint
Smtp
Amazon Cloudformation
Sockets
Monitoring
Vmware
Apache Spark
Office Js
Azure Functions
Forms
Variables
Redirect
Office365
Delphi
Electron
Visual Studio 2008
Kernel
Computer Science
Azure Active Directory
Air
Sas
Artificial Intelligence
Scikit Learn
Codenameone
Jquery
Sap


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网