Apache spark 卡夫卡的火花补偿管理_Apache Spark_Spark Structured Streaming_Spark Kafka Integration - Fatal编程技术网

Apache spark 卡夫卡的火花补偿管理

apache-spark

Apache spark 卡夫卡的火花补偿管理,apache-spark,spark-structured-streaming,spark-kafka-integration,Apache Spark,Spark Structured Streaming,Spark Kafka Integration,我正在使用Spark结构化流媒体（版本2.3.2）。我需要从卡夫卡集群中读取数据，然后写入Kerberized卡夫卡。在这里，我想在将记录写入Kerberized Kafka之后使用Kafka作为偏移量检查点问题: 我们可以使用Kafka作为检查点来管理偏移量，还是只需要使用HDFS/S3 请帮忙我们可以使用卡夫卡作为检查点来管理偏移量吗不，不能将偏移提交回源卡夫卡主题。这一点在官方文件中有详细描述或者我们只需要使用HDFS/S3吗是的，这必须是类似HDFS或S3的东西。Struct

我正在使用Spark结构化流媒体（版本2.3.2）。我需要从卡夫卡集群中读取数据，然后写入Kerberized卡夫卡。在这里，我想在将记录写入Kerberized Kafka之后使用Kafka作为偏移量检查点

问题:

我们可以使用Kafka作为检查点来管理偏移量，还是只需要使用HDFS/S3

请帮忙

我们可以使用卡夫卡作为检查点来管理偏移量吗

不，不能将偏移提交回源卡夫卡主题。这一点在官方文件中有详细描述

或者我们只需要使用HDFS/S3吗

是的，这必须是类似HDFS或S3的东西。StructuredStreaming编程指南的一节对此进行了解释：“此检查点位置必须是HDFS兼容文件系统中的路径，并且可以在启动查询时设置为DataStreamWriter中的选项。”
这是否回答了您的问题？在对接收器卡夫卡进行写入之后，我想在源卡夫卡中提交偏移量，在此之前我不想提交偏移量。您需要使用框架，而不是使用框架。正如@mike所说的那样。

[c++11]相关文章推荐

C++11 C++；11正则表达式不是多线程安全库？ c++11

C++11 应该在nullptr赋值上使用std:：move吗？ c++11

C++11 C++；11个与调试信息一起存储的属性？ c++11 compiler-construction

C++11 C++；11：Arcitecture的未定义符号我在C++中遇到了一个奇怪的问题（至少在我的眼里）。我创建了一个线程池类，在main函数中，我只将一个元素推送到任务队列。这给了我一个错误，说“未定义的符号”。注释掉特定行后，程序将编译 c++11

C++11 从多个第一个单词中删除元音 c++11

C++11 在C+中初始化向量时出现问题+； c++11 vector

C++11 我应该如何构造一个使用std:：shared\u ptr管理的实例？ c++11

C++11 释放智能指针中的内存 c++11 memory-management

C++11 使用std：：stoi和std：：stod与铿锵++；在窗户里 c++11

C++11 计算c+中的坐标点数量+； c++11 vector

C++11 如何使用元组和可变模板创建复杂类型 c++11

C++11 为什么隐式删除移动构造函数调用复制构造函数？ c++11

C++11 使用可变模板的标记投射元函数 c++11

C++11 从迭代器推断容器的类型（如果可能） c++11

C++11 为什么std：：map索引被关闭了1？ c++11

C++11 变量何时隐式初始化为C++；？ c++11

C++11 带ostream和打印功能的打印，带内部功能 c++11

C++11 如何更改元组中对象的值？ c++11

C++11 我想在Opencv C+中找到图像的主色+； c++11 colors

C++11 std:：async块，即使带有std:：launch:：async标志，这取决于返回的将来是被使用还是被忽略问题的描述 c++11

随机文章推荐

如何确定cron作业使用的带宽？ cron

非常简单的cron作业行 cron

如何在cron作业中运行TYPO3扩展？ cron typo3

&引用；无法打开输入文件"；crons错误 cron

使用crontab使用脚本执行Rails cron

在cron.sh中的cron作业条目之间执行延迟 cron

如何将cron作业设置为每3小时运行一次 cron

使用cron每秒运行一次spring计划任务（0 0/10***？） cron

解释如何在Hybris中创建Cron作业 cron hybris

Cron 克朗乔布开了两枪 cron

如何在特定时间范围内激活cron命令一次？ cron

Cron 2.5天 cron

如何在linux服务器上的cpanel中设置cakephp中的cron cron

旧Cron仍在运行-Ubuntu 14.04.3 LTS cron

为什么这个CRON任务没有运行Python程序Raspberry-Pi cron raspberry-pi

Cron APScheduler：在完成上一个作业后触发新作业 cron

计划作业的首选方式@Scheduled vs crontab cron

安排crontab每三个星期五执行一次脚本 cron

[apache spark]相关推荐

Apache spark 无法编写语句
Apache Spark

Apache spark 当我通过Cassandrar应用程序重新分区连接到Cassandra时，Spark挂起
Apache Spark Cassandra

Apache spark 为了运行SparkR，我是否需要在纱线集群中的每个工作节点中安装R？
Apache Spark

Apache spark spark提交执行器内存/批处理失败
Apache Spark

Apache spark SparkSQL— ；collect\u set和sort\u数组未正确排序整型列
Apache Spark Pyspark

Apache spark Pyspark-如何进行不区分大小写的数据帧连接？
Apache Spark Pyspark

Apache spark Spark MatrixFactoryModel在Recommends Products Forser调用时崩溃
Apache Spark

Apache spark spark广播变量的缺点是什么？
Apache Spark

Apache spark 如何使用RESTAPI请求applicationID
Apache Spark

Apache spark 如何使用相同的聚合DataFramefor e连接DataFrame
Apache Spark

Apache spark 没有分区的当前分配：<；主题划分>；在重新加入期间；在运行时期间添加新分区不起作用
Apache Spark Apache Kafka

Apache spark 如何在Pyspark中的循环中使用相同的spark上下文
Apache Spark Pyspark

Apache spark Kafka直接API批输入大小
Apache Spark

Apache spark 如何在Spark UDF中编写多个If语句
Apache Spark

Apache spark 在备用名称节点上访问spark作为kubernetics容器运行的UI
Apache Spark Kubernetes

Apache spark 获取PredictionIO应用程序中的总事件时出错
Apache Spark

Apache spark 修复spark结构化流中的检查点
Apache Spark

Apache spark 用于执行列更新的Spark map函数
Apache Spark

Apache spark 将Spark DateType字段索引为ElasticSearch中的日期
Apache Spark

Apache spark 通过Spark计算共享数据集
Apache Spark

Apache spark 在多个数组类型元素之间筛选数据
Apache Spark Pyspark

Apache spark 如何在pyspark中使用小写并删除原始列？
Apache Spark Pyspark

Apache spark Pyspark将列合并到键、值对列表中（无UDF）
Apache Spark Pyspark

Apache spark 为pyspark数据帧中的记录间隔指定一个常量值
Apache Spark Pyspark

Tags

Ms Access Sublimetext2 Select Utf 8 Modelica Design Patterns Postman Mapping Facebook Xamarin.ios Autohotkey Url Ruby Itext Dynamic Omnet++ Gwt Keyboard Emacs Rdf Graphics Ignite Google App Maker Pyspark Protractor Gridview Install4j Leaflet System Verilog Scroll Twilio Sql Server 2012 Doxygen Model Sas Fullcalendar Php Tsql Certificate Webpack Pytorch Azure Data Factory Automation Nativescript Wcf Pandas Symfony1 Air Dialogflow Es Spring Log4j Primefaces Node.js Visual Studio Code Symfony Drupal 7 Css Scikit Learn Google Maps Api 3 Soap Grails Asp.net Mvc Serialization Atom Editor Memory Management Mips Reference Odata Sql Server 2005 Eclipse Rcp Kendo Ui Excel Formula Variables Batch File Map Telegram Mpi Audio Struct Openlayers Sql Neural Network List Jquery Ui Mongoose Memory Leaks Networking Sequelize.js Xaml Printing Google Colaboratory Angular6 Nuget Jhipster Project Management Http Keycloak Requirejs Ruby On Rails 4 Search Sql Server 2008 Notifications Model View Controller Spring Integration Speech Recognition Phpstorm Dns Ipad Visual Studio 2017 Nestjs Network Programming Ipython Types Android Studio Microservices Influxdb Azure Cosmosdb Sml Sitecore Ssl Opencart Iis Visual C++ Tree Filesystems Security Ckeditor Teradata Animation Sockets Ffmpeg Nest Groovy Google Cloud Dataflow Ruby On Rails Akka Woocommerce Database Stata Erlang Oracle10g Neo4j Recursion Debugging Android Layout Discord.py Serial Port Discord.js Arrays Google Cloud Storage Gcc Isabelle Asp.net Lisp Anaconda Identityserver4 Loops React Native Centos Dataframe Jupyter Notebook Sass Opengl Domain Driven Design Macos Hazelcast Mariadb Parse Platform Flask Botframework Post Maven Hibernate Maven 2 Google Cloud Firestore Function C++ Amazon Redshift Google Drive Api Wpf Asp.net Web Api Crystal Reports Sbt Sprite Kit Web Swiftui Rally Class Jsp Google Apps Script Tcl Nsis Gruntjs Typo3 Libgdx Visual Studio 2012 Permissions Devexpress Jpa Parameters Encoding

Copyright © 2024. All Rights Reserved by - Fatal编程技术网