Apache spark 为流式查询创建Kafka接收器和将批处理查询的输出写入Kafka之间的区别_Apache Spark_Apache Kafka - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/apache-kafka/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark 为流式查询创建Kafka接收器和将批处理查询的输出写入Kafka之间的区别_Apache Spark_Apache Kafka - Fatal编程技术网

Apache spark 为流式查询创建Kafka接收器和将批处理查询的输出写入Kafka之间的区别

apache-spark apache-kafka

Apache spark 为流式查询创建Kafka接收器和将批处理查询的输出写入Kafka之间的区别,apache-spark,apache-kafka,Apache Spark,Apache Kafka,在本文中，它给出了两个将数据从spark写入Kafka的场景，一个是为流式查询创建Kafka接收器，另一个是将批处理查询的输出写入Kafka。我想知道他们之间有什么不同在我的例子中，我们已经有了一个每天生成大量数据的spark批处理作业，我们正在寻找一个连接器解决方案，可以将这些数据接收到Kafka。该网页中这两个场景中的哪一个适合我们的案例谢谢 “每天进行一次spark批量作业，生成大量数据” 我想你是在自己提供答案。如果您有一个只运行一次的批处理数据帧（与连续运行的流式作业相比），那么您

在本文中，它给出了两个将数据从spark写入Kafka的场景，一个是

为流式查询创建Kafka接收器

，另一个是

将批处理查询的输出写入Kafka

。我想知道他们之间有什么不同

在我的例子中，我们已经有了一个每天生成大量数据的spark批处理作业，我们正在寻找一个连接器解决方案，可以将这些数据接收到Kafka。该网页中这两个场景中的哪一个适合我们的案例

谢谢

“每天进行一次spark批量作业，生成大量数据”
我想你是在自己提供答案。如果您有一个只运行一次的批处理数据帧（与连续运行的流式作业相比），那么您需要的就是批处理Kafka接收器
您还可以通过查看数据帧是如何创建的，通过
read
（批处理）或
readStrem
（流式处理）来指示这一点
如果您仍然不确定要选择哪一个，将在运行时通知您，因为无法在同一查询中混合批处理和流式处理。因此，反复试验也会让你找到解决方案

[apache kafka]相关文章推荐

随机文章推荐

在odata中扩展 odata

如何根据OData中子对象的某些属性对对象进行排序？ odata

Breeze.js：如何使用OData适配器存储实体关系 odata breeze

以数字作为筛选器访问OData时出错 odata sapui5

如何将OData$select功能添加到WebAPI odata

Odata 铸造列表<；对象>；进入NancyFx响应 odata

使用OData语法创建查询 odata asp.net-web-api

使用ODataService公开实体时出错 odata

当使用ASP.NET Web API 2.2时，如何使用依赖项注入器实例化传递给ODataController的后期操作方法的对象？ odata

OData库是否支持扩展源上的@OData.nextLink？ odata

Odata 如何在SmartTable中添加自定义列？ odata sapui5

OData V4更改不会反映在其他绑定中 odata sapui5

Odata 如何为类型为“的字段写入SELECT”；数量“；在SET\u GET\u实体方法中？ odata abap

oData不在子查询等效项中 odata

[apache spark]相关推荐

Apache spark 从worker访问SparkContext
Apache Spark

Apache spark 如何将RDD复制到多个RDD中？
Apache Spark Cassandra

Apache spark Spark电子邮件处理
Apache Spark Apache Kafka

Apache spark 创建spark上下文py4j.protocol.Py4JNetworkError时出错：尝试连接到Java服务器时出错
Apache Spark Cassandra Pyspark

Apache spark spark HiveContext无法识别配置单元表的字段分隔符
Apache Spark

Apache spark 使用cgroup进行Spark时介观的行为
Apache Spark

Apache spark 如何在Spark Streaming中并行映射键/值分区
Apache Spark Parallel Processing

Apache spark 在Pyspark HiveContext中，SQL偏移量的等效值是什么？
Apache Spark Hive Pyspark

Apache spark 使用Livy上传Python脚本
Apache Spark Pyspark

Apache spark 获取可用执行者的数量
Apache Spark

Apache spark 如何使用aws数据管道为spark应用程序正确设置google云存储
Apache Spark Google Cloud Storage

Apache spark 如何知道bin/run示例转换为什么？
Apache Spark

Apache spark Spark分区：从单节点群集上的本地文件系统加载文件
Apache Spark

Apache spark sparksql中的钨编码？
Apache Spark

Apache spark 在离线Spark群集中安装graphframes组件
Apache Spark

Apache spark 检查另一个数组中存在的数组的所有元素
Apache Spark Pyspark

Apache spark 如何在Spark Streaming中创建到数据源的连接以进行查找
Apache Spark Redis

Apache spark 第页上的内存、vCore和磁盘是什么？
Apache Spark Hadoop

Apache spark 如何从pyspark dataframe中选择特定列（包含特殊字符）的列表？
Apache Spark Pyspark

Apache spark 使用Dataproc上的Spark进行跨帐户GCS访问
Apache Spark Google Cloud Platform Google Bigquery Google Cloud Storage

Apache spark Spark SQL不支持以ISO 8601格式呈现指定时区（T或F？）的时间戳
Apache Spark Time

Apache spark 用于管理重新计算的批处理框架
Apache Spark Apache Flink Airflow

Apache spark 读取拼花地板时，read.optin有什么用途
Apache Spark Pyspark

Apache spark 如何将流式查询结果保存为PDF/XLSX（用于生成报告）？
Apache Spark

Apache spark 密集向量列到稀疏向量列
Apache Spark Pyspark

Apache spark 如何基于GroupBy列的值选择列，而不知道Spark中的任何特定值
Apache Spark

Apache spark sparksql连接多表设计
Apache Spark

Apache spark Spark将时间戳从CSV转换为拼花地板“本地时间”语义
Apache Spark

Apache spark 分解多列SparkSQL
Apache Spark

Apache spark 当不满足所有选择条件时，Spark将选择哪个联接？
Apache Spark Join

Tags

Ruby Robotframework Django Models Doctrine Orm Ios Unix Amazon S3 Loops Synchronization Reporting Services Editor Silverlight 4.0 Asynchronous Razor Mediawiki Gulp Url Twitter Tinymce Youtube Api Batch File Pip Streaming Generics Processing Postman Bison Drupal 6 Network Programming Macos Hibernate Graphviz Amazon Web Services Ssis Tabs Wix Subsonic Math Ubuntu Airflow Optimization Pytorch Cocos2d X Snowflake Cloud Data Platform Sqlite Activemq Django Rest Framework Google Cloud Platform Windows Phone 7 Time Complexity Assembly Cloud Foundry Three.js Awk Node.js Vector Odata Ssh Entity Framework Jsf Vue.js Akka Hybris Cryptography Facebook Graph Api Shiny Primefaces Ionic2 Tkinter Smalltalk Swift2 Plsql Puppet Ruby On Rails Deployment Ruby On Rails 4 Dynamics Crm 2011 Polymer Spring Security Android Emulator Stm32 Json Tcl Ruby On Rails 3 Algorithm Struts2 Localization Joomla Outlook Windows Mule Parameters Autocomplete Sencha Touch Hadoop Telerik Ibm Mobilefirst Coq Proxy Listview Dns Webgl Omnet++ Apache Zookeeper Eclipse Rcp Firefox Addon Azure Ad B2c C++ Language Agnostic Xpath Typo3 Tfs Debian Open Source Cmake Dotnetnuke Recursion Uitableview Opengl Es Xcode4 Cocos2d Iphone Netlogo Installation Cookies Terraform Pyspark Scrapy Openlayers Asp Classic Ip Search Prestashop Hazelcast Github Google Sheets Rspec Ecmascript 6 Merge Pagination Push Notification Ansible Electron Laravel 5 Log4j Google Apps Script Apache Camel Sass Ide Jersey Angular Smtp Qt4 Tree Kibana Flash Forms Symfony1 C# 4.0 Plugins Virtualbox Windows Phone 8.1 Log4net Certificate Asp.net Mvc Keycloak Windows Runtime List Kotlin Internationalization Geolocation Influxdb Ocaml Windows 7 Variables Google Maps Api 3 Discord.py Dependency Injection Jwt Graphics Couchdb Php Csv Filter Tcp Speech Recognition Fortran Jsp Ruby On Rails 3.2 Bots Teradata Curl Apache Pig Single Sign On Tsql Drools Shell Apache Kafka Google Calendar Api Reference Powerbi Performance

Copyright © 2024. All Rights Reserved by - Fatal编程技术网