Mongodb Spark Streaming:foreachRDD更新我的mongo RDD_Mongodb_Apache Spark_Spark Streaming - Fatal编程技术网

Mongodb Spark Streaming:foreachRDD更新我的mongo RDD

mongodb apache-spark

Mongodb Spark Streaming:foreachRDD更新我的mongo RDD,mongodb,apache-spark,spark-streaming,Mongodb,Apache Spark,Spark Streaming,每次在foreachRDD中输入时，我都想创建一个新的mongodb RDD。但是，我有序列化问题： mydstream .foreachRDD(rdd => { val mongoClient = MongoClient("localhost", 27017) val db = mongoClient(mongoDatabase) val coll = db(mongoCollection) // ssc is my Strea

每次在

foreachRDD

中输入时，我都想创建一个新的mongodb RDD。但是，我有序列化问题：

mydstream .foreachRDD(rdd => { val mongoClient = MongoClient("localhost", 27017) val db = mongoClient(mongoDatabase) val coll = db(mongoCollection) // ssc is my StreamingContext val modelsRDDRaw = ssc.sparkContext.parallelize(coll.find().toList) })
这将给我一个错误：

object not serializable (class: org.apache.spark.streaming.StreamingContext, value: org.apache.spark.streaming.StreamingContext@31133b6e)

有什么想法吗？
据我所知，如果您有一个“不可序列化”的对象，您需要将其通过
foreachPartition
传递，这样您就可以在运行处理之前连接到每个节点上的数据库

mydstream.foreachRDD(rdd => { rdd.foreachPartition{ val mongoClient = MongoClient("localhost", 27017) val db = mongoClient(mongoDatabase) val coll = db(mongoCollection) // ssc is my StreamingContext val modelsRDDRaw = ssc.sparkContext.parallelize(coll.find().toList) }})
您可以尝试使用返回SparkContext或SparkStreamingContext（如果rdd是数据流）的

实际上，RDD似乎还有一个
.sparkContext
方法。我真的不知道有什么区别，也许它们是别名（？）
您可以在rdd之前尝试在foreachRDD中创建ssc。foreachPartition
val ssc=StreamingContext.getOrCreate（checkpointdirectory，functionToCreateContext）
SparkContext
不可序列化，因此无法在任何转换或操作方法中使用，您必须仅在驱动程序类中使用。在foreachRDD方法中将列表转换为rdd有什么具体原因吗？
mydstream foreachRDD { rdd => { val mongoClient = MongoClient("localhost", 27017) val db = mongoClient(mongoDatabase) val coll = db(mongoCollection) val modelsRDDRaw = rdd.context.parallelize(coll.find().toList) })

[apache spark]相关文章推荐

Apache spark 在ApacheSpark的特征提取中需要一些输入吗 apache-spark

Apache spark 火花在纱线上的应用ID apache-spark

Apache spark Hive是否自动附带Apache Spark apache-spark

Apache spark spark流媒体应用程序-部署最佳实践 apache-spark

Apache spark 电子病历上的NiFi流到Spark apache-spark apache-nifi

Apache spark 为什么火花阶段'；当作为第一个操作运行时，执行器的计算时间比通常要长得多？ apache-spark

Apache spark 为什么AWS EMR上的Spark不'；不能从应用程序fat jar加载类？ apache-spark

Apache spark 如何在PySpark中按多列分组并在列表中收集？ apache-spark pyspark

Apache spark 无法将pyspark从2.2升级到2.3 apache-spark pyspark

Apache spark 更新基于Mllib数据帧的PySpark（2.2.0）中的机器学习模型 apache-spark machine-learning pyspark

Apache spark 在PySpark中创建配置单元架构 apache-spark hive pyspark

Apache spark Spark能否将单个RDD分区的一部分存储在内存中，另一部分存储在磁盘上？ apache-spark pyspark

Apache spark 所需的执行器内存高于此群集的最大阈值 apache-spark hadoop

Apache spark 将Ceph端点设置为DNS'；我不能在Hadoop中工作 apache-spark hadoop

Apache spark 子查询中具有多个值的Spark filter下推 apache-spark hive

Apache spark 通过Spark为各个字段执行多个正则表达式规则 apache-spark

Apache spark spark在RDD中创建的分区数大于数据大小 apache-spark

Apache spark FileNotFoundException的pyspark刷新表 apache-spark pyspark

Apache spark AWS Glue仅从Dynamo DB读取选定的记录 apache-spark pyspark amazon-dynamodb

Apache spark Hbase Hfiles位于AWS EMR（HDFS）群集的何处？ apache-spark hbase

随机文章推荐

Glassfish 严重：java.lang.NullPointerException glassfish

如何在glassfish中处理accept和production环境的配置 glassfish

Glassfish 使用不同版本的相同库 glassfish dependencies

Glassfish v2.1.1群集错误 glassfish

Glassfish 灰熊如何适应玻璃鱼？ glassfish

Glassfish asadmin-purgue消息队列命令和imqcmd命令之间的区别是什么 glassfish jms

Glassfish 格拉斯菲什说港口被占领了。但是netstat说没有进程使用端口80 glassfish xampp

Glassfish v4未记录log4j2语句 glassfish log4j

Glassfish 如何在同一条玻璃鱼中从不同的耳朵注射EJB glassfish

[mongodb]相关推荐

访问mongoDB集合中的阵列
Mongodb

MongoDB作为时间序列数据库
Mongodb

每日分组内的MongoDB聚合
Mongodb

我应该让mongodb以这种方式使用新硬盘吗？
Mongodb Ubuntu

MongoDb：如何为具有多个可搜索字段的数据创建正确的（复合）索引
Mongodb Indexing

使用MongoDB C#驱动程序对大型文档进行极慢的反序列化
Mongodb

Mongodb查询异常缓慢
Mongodb

Mongodb 查询具有不同子字段的文档
Mongodb

Mongodb 有没有办法根据特定字段的字节长度查询Mongo？
Mongodb

Mongodb 在spring集成中使用mongo入站适配器对数据进行分页
Mongodb Spring Integration

如何记录Spring Data MongoDB的操作？
Mongodb Log4j

为什么MongoDB的性能比MySQL慢？
Mongodb

如何在XAMPP mac（OSX）中安装MongoDB驱动程序
Mongodb Xampp

Mongodb 流星收集：在阵列中查找元素
Mongodb Meteor

使用MongoDB的DDD
Mongodb Domain Driven Design

如何通过使用ALPS/HATEOAS元数据的Spring Data MongoDB存储库向用户公开新的REST方法？
Mongodb

Mongodb E11000重复键错误索引-Grails afterInsert（）方法
Mongodb Grails

将TFD连接设置为MongoDB
Mongodb

Mongodb mongo addShard“；“未找到通用协议”；Errmg 126
Mongodb Docker Virtual Machine

Mongodb 如何快速处理数据？
Mongodb

筛选嵌套数组mongodb组日
Mongodb

Mongodb 猫鼬承诺链无法删除许多
Mongodb Mongoose

MongoDB文档中所有数组大小的总和
Mongodb

基于条件的MongoDB对象字段计数
Mongodb

如何在mongodb中打开集合
Mongodb

如何从Mongodb子文档中获取每个主文档的唯一总数
Mongodb Mongoose

Mongodb NodeJS mongoose传入一个id数组
Mongodb

Mongodb 找不到模块'；猫鼬'；即使安装了猫鼬
Mongodb Express Mongoose

Mongodb Spring中的Mongo变更流-开放连接问题
Mongodb Spring Boot

Mongodb Mongo DB-高cpu利用率和进程负载
Mongodb

Tags

Knockout.js Speech Recognition Google Calendar Api Xaml Asp.net Web Api Mapping Smalltalk Aurelia Primefaces Windows Installer Ansible Passwords Jsf Security Git Windows Phone 8.1 Reactjs Amazon Cloudformation Emacs Ms Word Youtube Api Axapta Drupal 6 Jwt Virtualbox Dll Doctrine Clojure Db2 Sap Influxdb Google Chrome Devtools Sublimetext2 Ckeditor Apache For Loop Asp.net Keyboard Facebook Graph Api Windows Phone Windows Runtime Gdb Csv Scrapy Text Less Inno Setup Grid Anaconda Responsive Design Logstash Java 8 Django Models Tomcat Maven 2 Amazon Redshift Geometry Active Directory Triggers Tridion Airflow Server Acumatica Microsoft Graph Api Installation Qml Variables Ravendb Pyspark Bison Streaming Configuration Android Ndk Ubuntu Uml Animation Modelica Linq Swift2 Objective C Webgl Linkedin Sencha Touch Jasmine Firebase Rust Combobox Orchardcms Url Routes Date Video Streaming C# Office Js Listview Pointers Mapreduce Asp.net Mvc 3 Nhibernate Smtp Abap Visual Studio Merge Xsd Instagram Amazon Web Services Oracle10g Nuget Regex Cocos2d X Android Layout Ibm Midrange Automated Tests Xampp Templates Mdx Printing Math Markdown Cryptography Laravel Ignite Charts Vagrant Cygwin Powershell Websocket Twitter Wpf Artifactory Prolog Swift Ssis Visual Studio 2010 Search Sitecore Sas Time Complexity Google Bigquery Pandas Common Lisp Wso2 Jaxb Hyperledger Fabric Http C++11 Azure Active Directory Dictionary Plsql Kendo Ui Leaflet Webview Google Maps Api 3 Nservicebus Session Mobile Apache Kafka Web Services Login Debian Akka Octave Windows 8 Eclipse Plugin Antlr4 Sharepoint 2010 Resharper Pine Script Windows 10 Sed Bootstrap 4 Biztalk Pagination Gnuplot Matlab Google Apps Script Sqlite Blockchain Nlp Sass E Commerce Oracle Apex Coffeescript Android Studio Notepad++ Couchdb Centos Silverstripe Nestjs Latex Android Python Sphinx Dom EmptyTag Ssl Arrays Visual Studio 2012 Fullcalendar Selenium Webdriver Entity Framework Jupyter Notebook

Copyright © 2024. All Rights Reserved by - Fatal编程技术网