Mongodb Mongdb hadoop集成，加快数据处理速度_Mongodb_Hadoop - Fatal编程技术网

Mongodb Mongdb hadoop集成，加快数据处理速度

mongodb hadoop

Mongodb Mongdb hadoop集成，加快数据处理速度,mongodb,hadoop,Mongodb,Hadoop,Mongodb可以与hadoop集成以实现更快的数据处理，但在集成过程中（Mongodb->hadoop），数据会从Mongodb传输到hadoop。问题是 1.从mongodb到hadoop的数据传输成本是否比mongodb中的实际数据处理成本更高 2.数据传输（MongoDB->Hadoop）是一次性活动吗？如果是，以后对MongoDB的更新将如何反映在Hadoop中。为了满足“单一真实来源”原则，您应该尽量不“复制”数据，也不应该在HDFS中保留冗余数据为了避免Mongo Hadoop

Mongodb可以与hadoop集成以实现更快的数据处理，但在集成过程中（Mongodb->hadoop），数据会从Mongodb传输到hadoop。问题是

1.从mongodb到hadoop的数据传输成本是否比mongodb中的实际数据处理成本更高

2.数据传输（MongoDB->Hadoop）是一次性活动吗？如果是，以后对MongoDB的更新将如何反映在Hadoop中。

为了满足“单一真实来源”原则，您应该尽量不“复制”数据，也不应该在HDFS中保留冗余数据

为了避免Mongo Hadoop连接器允许您直接查询Mongodb而不是本地HDFS。当然，这有一个缺点，即生产数据库的负载更大。另一种方法是查询mongodb bson转储
回答您的问题：
至1: 如果Hadoop节点“靠近”mongo节点，则开销不会太大。当您使用Hadoops map reduce时，它使您能够使用更多功能，如HIVE、PIG等。。。您不能在Mongos Map Reduce上使用它。它还允许您根据需要扩展“计算能力”，而无需接触数据库（将使用所有hadoop节点。在MongoDB上，您需要注意切分键）
至2: 你一遍又一遍地做。（您应该使用capped集合，并且配置了一个流来处理它。但我猜您没有使用这些集合）
您应该阅读《大数据》一书中关于
Lambda体系结构的内容。它们很好地定义了为什么要合并smth。就像MongoDB和Hadoop一样。谢谢您的详细解释。现在我很清楚，我们需要将数据推送到Hadoop进行处理。你能给我几个我们应该进行这种处理的场景吗（Hadoop->MongoDB集成）

[hadoop]相关文章推荐

Hadoop生态系统-在我的scenrio中使用什么技术工具组合？（内载详情） hadoop hbase hive apache-pig

Hadoop 限制每个数据节点的非dfs使用 hadoop

Hadoop 动物园管理员的问题 hadoop hbase apache-zookeeper

Hadoop Teradata的HDFS hadoop teradata

Hadoop 如何从命令行运行Spark java程序 hadoop apache-spark

使用SQOOP和FLUME将数据从RDBMS移动到Hadoop hadoop

Hadoop 将数据从配置单元加载到MySQL时发生Sqoop错误 hadoop hive

Hadoop 如何在talend open studio for Big data中解决tHDFS组件问题 hadoop talend

Hadoop hive如何运行mapreduce算法？ hadoop mapreduce hive

Hadoop 色调查询结果-过期 hadoop hive

Hadoop 从猪的总和中获得最大值 hadoop apache-pig

Hadoop 如何使用sqlContext加载多个拼花文件？ hadoop apache-spark

Hadoop 从hiveql中逃逸美元符号 hadoop hive

Hadoop 不应该'；在包安装过程中是否配置Oozie/Sqoop jar位置？ hadoop

如何在partitioner hadoop中使用分布式缓存？ hadoop mapreduce

Hadoop矩阵乘法输入序列文件 hadoop matrix parallel-processing

Hadoop 如何在Oozie工作流中选择文件？ hadoop

Hadoop FsImage中DSQUOTA和NSQUOTA列的含义是什么？ hadoop

Hadoop 添加Presto作为Grafana的数据源 hadoop grafana

Hadoop 当节点暂时从网络断开连接时，纱线中的应用程序/容器会发生什么情况 hadoop networking

随机文章推荐

Kentico-获取/格式化日期时间 kentico

在Kentico 10中集成html模板 kentico

Kentico 从上载的文件填充文档名称和标题 kentico

Kentico 页面类型不'；我没有出现 kentico

等待批准选项卡在Kentico 10中不显示禁用用户 kentico

[mongodb]相关推荐

MongoDB中跨集合的索引
Mongodb

在我的MongoDB用户模型中添加另一个嵌入文档会影响没有这些嵌入文档的旧数据吗？
Mongodb

mongodb中如何更新数组的子数组字段
Mongodb Meteor

Mongodb 值不为null的Mongoose查询
Mongodb Mongoose

Mongodb 没有可用的隐式视图
Mongodb Scala

无法在windows上部署MongoDB副本集？
Mongodb

Mongodb 如何在ReactiveMongo模型中表示GeoJSON点？
Mongodb Scala Playframework

Mongodb Pymongo回声'；死亡'；并终止中等规模查询上的查询
Mongodb Amazon Web Services Amazon Ec2

如何在MongoDb中查找某些字段不为空的文档
Mongodb Nosql

Mongodb PHP：检索状态为未读的消息记录的查询是什么
Mongodb

Mongodb 实时社交游戏排行榜的正确数据库技术
Mongodb Database

Mongodb mongorestore使用-drop选项删除集合
Mongodb

Mongodb 在Mongo Java Driver 2.13.0中，如何使用给定的用户名和密码对任何数据库进行身份验证？
Mongodb Authentication

使用limit时，使用MongoDB获取文档总数
Mongodb Pagination

MongoDB权限：限制对两个数据库的访问
Mongodb Permissions

MongoDB：记录计数高时发出警报
Mongodb

Mongodb 在mongoose中使用数字而不是字符串作为枚举模式是否更好？
Mongodb Mongoose

什么'；给定mongodb查询的正确语法是什么？
Mongodb Nosql

仅检索MongoDB集合中对象数组中的查询元素
Mongodb

如何基于地理位置查找所有mongoDB文档
Mongodb Reactjs React Native

Mongodb 未读标志未使用Mongoose更新
Mongodb Express Mongoose

如何删除mongodb中名称之间有空格的集合，即&x27；哥印拜陀快车'；？
Mongodb

带有Spring数据的MongoDB-来自驱动程序的重复查询
Mongodb

Mongodb 如何基于唯一的名称从现有集合创建集合，例如：“收藏”；特质：/名字/
Mongodb

Mongodb 无法在本地主机上创建分片mongo db
Mongodb

更改MongoDB Compass上的报告样本大小
Mongodb

查询以获取MongoDB中特定键的值
Mongodb Collections Nosql

Mongodb 什么'；在golang使用global mongo（mgo）数据库的缺点是什么？
Mongodb Go

从现有字符串字段派生新的int字段-MongoDB
Mongodb

Hangfire.MongoDB异常：无法创建字段'；延续'；在元素{Parameters:[…]}'；
Mongodb

Tags

Cloud Foundry Visual Studio 2010 Pagination .net 4.0 Gstreamer Scala .htaccess Uiview Gremlin Playframework Networking Nativescript Reference Smalltalk Kubernetes Asynchronous Facebook Graph Api Sharepoint 2010 Tfs Composer Php Snmp Installation Gridview Google Apps Script Curl Javascript Calendar Sails.js Jvm Llvm Apache2 Visual C++ Deep Learning Hibernate Smtp Jwt Url Process Java 8 Ibm Cloud Google Cloud Dataflow Azure Devops Mediawiki Office365 Jsp Asp.net Core Grid Spring Mvc Bison User Interface Vim Datetime Keyboard Android Ndk Antlr4 Phantomjs Usb Data Binding Log4net Paypal X86 Ecmascript 6 Appium Outlook Jqgrid Openlayers 3 Image Processing Import Dart Mapbox Tableau Api Liferay Mdx If Statement Gps Sqlite Mysql Dynamic Maven 2 Applescript Terraform Razor Swiftui Binding Julia Itext Windows 7 Apache Camel Microsoft Graph Api Exchange Server Operating System Azure Active Directory Scroll Swing Windows Phone 8.1 Discord Windows 8 Opencl Sencha Touch 2 Oauth 2.0 Continuous Integration Lambda Internationalization Google Cloud Platform Web Kentico Wpf Cloud Phpstorm Ember.js Linq Vb6 Passwords Jenkins Sublimetext3 Ssrs 2008 Localization Cordova Windows Phone Gatsby Module Visual Studio 2012 Gruntjs Angular Material Ruby On Rails 3.1 Jquery Mobile Github Navigation Lisp Cors Debian Wolfram Mathematica Actionscript Xcode4 Scrapy Sql Server Sip Timer Mvvm Iphone Ignite Facebook Colors Drools Database Design Opencv Amazon Redshift Redux Gulp Ruby Opengl Url Rewriting Notifications Debugging Object Express Odata Push Notification Twitter Shiny Protractor Arm Shopify Linker Keras Monitoring Crystal Reports Ibm Mq Ftp Svn Azure Functions Clojure Aframe Robotframework Automated Tests Docusignapi Hadoop Api Plsql Fluent Nhibernate Graphql Internet Explorer 8 Vector Telegram Typescript Dynamics Crm Speech Recognition Winapi Neo4j Wcf Tinymce Laravel 4 Optimization Antlr Bootstrap 4 System Verilog Sql Server 2008 R2 Spring Security Seo Emacs Parsing

Copyright © 2024. All Rights Reserved by - Fatal编程技术网