配置单元查询与Hadoop提供的MapReducer数量之间的关系？_Hadoop_Mapreduce_Hive - Fatal编程技术网

配置单元查询与Hadoop提供的MapReducer数量之间的关系？

hadoop mapreduce hive

配置单元查询与Hadoop提供的MapReducer数量之间的关系？,hadoop,mapreduce,hive,Hadoop,Mapreduce,Hive,我正在配置单元外壳中执行一个查询 SELECT tradeId, bookid, foid from trades where bookid='"ABCDEFG"' 表“交易”在bookid上有索引。查询运行时，将显示映射器和还原器的详细信息，如下所示：- Number of reduce tasks is set to 0 since there's no reduce operator Hadoop job information for Stage-1: number of mapper

我正在配置单元外壳中执行一个查询

SELECT tradeId, bookid, foid from trades where bookid='"ABCDEFG"'

表“交易”在bookid上有索引。查询运行时，将显示映射器和还原器的详细信息，如下所示：-

Number of reduce tasks is set to 0 since there's no reduce operator Hadoop job information for Stage-1: number of mappers: 48; number of reducers: 0 Time taken: **606.183 seconds**, Fetched: **18 row(s)**
如果你看到它花了大量的时间来获取仅仅18行。我的问题是我做错了什么？重现期是否应为非零？如果我使用

set mapred.reduce.tasks = some_number

索引是否有助于更快地检索数据？
当您执行简单选择时，所有筛选操作和列选择都由映射程序自己完成。这里并没有减速器任务的用途，所以减速器的数量是零——这很好。您的表中可能有大约48*块大小的数据量，因此产生了48个映射器。每个DN有多少个映射槽，在您启动查询时有多少个是空闲的？很有可能所有的48个都不是并行运行的。虽然它只返回了18行，但它读取了整个表。您的表是否在bookid列上进行了扣合和聚集-在这种情况下，您可以使用
TABLESAMPLE
子句使其只读包含ABCDEFG值的存储桶。
如果您可以提供一些关于集群的附加信息，可能会有所帮助。您正在使用多少工作节点？Hadoop/Hive的哪个发行版/版本？另外，查看在查询上运行解释的输出，如
EXPLAIN SELECT tradeId，bookid，foid from trade，其中bookid=''ABCDEFG'
。使用6个节点，配置单元版本为0.12（基于Hive-hwi-0.12.0-cdh5.0.jar），Hadoop版本为2.3（基于Hadoop 2.3.0-cdh5.0.0）

[mapreduce]相关文章推荐

Mapreduce 如何在CouchBase上实现多租户？它能表演吗？ mapreduce couchdb couchbase

MapReduce相关-我在这里做错了什么？ mapreduce

Mapreduce 使用map reduce（Couchbase）编写一个简单的group by mapreduce nosql couchbase

Mapreduce 映射减少键、值对 mapreduce

运行MapReduce作业时获取应用程序ID mapreduce

Mapreduce Hadoop V2：关闭洗牌/排序？ mapreduce

Mapreduce 分布式系统中数据包的不均匀分布 mapreduce java-8

使用AWS Elastic MapReduce EMR的MapReduce作业-为什么648 MB的输入被拆分为27个映射任务？ mapreduce

随机文章推荐

如何在phpstorm中使用phalcon开发工具\ide\phpstorm？ phpstorm

在phpstorm中识别没有扩展名的bash文件 phpstorm

从PhpStorm和SourceTree恢复删除的文件 phpstorm webstorm

如何告诉PhpStorm/WebStorm包含的文件所在的位置？ phpstorm webstorm

在PhpStorm中设置自定义颜色 phpstorm

Phpstorm 新计算机上没有插入符号的文件 phpstorm

PhpStorm 2016.3：项目文件的字母顺序是否更改？ phpstorm

PhpStorm上没有默认提交消息 phpstorm

PhpStorm Codeception运行参数 phpstorm

PhpStorm以错误格式打开文件 phpstorm

PhpStorm从刀片服务器导航到已编译的视图文件 phpstorm

[hadoop]相关推荐

Hadoop 在另一个框架上执行Pig
Hadoop Apache Pig

没有hadoop但有其他MR实现的mahout
Hadoop

“映射中键的类型不匹配：预期org.apache.hadoop.io.IntWritable，receiveorg.apache.hadoop.io.LongWritable”-一切看起来都是正确的
Hadoop

Hadoop上的获取失败太多
Hadoop Apache Pig

如何查看特定hadoop任务的输入记录？
Hadoop

Hadoop 如何从mapreduce作业获得响应？
Hadoop Mapreduce

Hadoop 影响长途网络最终一致性的因素有哪些？
Hadoop Nosql Amazon Dynamodb

Hadoop 带MapReduce的HBase
Hadoop Hbase

Hadoop STRSPLIT和REGEX_EXTRACT_均使用PigLatin
Hadoop Apache Pig

Hadoop map reduce：分组时记录的顺序
Hadoop Mapreduce

Hadoop sqoop导入大量空行
Hadoop Hive

Hadoop与超级计算机
Hadoop

Hadoop 用于处理原始数据的PIG脚本
Hadoop Apache Pig

Hadoop &引用；无法获取输入拆分"；错误，使用配置单元Cassandra CqlStorageHandler
Hadoop Cassandra Hive

hadoop单节点设置后运行第一个程序
Hadoop Cluster Computing

Hadoop机架感知配置
Hadoop Mapreduce

hadoop命令的源代码
Hadoop

Hadoop 拼花地板下推
Hadoop Apache Spark

Hadoop容量调度器-使用默认队列
Hadoop

Hadoop 什么'；当在HDFS中遇到大量文件时，实际理想的NameNode内存大小是多少
Hadoop

Hadoop 如何删除纱线日志
Hadoop

Hadoop 将HDFS文件映射到外部驱动器时出错
Hadoop

Hadoop Namenode HA和HDFS federation之间的区别是什么
Hadoop

Hadoop 纱线错误：无法在任何配置的本地目录中初始化应用程序日志目录
Hadoop Configuration

Hadoop 创建配置单元外部表时出错
Hadoop Hive

Hadoop 如何在生成拼花地板文件时查找拼花地板文件上使用的压缩编码解码器？
Hadoop

如何在Hadoop中使用自定义类型
Hadoop

配置单元cli启动引发错误无法识别的Hadoop主要版本号：1.0.4
Hadoop Hive

Hadoop Cloudera Apache impala查询：超出内存限制：无法分配行批处理交换\u节点？
Hadoop

Hadoop 启动hbase时出现java.lang.UnsatisfiedLinkError错误
Hadoop Hbase Apache Zookeeper

Tags

Java Me Mapping Qml Cron Keyboard Session Vagrant Command Line Next.js String Sql Server 2012 Scrapy Routes List Grid Rx Java Scroll Mule Compression Delphi Erlang Coldfusion Ada Wso2 Codenameone Redux Joomla Actionscript 3 Core Data Botframework Processing Google Cloud Storage Cocos2d X Email Svg Aws Lambda Windows Phone 8 Jsp Kibana Network Programming Twig Ionic2 Reference Oracle Webview Caching Google Plus Chart.js Listview Join Google Colaboratory Perforce Web Services Ssas Jboss Umbraco Cocoa Design Patterns Amazon S3 Linker Syntax Asp.net Mvc 5 Akka Influxdb Tcl Elixir Time Complexity Datetime Javafx 2 Orchardcms Dynamics Crm Actionscript Smtp Webpack Windows Phone 7 Sql Debugging Autohotkey Continuous Integration Dialogflow Es Login Typo3 Woocommerce Android Gitlab Math Xpages Windows Mobile Axapta Colors Ldap Npm Notifications Libgdx Css Pagination Wcf Geometry Mpi Functional Programming Xcode4 Ajax File Salesforce Discord.py Racket Cobol Nativescript Smalltalk D Xamarin.android Https Dotnetnuke Solr Deployment Safari Plsql Jekyll Ruby On Rails 3.2 Neural Network Sails.js Terraform Responsive Design Leaflet Dictionary Excel Formula Function Oop Apache Pig Mdx Log4j Memory Artifactory Airflow Python 2.7 Windows Phone Jmeter Mfc Tags Batch File Phantomjs Parsing Browser Tree Azure Active Directory Database File Upload Sitecore Merge Weblogic Express .net 4.0 Firefox Addon Statistics Powerbi Docker Isabelle Nginx Unit Testing Sequelize.js Keycloak Model View Controller Kubernetes View Terminal Drupal Random Common Lisp Version Control Highcharts Windows Store Apps Vb6 Cluster Computing Hyperlink Input Lucene Linux Kernel Stream Antlr Macros Excel Jsf Firefox Razor Swing Exception Moodle Artificial Intelligence Nunit Servlets Dns Spotify Oracle10g Xaml Google Apps Script Usb Canvas Mongodb Awk Objective C Qt4

Copyright © 2024. All Rights Reserved by - Fatal编程技术网