在EC2上对Hadoop进行基准测试可以获得相同的性能_Hadoop_Amazon Ec2 - Fatal编程技术网

在EC2上对Hadoop进行基准测试可以获得相同的性能

hadoop amazon-ec2

在EC2上对Hadoop进行基准测试可以获得相同的性能,hadoop,amazon-ec2,Hadoop,Amazon Ec2,我正在尝试对EC2上的Hadoop进行基准测试。我使用的是一个1GB的文件，有1个主文件和5个从文件。当我改变dfs.blocksize的1m、64m、128m、500m等。但令我惊讶的是，无论区块大小，所花费的时间或多或少都在同一范围内。我是如何实现这一惊人的表现的？首先要考虑一些最可能的解释检查是否正确地传入系统变量以控制作业的拆分大小，如果不更改此项，则不会更改映射器的数量（可以在jobtracker UI中进行检查）。如果你每次都得到相同数量的地图绘制者，你实际上什么都没有改变。要更

我正在尝试对

EC2

上的

Hadoop

进行基准测试。我使用的是一个1GB的文件，有1个主文件和5个从文件。当我改变dfs.blocksize的

1m、64m、128m、500m等。但令我惊讶的是，无论区块大小，所花费的时间或多或少都在同一范围内。我是如何实现这一惊人的表现的？
首先要考虑一些最可能的解释

检查是否正确地传入系统变量以控制作业的拆分大小，如果不更改此项，则不会更改映射器的数量（可以在jobtracker UI中进行检查）。如果你每次都得到相同数量的地图绘制者，你实际上什么都没有改变。要更改拆分大小，请使用系统道具mapred.min.split.size
和mapred.max.split.size
请确保您确实在访问集群，并且没有意外地使用1个进程在本地运行
请注意（与Spark不同），Hadoop的作业初始化时间非常长。IME大约是20秒，因此对于只有1GB的数据，您实际上看不到太多的时间差，因为大部分作业都花在初始化上
您的基准测试是什么？您能告诉我该地产应该放在哪个文件中吗？因为Hadoop 2x中不推荐使用mapred.min.split.size。现在没有mapred-site.xml。我使用-D设置，不使用文件。




[amazon ec2]相关文章推荐



                                                        
Amazon ec2 在硬件故障期间，基于EBS的EC2实例是否终止或停止？
amazon-ec2amazon-web-services 
Amazon ec2 FreeNX（nomachine）在克隆工作的ubuntu EC2实例后无法连接
amazon-ec2 
Amazon ec2 如何使用IAM用户帐户下载EC2 X.509证书？
amazon-ec2amazon-web-services 
Amazon ec2 是否仅允许CloudFront从源服务器读取？
amazon-ec2 
Amazon ec2 保留实例计费中的误解
amazon-ec2 
Amazon ec2 通过EC2中的iPXE引导
amazon-ec2 
Amazon ec2 ec2与其他帐户共享ami
amazon-ec2 
Amazon ec2 Amazon Linux AMI-升级OPenssh版本
amazon-ec2 
Amazon ec2 AmazonEC2实例重新启动后，没有chef命令工作
amazon-ec2chef-infra 
Amazon ec2 无法从ec2服务器连接
amazon-ec2 
Amazon ec2 谷歌域名与亚马逊'；s EC2
amazon-ec2dns 
Amazon ec2 什么'；Amazon EC2私钥（.pem）和秘密访问密钥之间的区别是什么？
amazon-ec2 
Amazon ec2 测试厨房几乎每次传输文件都会失败
amazon-ec2chef-infra 
Amazon ec2 错误'；can'；t连接到本地主机'；当我尝试在Boinc客户端（谷歌云或AWS）中添加项目时
amazon-ec2google-cloud-platform 
Amazon ec2 亚马逊ip无法与HTTPS连接
amazon-ec2 
Amazon ec2 Facebook登录不使用Amazon ELB和HTTP侦听器
amazon-ec2 
Amazon ec2 AWS EC2 Linux AMI上的Tomcat 8.5 SSL配置
amazon-ec2spring-securityjava-8 
Amazon ec2 使用AWS Glue连接AWS EC2实例上安装的MySQL
amazon-ec2 
Amazon ec2 将Cloudflare CNAME指向AWS ALB会导致错误522
amazon-ec2 
Amazon ec2 使用AWS CLI CloudWatch获取度量统计信息的指南
amazon-ec2 
                                       





随机文章推荐



                                                        
Binary 是2'；一个正数的补码表示法是同一个数吗？
binary 
Binary 有用的二进制差异工具（msdn[apatch和mpatch]、xdelta、bsdiff、vbindiff和winmerge除外）
binary 
Binary 将存储在Fortran 90二进制文件中的数据转换为人类可读的格式
binaryfortran 
Binary 2的补码数据表示法
binarycomputer-science 
Binary 在Verilog中把一个数字变成负数
binaryverilog 
Binary 用段解析逻辑位置
binary 
Binary 如何将bash文件转换为二进制可执行文件
binary 
Binary BMP文件中奇怪的十六进制数
binary 
Binary 乘函数
binary 
Binary 区分负数和正数？
binary 
Binary 检查无限长二进制数是否可被3整除
binary 
Binary 9位浮点数转换
格式A
有1个符号位。
有k=5个指数位。指数偏差为15。
有n=3个分数位
binary 
Binary 在Julia中读取十六进制字符串文件
binaryjulia 
Binary 八度音阶：如何以二进制形式显示e+；十进制表示法？
binaryoctave 
Binary 如何使用JScript将字节序列写入二进制文件？
binary 
Binary 如果我的位数较少，如何转换为二进制？
binary 
Binary 移位寄存器如何在二进制到bcd转换中工作
binaryvhdl 
Binary 积分松弛整数线性规划的剩余问题
binary 
Binary 这个汉明码10101011110有错误吗？
binary 
Binary 什么是“；2'；s补码”；？
binarycomputer-science


                                        

                                        
                                        


                                                
                                                        [hadoop]相关推荐
                                                        
Hadoop 如何在map/reduce中执行ETL
									Hadoop
							 									Mapreduce
							 
Hadoop 创建外部分区
									Hadoop
							 									Hive
							 
Hadoop 我可以从AWS Elastic Mapreduce作业访问zookeeper吗
									Hadoop
							 									Amazon Web Services
							 									Apache Zookeeper
							 
Hadoop 大数据是什么；大数据；？
									Hadoop
							 									Mapreduce
							 
Hadoop PIG最大元组数
									Hadoop
							 									Apache Pig
							 
Hadoop mvn和make包错误
									Hadoop
							 
Hadoop ApachePig-可以序列化变量吗？
									Hadoop
							 									Mapreduce
							 									Apache Pig
							 
Hadoop Flume：通过API将文件发送到HDFS
									Hadoop
							 									Cloud
							 
本地运行Hadoop，在VM中访问HDFS。Can'；找不到本地文件
									Hadoop
							 
Hadoop 并行运行多个映射任务
									Hadoop
							 									Mapreduce
							 
Hadoop 在MapReduce中读取.tar.gz文件时输出异常
									Hadoop
							 									Mapreduce
							 
Hadoop 写路径HDFS
									Hadoop
							 
Hadoop 在执行sqoop作业时重写多个sqoop属性
									Hadoop
							 
Hadoop HDFS原子重命名文件系统依赖项
									Hadoop
							 
大量Hadoop输出文件
									Hadoop
							 
Hadoop 火花连接2对Rdd元件
									Hadoop
							 									Apache Spark
							 
Hadoop Oozie蜂巢动作悬挂，心脏永远跳动
									Hadoop
							 									Hive
							 
Hadoop Pig-如何在Pig中使用嵌套for循环来获取元组中的元素列表？
									Hadoop
							 									Mapreduce
							 									Apache Pig
							 
Hadoop实践中遇到错误
									Hadoop
							 									Mapreduce
							 
Hadoop 如何检查文件是否在HDFS中正确压缩？
									Hadoop
							 
Hadoop 两个表中的不同值
									Hadoop
							 									Hive
							 
Hadoop Kite SDK数据集和配置单元表之间的差异
									Hadoop
							 									Hive
							 
Hadoop 更改HBase WAL位置
									Hadoop
							 									Hbase
							 
Hadoop 蜂巢侧视图爆炸内部机制
									Hadoop
							 									Hive
							 									Mapreduce
							 
Hadoop 尝试将windows pentaho连接到虚拟机HDFS时出错
									Hadoop
							 
Hadoop 删除DataNode目录时的HDFS行为
									Hadoop
							 
Hadoop 在Impala中将十进制字符串更改为时间戳
									Hadoop
							 
Hadoop 让多个reduce任务将单个HDFS文件组装为输出
									Hadoop
							 
Hadoop 加入蜂巢纱线应用程序和Ranger日志审核
									Hadoop
							 
Google云上dataproc gui版本中的Hadoop作业错误
									Hadoop
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Import
Cakephp
Gtk
Talend
Phpstorm
Sqlalchemy
Rxjs
Login
Qml
Caching
Mpi
Bazel
Bison
Plugins
Windows Phone 8
Operating System
Lotus Notes
Ckeditor
Generics
Discord.py
Xmpp
Firefox Addon
Jms
Video Streaming
Protractor
Stream
Xna
Gruntjs
Localization
Jsf
Iis 7
Replace
Xamarin.forms
Chart.js
Botframework
Boost
Maven 2
Actionscript
Influxdb
Jersey
Compilation
Validation
Weblogic
Sails.js
Optimization
Gitlab
Adobe
Triggers
Certificate
Google Visualization
Rally
Gmail
Npm
Racket
Exchange Server
Common Lisp
Spring Security
Python 3.x
Pentaho
Docusignapi
Computer Vision
Marklogic
Vue.js
Filesystems
Ibm Midrange
Codenameone
Mono
Laravel 4
Windows Services
Security
Debian
Office365
Ios
Events
Nginx
Download
Printing
Rx Java
Couchdb
Tkinter
Opencart
Asp.net
Loopbackjs
Webgl
Neo4j
Node.js
Arduino
Hazelcast
Phantomjs
Twig
Amazon Web Services
Eclipse
Wso2
Vb.net
Ftp
Json
Windows 10
Listview
Image Processing
Google Chrome Devtools
File Upload
Openlayers
Coldfusion
Swift2
Bash
Discord
Ibm Cloud
Statistics
Orchardcms
Yaml
Coding Style
Lambda
Winforms
Windows 8
Dependencies
Z3
Tags
Windows Store Apps
Excel
Axapta
Jvm
Android Ndk
Model
Multithreading
Postman
Azure Cosmosdb
Doctrine
Lisp
Templates
Tinymce
Android Studio
Meteor
Indexing
Forms
Time
Kubernetes
Notepad++
Antlr
Eclipse Plugin
Vuejs2
Cookies
Perforce
Django
Oracle Apex
Elm
Version Control
Content Management System
Alfresco
Ruby On Rails 3.2
Google Plus
Corda
Gatsby
Netlogo
Flutter
Wolfram Mathematica
C++ Cli
Uiview
Url
Ravendb
Actionscript 3
Big O
Pdf
Openstack
Ios4
Module
Editor
Command Line
Ethereum
Mongoose
Stm32
Isabelle
Rest
Webview
F#
Dictionary
Oracle10g
Windows Phone
Tridion
Geolocation
C++
Menu
Apache Camel
Calendar
Plone
Smalltalk
Aws Lambda
Android Fragments
Qt4
Programming Languages
Struts2
Ignite
Plot
Xpages
Drupal
Windows Phone 8.1
Active Directory
Jsf 2
Spotify
Julia
Visual Studio 2017
Enums


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网