Hadoop 在MapReduce中计算输入拆分_Hadoop_Mapreduce_Hadoop2_Input Split - Fatal编程技术网

Hadoop 在MapReduce中计算输入拆分

hadoop mapreduce

Hadoop 在MapReduce中计算输入拆分,hadoop,mapreduce,hadoop2,input-split,Hadoop,Mapreduce,Hadoop2,Input Split,文件存储在大小为260 MB的HDFS中，而HDFS的默认块大小为64 MB。在对该文件执行map reduce作业时，我发现它创建的输入拆分数量只有4。它是如何计算的。？其余的4MB在哪里。？非常感谢任何输入。输入分割并不总是块大小。输入拆分是数据的逻辑表示。您的输入拆分可能是63mb、67mb、65mb、65mb（或者基于逻辑记录大小的其他大小）。。。请参阅下面链接中的示例假设逻辑记录的大小仅为几KB。假设文件中的每一行/记录都是1KB，那么它将生成多少个输入分割。？64000个记录将形

文件存储在大小为260 MB的HDFS中，而HDFS的默认块大小为64 MB。在对该文件执行map reduce作业时，我发现它创建的输入拆分数量只有4。它是如何计算的。？其余的4MB在哪里。？非常感谢任何输入。
输入分割并不总是块大小。输入拆分是数据的逻辑表示。您的输入拆分可能是63mb、67mb、65mb、65mb（或者基于逻辑记录大小的其他大小）。。。请参阅下面链接中的示例

假设逻辑记录的大小仅为几KB。假设文件中的每一行/记录都是1KB，那么它将生成多少个输入分割。？64000个记录将形成64mb的一个输入分割。正确，！但是，根据问题中给出的数据，当每行/记录为1KB时，将生成多少个输入拆分。？是4个还是5个拆分？如果所有260MB都是1KB，即260000kb的数据，260000/64000=4.06个输入拆分，但已知记录不会在两个输入拆分之间拆分，预计会在日志中看到~4个输入拆分

[mapreduce]相关文章推荐

MapReduce-单词计数示例的好处是什么 mapreduce

Mapreduce 在HBase MR作业中未找到zookeeper jar mapreduce hbase apache-zookeeper

Mapreduce 用于连接数据集的map reduce？ mapreduce

Mapreduce Coucbase大视图与小视图以及多个GET mapreduce couchbase

在MapReduce中如何进行洗牌？ mapreduce

除了输入和输出位置外，如何为Mapreduce程序提供第三个参数？ mapreduce

如何在MapReduce中处理标题和尾部 mapreduce

在mapreduce作业中将输入传递到地图之前，如何形成一对输入（来自两个不同的位置） mapreduce

Mapreduce 有可能避免交叉转换吗？ mapreduce apache-flink

Mapreduce 在非并行问题上运行Map/Reduce？ mapreduce

Mapreduce Apache Gora Reducer用于使用Hbase的多表输出 mapreduce hbase

随机文章推荐

用于处理混合类型的GraphQL架构 graphql

GraphQL：每个类型的子字段与可以使用args筛选的根查询字段？ graphql

Apollo GraphQL：如何在现有数组中的正确索引处插入变异对象？ graphql

将合并的字符串数组传递到Graphql工具的makeExecutableSchema中的奇怪行为。 graphql

使用先前突变返回结果的graphql多重突变？ graphql

Graphql 阿波罗缓存使用返回的负载重定向 graphql

如何在GraphQL中获取RDS Aurora中最后插入行的id graphql

如何测试graphql+；阿波罗服务器上传文件使用邮递员？ graphql

graphql compose:TypeError:无法读取未定义的属性“getTypeName” graphql

can'；t使用类型'；对象'；对于类型GraphQL字段类型 graphql nestjs

GraphQL异步查询结果 graphql

如何通过内省获得graphql突变的参数和类型？ graphql

对于Apollo客户端，我们是否应该添加后端graphql模式？ graphql

Graphql CreateReadStream不是一个函数 graphql

Graphql 数据未合并，Apollo 3与字段策略分页 graphql

有没有办法通过查询内省读取类型上的GraphQL指令？ graphql

如何根据GraphQL（NestJS）中的条件发送不同的订阅响应？ graphql nestjs

Graphql 我应该尽量减少中继应用程序中的订阅数量吗？ graphql

Graphql 向盖茨比进口中型商品 graphql rss gatsby

可以在本地查询我正在运行的apollo graphqlserver而不使用http吗？ graphql

[hadoop]相关推荐

Hadoop 大数据分析选择技术栈
Hadoop Nosql

hadoop中的全局计数器
Hadoop Amazon Web Services Mapreduce

Hadoop 如何在reducer中使用同一个键输出多个值？
Hadoop Mapreduce

Hadoop Giraph best的顶点输入格式，用于ID为String类型的输入文件
Hadoop

Hadoop 配置单元如何跨字符串列求和？
Hadoop Hive

Hadoop密钥组合和组合器
Hadoop

Hadoop 启动配置单元元存储时出错
Hadoop Hive

Hadoop 蜂箱中的柱取样
Hadoop Hive

Hadoop HBase无法在HDFS中创建其目录
Hadoop Hbase

Tags

Pascal Prometheus Post Download Kdb Collections Rx Java Resharper Cypress Spring Automation Android Amazon Web Services Jvm Amazon Dynamodb Visual Studio Bootstrap 4 Visual Studio Code Sas Azure Sql Database Electron Scala Calendar Discord Generics Asp.net Core Racket .net 4.0 Asp.net Core Mvc Sml Processing Couchdb Gdb Clearcase Unix Qt Cloud Amp Html Vim Corda Java Me Isabelle Object Google Plus 3d Plsql Parameters Qt4 Phantomjs Spring Batch Xmpp Express Synchronization Variables Forms Graphviz Silverlight 4.0 Apache Kubernetes Web Acumatica .net Dotnetnuke Animation Telegram Dependency Injection Asp.net Mvc 2 Javafx Combobox Ibm Midrange Office365 Ionic Framework Windows Phone Plone Mpi Uwp Pytorch Servlets Maps Web Applications Api D Fullcalendar Pyspark Facebook Amazon Redshift Cobol Ms Office Dynamics Crm Cakephp Spring Mvc Snmp Asp Classic Nginx Xcode Visual Studio 2017 Stored Procedures E Commerce Vb.net Memory Leaks Vector Orientdb Active Directory Coffeescript Struts2 Extjs4 Unit Testing Firefox Addon Exception Css Gtk Stata Three.js Vaadin Swift3 Android Emulator Tridion Triggers Sugarcrm C# 4.0 C++11 Autodesk Forge Ssrs 2008 Geometry Silverstripe Excel Yocto Https Ag Grid Arangodb Ios Mvvm Hybris Merge Ignite Sql Server 2005 Plugins Asynchronous Woocommerce Spring Integration Opengl Es Visual Studio 2010 Frameworks Ldap Dll Ruby On Rails 3.1 Cygwin Telerik Exception Handling Next.js Latex Phpunit Ruby On Rails 3.2 Jersey Nuget Cocos2d Iphone Identityserver4 Tableau Api Rss Mono Itext Stream Logic Sphinx Algorithm Encoding Project Management Layout Elixir View Filter Aem Omnet++ .htaccess Certificate Zsh Timer EmptyTag Grep Ecmascript 6 Instagram Lucene Xslt Playframework 2.0 Session Swiftui Meteor Login File Upload Tsql Ant Apache Kafka System Verilog Interface Vagrant Spring Security Bash Cmake Netbeans Datetime Verilog

Copyright © 2024. All Rights Reserved by - Fatal编程技术网