Apache spark Spark HashPartitioner意外分区_Apache Spark_Rdd - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark Spark HashPartitioner意外分区_Apache Spark_Rdd - Fatal编程技术网

Apache spark Spark HashPartitioner意外分区

apache-spark

Apache spark Spark HashPartitioner意外分区,apache-spark,rdd,Apache Spark,Rdd,我正在使用HashPartioner，但得到了一个意外的结果。我使用3个不同的字符串作为键，并将分区参数设为3，所以我希望有3个分区 val cars=Array（“本田”、“丰田”、“起亚”） val carnamePrice=sc.parallelize（用于{ x+“->”+索引）。迭代器 } } 地图。采取（10）结果如下。它只提供2个分区。我检查了字符串的哈希代码 (69909220 75427 -1783892706). 这里有什么问题？可能我误解了分区算法 Array[Str

我正在使用

HashPartioner

，但得到了一个意外的结果。我使用3个不同的字符串作为键，并将分区参数设为3，所以我希望有3个分区

val cars=Array（“本田”、“丰田”、“起亚”）
val carnamePrice=sc.parallelize（用于{
x+“->”+索引）。迭代器
}
}
地图。采取（10）

结果如下。它只提供2个分区。我检查了字符串的哈希代码 (69909220 75427 -1783892706). 这里有什么问题？可能我误解了分区算法

Array[String]=数组（（丰田，100）->0，（丰田，200）->0，（丰田，300）->0，（本田，100）->1，（本田，200）->1，（本田，300）->1，（起亚，100）->1，（起亚，200）->1，（起亚，300）->1）
这里没有什么奇怪的事情，由HashPartitioner使用的
实现如下：
def nonNegativeMod（x:Int，mod:Int）：Int={
val rawMod=x%mod
rawMod+（如果（rawMod<0）mod else 0）
}

通过3个分区，密钥分发定义如下所示：
用于{car nonNegativeMod（car.hashCode，3））

Seq[（字符串，Int）]=列表（（本田，1）、（丰田，0）、（起亚，1））

换句话说，没有直接哈希冲突并不保证没有任意数模的冲突




[io]相关文章推荐



                                                        
Io 是否可以在不使用RAID的情况下同时写入两个单独的磁盘？
iovirtual-machine 
Io 为什么有些程序在stderr上编写而不是在stdout上输出？
io 
微控制器能以多快的速度读取IO引脚？
iousb 
Io 在哈斯克尔与伊奥·莫纳德斗争
iohaskell 
Io 使用while循环写入文件
io 
Io 难以将下载的pdf文件写入android设备
iokotlin 
Io 如何使用CGAL:：read_ply_points（）读取二进制ply文件？
io 
                                       





随机文章推荐



                                                        
Mod rewrite 涉及查询字符串的mod_重写
mod-rewrite 
Mod rewrite 将所有动态url从旧站点重定向到单个静态url
mod-rewriteurl-rewriting 
Mod rewrite htaccess重定向到www，不包括https和http子域
mod-rewrite 
Mod rewrite 缺少尾部斜杠时，mod_rewrite不重定向多语言站点
mod-rewrite 
Mod rewrite mod_重写和服务器环境变量
mod-rewritehttpsapache2 
Mod rewrite 如何对mod rewrite规则进行例外？
mod-rewrite 
Mod rewrite speicif HTTP url到HTTPS url（仅一个url）
mod-rewritehttpsurl-rewriting 
Mod rewrite 修改“重写”；“400错误请求”；问题
mod-rewrite 
Mod rewrite 搜索引擎是如何发现平面链接的？
mod-rewriteseo 
Mod rewrite 重写规则给出500个错误
mod-rewrite 
Mod rewrite 重写第二个简单问题
mod-rewriteurl-rewriting 
Mod rewrite 将ReSRC.it htaccess转换为Nginx conf
mod-rewriteurl-rewritingnginx 
Mod rewrite 将具有一个查询字符串的URL重写为具有另一个查询字符串的URL
mod-rewrite 
Mod rewrite mod rewrite to 301将任何索引文件写入index.php
mod-rewrite 
Mod rewrite 使用mod Rewrite重写规则
mod-rewriteregex 
Mod rewrite Can'；t使用Phalcon应用程序运行mod_rewrite
mod-rewritenginx 
Mod rewrite CSSmod_重写
mod-rewrite


                                        

                                        
                                        


                                                
                                                        [apache spark]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Aws Lambda
Notepad++
Discord.js
Instagram
Mapreduce
Sublimetext2
Cmake
Arangodb
Jasper Reports
Django Rest Framework
Timer
Twitter
Macros
Iphone
Ibm Mobilefirst
Spring Batch
Apache Flex
Playframework 2.0
Sparql
Mysql
Objective C
Unicode
Jestjs
Windows 8
Compiler Errors
Pagination
Marklogic
Eclipse Plugin
Openstack
Primefaces
Javafx
Tableau Api
Tcp
Playframework
Sml
Blazor
Plot
Visual Studio 2010
Io
Bots
Arduino
Mediawiki
Testing
Oracle Apex
Numpy
Blackberry
Statistics
Sap
Coldfusion
Jakarta Ee
Prometheus
Angularjs
Powerbi
Windows Installer
Asterisk
Layout
Google Maps Api 3
Mule
Yii
.net Core
Google Drive Api
Fortran
Openssl
Html5 Canvas
Google Api
Asp.net Mvc 3
Rabbitmq
Pascal
Oracle
Matlab
Jms
Monitoring
Active Directory
Gps
Url Rewriting
Debugging
Actions On Google
C++
Grid
Terminal
Svg
Vagrant
Web Crawler
Ckeditor
Visual Studio 2017
Windows Store Apps
Report
Recursion
Scikit Learn
Scripting
Cuda
Amazon Dynamodb
Xamarin.android
Flash
Xsd
Stata
Oracle11g
Automated Tests
Azure Sql Database
Spotify
Netbeans
Latex
Checkbox
Visual Studio
Binding
Jetty
Firefox Addon
Winforms
Jqgrid
Compiler Construction
Zsh
Facebook Graph Api
Go
Google Visualization
Scroll
Nsis
Nosql
Vb6
Haskell
Websphere
Tomcat
Laravel
Identityserver4
Windows Phone 8.1
Actionscript 3
Ruby
Enums
Command Line
Log4j
Assembly
Opengl Es
Material Ui
Asp.net Core
Functional Programming
Download
Coffeescript
Discord.py
Sbt
Seo
Grep
Ios7
Cmd
Netlogo
Navigation
Triggers
Uml
Keyboard
Sas
Logic
Ip
Lambda
Youtube Api
Merge
Abap
Rdf
Mapbox
Indexing
Maven
Virtualbox
Tfs
Push Notification
Kdb
Azure Data Factory
Amazon Ec2
Graph
Printing
Colors
Winapi
Ms Access
Cron
Function
Reporting Services
C# 3.0
Sugarcrm
Unity3d
Canvas
Iframe
Openshift
Akka
Python 3.x
Pentaho
Random
Flask
Openerp
Mpi
Twilio
Google Chrome
Emacs
Dask
Google Apps Script
Postgresql
Exchange Server
Ipython
Datetime
Scala
Air
Xamarin
Smalltalk
Localization
Arm
Selenium


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网