Pyspark reduce中的意外错误_Pyspark - Fatal编程技术网

Pyspark reduce中的意外错误

pyspark

Pyspark reduce中的意外错误,pyspark,Pyspark,在pyspark中查找reduce的最大值时，我得到了以下意外结果 agg.reduce(lambda a,b : a if a > b else b ) 我的样本数据是 (u'2013-10-17', 80325.0) (u'2014-01-01', 68521.0) (u'2013-11-10', 83691.0) (u'2013-11-14', 149289.0) (u'2013-11-18', 94756.0) (u'2014-01-30', 126171.0) 结果是（

在pyspark中查找reduce的最大值时，我得到了以下意外结果

agg.reduce(lambda a,b : a if a > b else b )

我的样本数据是

  (u'2013-10-17', 80325.0)
(u'2014-01-01', 68521.0)
(u'2013-11-10', 83691.0)
(u'2013-11-14', 149289.0)
(u'2013-11-18', 94756.0)
(u'2014-01-30', 126171.0)

结果是

（u'2014-07-24'，97088.0）

结果应该超过94756

谢谢

sPradeep

您应该比较tuple中的第二个值，如下所示：

agg.reduce(lambda a,b : a if a[1] > b[1] else b )

您应该比较元组中的第二个值，如下所示：

agg.reduce(lambda a,b : a if a[1] > b[1] else b )

只需将

max

与

键一起使用即可：
rdd.max(key=lambda x: x[1])

只需将max
与键一起使用即可：
rdd.max(key=lambda x: x[1])

我为迟来的回复道歉，感谢您的帮助@MariuszI为迟来的回复道歉，感谢您的帮助@Mariusz




[puppet]相关文章推荐



                                                        
如何在puppet提供程序中创建ssh\u授权的\u密钥资源？（我要强制冲水吗？）
puppet 
puppet包含和变量范围
puppet 
Puppet 在哪里写关于傀儡主人的事实？
puppet 
Puppet仪表板权限：权限被拒绝-/var/lib/Puppet/reports/
puppet 
Puppet：需要基于参数的包
puppet 
Puppet-测试包是否已定义？
puppet 
如何使用Puppet master的所有IP地址创建Puppet事实
puppet 
Puppet 傀儡特工的档案
puppet 
Puppet-从清单移动到ENC脚本和仪表板
puppet 
Puppet “运行时缺少资源”；傀儡特工--noop“；
puppet 
如何在puppet中使用irb进行测试/调试
puppet 
如何在puppet中更改模板目录
puppet 
Puppet 从Hiera中检索特定的哈希块并传递以定义
puppet 
如何允许没有经验的用户使用my Puppet模块
puppet 
如何使用Puppet从AmazonLinuxExtras安装软件包？
puppet 
puppetdb:清除库存命令队列
puppet 
使用puppet自动化巧克力中的可信包
puppet 
如何使用木偶模块helio/puppetfluentbit？
puppet 
                                       





随机文章推荐



                                                        
Nosql Cassandra在EC2上同时读写时崩溃
nosqlcassandra 
Nosql 亚马逊DynamoDB项目大小？
nosqlamazon-dynamodb 
NoSql与BigTable（客户端API的比较）
nosql 
Nosql Cassandra CQL时间范围查询
nosqlcassandra 
Nosql 大型键值存储的横向扩展比文档数据库更好的是谁？
nosql 
Nosql Openstack上的Couchbase XDCR
nosqlcouchbaseopenstack 
在电子商务服务器中使用noSQL
nosqle-commerce 
Nosql 地图上的Aerospike二级索引
nosql 
Timeseries NoSQL数据库
nosqlinfluxdb 
Nosql 如何将属性标记为DynamoDBRangeKey和DynamoDBIndexHashKey？
nosqlamazon-dynamodb


                                        

                                        
                                        


                                                
                                                        [pyspark]相关推荐
                                                        
尝试获取随机林中的特征重要性（PySpark）
									Pyspark
							 
Pyspark 使用Python的Spark SQL:无法实例化org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient
									Pyspark
							 
如何将非结构化RDD转换为数据帧而不在Pyspark中定义模式？
									Pyspark
							 
如何在PySpark中的列中找到相同的元素？
									Pyspark
							 
Pyspark 是否可以使用spark kmeans的特定值初始化中心？
									Pyspark
							 
Pyspark Pypark和jupyter笔记本电脑不'；不要在windows 10上工作
									Pyspark
							 									Windows 10
							 									Jupyter Notebook
							 
Pyspark PypSpark按和分组
									Pyspark
							 
如何在pyspark dataframe中动态添加列
									Pyspark
							 
Pyspark 为什么我不能导入'；熊猫世界发展基金会'；在木星笔记本里？
									Pyspark
							 									Jupyter Notebook
							 
Pyspark-每年和每月的平均天数
									Pyspark
							 
集成调试pyspark数据帧有时输出到终端，而不是调试控制台
									Pyspark
							 									Visual Studio Code
							 
从PySpark UDF更新全局字典中的值
									Pyspark
							 
Pyspark Jupyter ImportError:尽管安装了py4j，但没有名为py4j.protocol的模块
									Pyspark
							 
Pyspark 转发填充新行以说明缺少的日期
									Pyspark
							 
使用pyspark将KMS加密的spark数据帧读写到S3存储桶时出现问题
									Pyspark
							 
Pyspark 将AWS胶水输出格式化为JSON对象
									Pyspark
							 
PySpark中具有非重复值的小部件
									Pyspark
							 
Pyspark 如何在payspark ml中加载word2vec模型？
									Pyspark
							 
jupyter_client.kernelspec.NoSuchKernel：没有名为PySpark的内核
									Pyspark
							 									Jupyter Notebook
							 
在Pyspark程序中包含配置单元查询
									Pyspark
							 									Hive
							 
如何使用PySpark结构流媒体+；卡夫卡
									Pyspark
							 									Apache Kafka
							 
Pyspark 使用附加写入模式将新数据写入现有拼花地板文件
									Pyspark
							 
Pyspark：如何在多列上连接两个数据帧？
									Pyspark
							 
仅更新更改的行pyspark delta表数据块
									Pyspark
							 									Merge
							 
Pyspark 如何通过将dataframe作为输入来编写pytest，以获取palantir foundry中所有必需的值
									Pyspark
							 
Pyspark 我可以在删除旧分区后立即导入更新的分区吗？
									Pyspark
							 
Pyspark 带分离器的分离式Pypspark柱
									Pyspark
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Netbeans
Doxygen
Xamarin.ios
Mapreduce
Webgl
Graph
Terraform
Replace
Dojo
List
Symfony
Webstorm
Proxy
Calendar
Sapui5
Symfony1
Graphviz
Search
Instagram
Azure Data Factory
Xna
Identityserver4
Forms
Centos
Exception
Yii
Django
Ios
Mule
Karate
Asp.net Core
Cypress
Zend Framework
Ssrs 2008
Codenameone
Asp.net Web Api
Syntax
Swagger
Wxpython
Gcc
Sharepoint
Sms
Domain Driven Design
Asp.net Mvc 4
Android
Wcf
Button
Logstash
Silverlight
Angular6
Xamarin.android
Ldap
Windows 10
Install4j
Vaadin
Pine Script
Struts2
Python 2.7
Loops
Vhdl
Automation
Xslt
Devexpress
Laravel 5
Unicode
Javafx 2
Web Services
Activerecord
Webrtc
Version Control
Graphql
Erlang
Ms Word
Rust
Blackberry
Asp.net Mvc 2
Command Line
Openlayers 3
Db2
Scheme
Amazon S3
Sublimetext2
Mysql
Google Plus
Yocto
Web Crawler
Grep
Awk
Windows Phone 8
Shiny
Mapping
Aframe
Testing
Django Models
Spring
Scripting
Testng
Unix
Autohotkey
C
Cloud Foundry
C++ Cli
Virtual Machine
Resharper
Com
Enums
Pytorch
Ag Grid
Visual Studio Code
Import
Spring Cloud
Opencart
Adobe
Mono
Openstack
Log4j
Twilio
Merge
Xsd
Migration
Firefox
Grid
Google Cloud Dataflow
Angular
Typescript
Streaming
Java 8
File Upload
Windows Mobile
Vuejs2
Dart
Css
Gruntjs
Youtube Api
Machine Learning
Markdown
Networking
Odata
Ethereum
Google Compute Engine
Pyspark
For Loop
Numpy
Discord
Permissions
Qt
Pentaho
Algorithm
Amazon Web Services
Web Applications
Jquery Plugins
Couchdb
Windows Installer
Concurrency
Properties
Sass
Visual C++
Hash
Language Agnostic
Sql Server 2008 R2
Ibm Mq
Apache Spark
Sml
Tcp
Google Api
Ide
Mercurial
Gradle
Rdf
Xquery
Azure
Serial Port
Windows Services
File
Primefaces
Colors
Twitter Bootstrap 3
Reflection
Certificate
Data Structures
Validation
Sed
Io
Azure Sql Database
Dynamics Crm
Reactjs
Linq
Swiftui
Configuration
Selenium Webdriver
Windbg
Safari
Doctrine Orm
Responsive Design
Ibm Mobilefirst
Rabbitmq
Maps
Linkedin
Laravel 4
Cron
Cocoa Touch


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网