Apache spark 根据值的不同，字符串的强制转换方式也不同_Apache Spark_Hive_Pyspark - Fatal编程技术网

Apache spark 根据值的不同，字符串的强制转换方式也不同

apache-spark hive pyspark

Apache spark 根据值的不同，字符串的强制转换方式也不同,apache-spark,hive,pyspark,Apache Spark,Hive,Pyspark,似乎当一个数字作为字符串小于零时，它被转换为整数，但如果它大于零，则被转换为十进制。为什么会发生这种情况 spark.sql（“选择case when'1.24'>1.23然后选择1 else 0作为测试结束”）.show（） +----+ |试验| +----+ | 1| +----+ sql（“当'0.24'>0时选择case，然后选择1，否则0作为测试结束”）.show（） +----+ |试验| +----+ | 0| +----+ 如果您尝试选择case当'0.24'>0.0时

似乎当一个数字作为字符串小于零时，它被转换为整数，但如果它大于零，则被转换为十进制。为什么会发生这种情况

spark.sql（“选择case when'1.24'>1.23然后选择1 else 0作为测试结束”）.show（）
+----+
|试验|
+----+
|   1|
+----+
sql（“当'0.24'>0时选择case，然后选择1，否则0作为测试结束”）.show（）
+----+
|试验|
+----+
|   0|
+----+

如果您尝试

选择case当'0.24'>0.0时会发生什么情况，然后选择1或0作为test结束

。这很有道理，同时也很奇怪。谢谢。请尝试

选择'05'>0.01时的大小写，然后选择1或0作为测试结束。

？我认为一切都将被转换为字符串，而不是整数或浮点。奇怪的是，

SELECT'1.23'>1.24'，0.24'>0

在HIVE中返回

false，true

@QPSK您可以尝试

spark.sql（“选择'1.23'>1.24'，0.24'>0”）.show（）

（在时不使用

大小写）吗？在spark中，它返回false，false。在蜂巢中，它返回false，true。我想这是一件有火花的事情。对我来说，只使用0.0来处理文本的解决方案已经足够好了。




[hive]相关文章推荐



                                                        
Hive 配置单元：自定义项和分组依据
hive 
在hive中，如何在两行之间进行计算？
hive 
Hive 配置单元创建包含许多列的表
hive 
Hive 配置单元创建角色并授予对有限表的访问权限
hive 
Hive 配置单元-将字符串转换为bigint
hive 
Hive FROM_UTC_时间戳在将日期转换为EST时给出空指针异常
hive 
Hive 猪大十进制到蜂巢十进制
hiveapache-pig 
Hive 无法使用色调查询编辑器并行运行配置单元查询
hive 
Hive where子句中的多列在配置单元中不起作用
hive 
Hive 如何重命名配置单元中的分区值？
hive 
Hive Jmeter和配置单元jdbc安全问题
hivejmeter 
Hive 基于一列的配置单元自联接
hivesap 
Hive Sqoop导入--目标目录不工作，而是将文件放在默认目录中
hive 
Hive 如何查找表创建者和表创建日期/时间
hive 
Hive 根据配置单元中的其他列查找列中时间戳的差异
hive 
Hive Cdh至hdp蜂箱
hive 
Hive 使用rand（）函数插入配置单元表时出错
hive 
HiveAmbari错误：执行错误，从org.apache.hadoop.Hive.ql.exec.tez.TezTask返回代码1'；
hive 
Hive 配置单元ORC上的Presto查询错误，无法从DOUBLE类型的ORC流中读取SQL类型real
hive 
icer解决方案-看看是否有帮助！非常好的洞察阵列和第一。我不得不稍微调整一下，因为在hive上只有first_值可用，但我的结果和预期的一样！thanks@HeberBrandao我添加了一个更好的解决方案-看看是否有帮助！
+-------------
hive 
                                       





随机文章推荐



                                                        
如何从客户机使用核心服务连接到Tridion
tridion 
动态组件表示中未解析Tridion组件链接
tridion 
在Tridion 2011 SP1 CM管理单元中隐藏组织项目选项
tridion 
Tridion 如何确定多媒体组件是否发布到文件系统或数据库
tridion 
Tridion 2011 CoreService中的BasedOnSchemas选项
tridion 
tridion富文本区wcag验证
tridion 
当我们单击SDL Tridion按钮时，新用户界面站点edit 2011 SP1在Internet explorer中不起作用
tridion 
Tridion2009SP1：如何安排定期发布的内容页？
tridion 
如何配置带有扩展名XML的Tridion页面以发布到文件系统，并将其余页面发布到BrokerDB？
tridion


                                        

                                        
                                        


                                                
                                                        [apache spark]相关推荐
                                                        
Apache spark 失败的任务是否在Apache Spark中重新提交？
									Apache Spark
							 
Apache spark 从Amazon SQS提供Apache Spark流媒体？
									Apache Spark
							 
Apache spark Spark应用程序是如何工作的？
									Apache Spark
							 
Apache spark Spark余弦相似性（DIMSUM算法）稀疏输入文件
									Apache Spark
							 
Apache spark 番石榴版本，而使用火花壳
									Apache Spark
							 
Apache spark 如何在executor中获取spark广播变量？火花芯
									Apache Spark
							 
Apache spark Spark:与远程系统的关联失败。原因：脱离
									Apache Spark
							 									Cassandra
							 									Akka
							 
Apache spark 在中打开跟踪URI时未找到.css、.js和.png文件
									Apache Spark
							 
Apache spark 默认情况下，spark中的缓存内存限制是多少？
									Apache Spark
							 									Pyspark
							 
Apache spark 使用java.lang.AbstractMethodError在cloudera上执行spark驱动失败
									Apache Spark
							 
Apache spark 火花上的TensorFlow:Can'；t pickle局部对象循环
									Apache Spark
							 									Tensorflow
							 									Parallel Processing
							 									Pyspark
							 
Apache spark 如何为spark shell中的spark启用配置单元支持（spark 2.1.1）
									Apache Spark
							 									Hive
							 
Apache spark spark 2.3.0，parquet 1.8.2-二进制字段的统计数据不'；spark写入的结果文件中是否不存在？
									Apache Spark
							 
Apache spark 为什么Spark JavaRDD flatmap函数返回迭代器
									Apache Spark
							 
Apache spark spark streaming：为数据帧（pyspark）中的每个id选择具有最大时间戳的记录
									Apache Spark
							 
Apache spark Snappydata与外部配置单元的兼容性
									Apache Spark
							 									Hadoop
							 									Hive
							 
Apache spark 使用流作业和Kafka增加HDFS流量中的网络负载
									Apache Spark
							 									Hadoop
							 									Apache Kafka
							 
Apache spark Spark-简单线性回归
									Apache Spark
							 
Apache spark 多处理/池是否有利于Pyspark处理时间
									Apache Spark
							 									Pyspark
							 
Apache spark 转换Spark数据集<；世界其他地区>；到Java Pojo类
									Apache Spark
							 									Java 8
							 
Apache spark Apache/Cloudera/Livy Spark服务器-解释器错误：无法启动解释器
									Apache Spark
							 									Pyspark
							 
Apache spark Spark Scala：更新数据帧列'；来自另一个数据帧的值
									Apache Spark
							 									Pyspark
							 
Apache spark 是否有可能知道特定Spark作业使用的资源？
									Apache Spark
							 
Apache spark 如何对相同元素的列中的值进行计数
									Apache Spark
							 									Pyspark
							 
Apache spark 根据同一列上的另一行值计算火花列值
									Apache Spark
							 
Apache spark 火花中的广播变量是否移动到纱线中的每个执行器或节点管理器？
									Apache Spark
							 
Apache spark 为Apche Spark 2.4.3（Pyspark）安装delta lake组件
									Apache Spark
							 									Hadoop
							 									Pyspark
							 
Apache spark Kubernetes-无法将主机路径装载到spark executor
									Apache Spark
							 									Kubernetes
							 
Apache spark 如何将pyspark dataframe中的所有日期格式转换为日期列的时间戳
									Apache Spark
							 									Datetime
							 									Pyspark
							 
Apache spark Pyspark将字符串转换为包含两种不同格式的日期时间戳列
									Apache Spark
							 									Pyspark
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Heroku
Biztalk
Yii2
Electron
Cors
Compiler Construction
Tags
Twilio
Clearcase
Go
Here Api
Delphi
Swing
Swiftui
Gulp
Visual Studio Code
Octave
Antlr4
Embedded
Bash
User Interface
Dynamic
Activemq
Sublimetext3
Solr
Map
Netty
Sitecore
Facebook Graph Api
Ibm Mobilefirst
Postgresql
Winapi
Graphics
Vhdl
Cypress
Next.js
Caching
Loopbackjs
Curl
Microservices
Jpa
Magento
Pytorch
Jmeter
Jira
Bison
C++
Spring Batch
Ssis
Dynamics Crm
Internet Explorer 8
Ruby On Rails 3
Mod Rewrite
Internet Explorer
Generics
Shell
Swift
Performance
Dialogflow Es
Text
Telegram
Opengl Es
Autodesk Forge
Webstorm
Rss
Google Colaboratory
Binding
Vb6
Objective C
Sublimetext2
Reference
Exchange Server
Ssrs 2008
Compilation
Asp.net Mvc 2
Botframework
Mongodb
EmptyTag
Model View Controller
Sparql
Syntax
Memory Leaks
Jvm
Linker
Hyperledger Fabric
Jboss
Cryptography
Ibm Cloud
Actionscript
Servlets
Amazon Cloudformation
F#
Triggers
Sorting
Numpy
Dictionary
Deep Learning
Rdf
Spotify
Browser
Drupal 6
Netbeans
Push Notification
Directx
Sass
Routing
Prolog
Speech Recognition
Nativescript
Workflow
Nginx
Blockchain
Core Data
Ipad
Ms Office
Laravel 4
Unity3d
Model
Openshift
Xamarin.ios
Windows Phone 7
Zsh
Sencha Touch 2
Testng
Error Handling
Db2
Sprite Kit
Image Processing
Kibana
Terminal
Matlab
Plsql
Postman
Dotnetnuke
Ant
Latex
Puppet
Properties
Parallel Processing
Jenkins
Vim
Opengl
Oauth 2.0
Optimization
Entity Framework
Fonts
Api
Authentication
Phpstorm
Mercurial
Windows 7
Sencha Touch
Pip
Excel Formula
Datatables
Youtube Api
Rx Java
Oracle11g
Automated Tests
Awk
Angular
Pyspark
Sip
Gdb
Jaxb
Cloud
Log4j
Interface
Java Me
Erlang
Rally
Wolfram Mathematica
Google Visualization
Jupyter Notebook
Parameters
Mapping
Sockets
Testing
Corda
Quickbooks
C# 3.0
Vbscript
Forms
Geolocation
Monitoring
Xquery
Scrapy
Material Ui
Pointers
Azure Devops
D3.js
Jwt
Activerecord
Ada
Apache Pig
Service
Visual Studio 2012
Cocoa
Visual Studio 2013
Android Ndk
Notepad++


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网