Apache spark 什么时候可以使用符号表示spark sql中的列？_Apache Spark_Apache Spark Sql - Fatal编程技术网

Apache spark 什么时候可以使用符号表示spark sql中的列？

apache-spark

Apache spark 什么时候可以使用符号表示spark sql中的列？,apache-spark,apache-spark-sql,Apache Spark,Apache Spark Sql,考虑数据帧上的基本groupBy表达式： val groupDf = rsdf.groupBy("league","vendor").agg(mean('league),mean('vendor)) groupBy部分很好：它使用字符串作为列名。然而，agg（/mean）不支持，因为这里显然不支持符号我想知道为什么Symbol在这里不起作用，以及它们在Spark SQL中何时被允许使用。简单的答案是从不。没有直接支持符号的DataFrame方法长答案是无处不在，Spark编译器期望列，但

考虑

数据帧上的基本groupBy
表达式：
val groupDf  = rsdf.groupBy("league","vendor").agg(mean('league),mean('vendor))

groupBy
部分很好：它使用字符串作为列名。然而，agg
（/mean
）不支持，因为这里显然不支持符号
我想知道为什么Symbol
在这里不起作用，以及它们在Spark SQL中何时被允许使用。
简单的答案是从不。没有直接支持符号的DataFrame
方法
长答案是无处不在，Spark编译器期望列，但您需要范围内的其他对象
符号工作的唯一原因是提供了从Symbol
到Column
的隐式转换
一旦导入，编译器将能够在需要列
时强制转换符号
，包括agg
（隐式在范围内）：
import spark.implicits._
import org.apache.spark.sql.functions._

val df = Seq((1, 2)).toDF("league", "vendor")

df.groupBy("league","vendor").agg(mean('league),mean('vendor)).show

+------+------+-----------+-----------+                                         
|league|vendor|avg(league)|avg(vendor)|
+------+------+-----------+-----------+
|     1|     2|        1.0|        2.0|
+------+------+-----------+-----------+




[serial port]相关文章推荐



                                                        
Serial port Arduino map（）方法-为什么？
serial-portarduinomapping 
Serial port 如何发送/接收串行通信
serial-portarduino 
Serial port Atmega128中的串行通信
serial-port 
Serial port Arduino AltSoftSerial按enter读取/打印altSerial？
serial-portarduino 
Serial port STM32f0发现USART缓冲区未发送
serial-portstm32 
Serial port 使用python的SDI-12 Raspberry Pi数据记录器
serial-port 
Serial port UART-PC上的符号错误
我正在编写一个简单的程序，将数据从MCU传输到PC。
我使用FTDI电缆来实现这一点。
我发送的数据是0到9 0x30到0x39之间的字符串数字，作为ascii码。
MCU和PC终端均配置为9600 kbps、8位、无奇偶校验、无流量控制、一个停止位。
当数据从MCU传输到PC时，符号错误。
当MCU的TX和RX线路都互相连接时——我可以看到，所有发送的符号都被MCU接收。
当连接到PC的FTDI电缆的TX和RX线相互连接时，PC接收到从PC终端发送的所有符号。
serial-portembedded 
Serial port El capitan pololu isp加密狗pgm03a不再工作
serial-port 
Serial port USB：虚拟COM端口规范
serial-portusb 
Serial port 来自Windows 10应用程序的Rs232串行
serial-portwindows-10 
Serial port 如何在C中激活RTS（RS232）引脚#
serial-port 
Serial port GStreamer/iMX6：通过iMX6和PC之间的串行端口传输h264编码视频
serial-portvideo-streaminggstreamer 
                                       





随机文章推荐



                                                        
Objective c 在Cocoa中的UITableView顶部添加额外单元格
objective-ciphoneuitableviewcocoa-touch 
Objective c Avassetrader没有'；你不读整个文件吗？
objective-ccocoa-touchios 
Objective c CorePlot中的轴缩放
objective-cxcodeios 
Objective c 排序描述符中的函数
objective-c 
Objective c CABasicAnimation不是动画。帮忙？
objective-ccocoamacos 
Objective c 需要在目标c中声明协议吗？
objective-c 
Objective c 数组中的随机数
objective-ccocoa 
Objective c 适用于mac os 10.6 snow leopard的glib
objective-cc 
Objective c 快速查看预览面板
objective-cxcodemacos 
在Objective-C中存储和检索数字对的快速方法
objective-cios 
Objective c 关于代码清晰性和功能性
objective-c 
Objective c 对于多个协议中的同一方法，应该怎么做？（目标C）
objective-c 
Objective c 我的应用程序在iOS上应该在哪里存储大量PDF文件？
objective-cioscore-data 
Objective c iOS如何通过动画使iPhone指南针航向绕圆圈移动？
objective-cios 
Objective c 如何使modf或modff正常工作？
objective-cc 
BruteForce的Objective-C代码块效率
objective-c 
Objective c @interface中的实例变量；头与实现
objective-c 
Objective c 位置服务在iOS 8中不工作
objective-cios8 
检查Objective-C中是否存在字符串常量
objective-c 
Objective c 在OS X中重新绘制桌面背景而不重新启动dock
objective-cxcodemacoscocoa


                                        

                                        
                                        


                                                
                                                        [apache spark]相关推荐
                                                        
Apache spark 主机上的SnappyCompressionCodec
									Apache Spark
							 
Apache spark “的NoSuchMethodError”；列表.toMap“；星星之火
									Apache Spark
							 
Apache spark 如何只处理最后的、最相关的事件（当延迟增长太快时跳过其他事件）？
									Apache Spark
							 									Apache Kafka
							 
Apache spark DataFrame.write.parquet（）抛出NPE
									Apache Spark
							 
Elasticsearch 预测弹性搜索演示导致错误
									Apache Spark
							 									Cluster Computing
							 
Apache spark DataFrame na（）填充方法和不明确引用存在问题
									Apache Spark
							 									Dataframe
							 
Apache spark 将Lucene PorterStemmer添加到MLlib管道中
									Apache Spark
							 									Lucene
							 									Nlp
							 
Apache spark HA纱线上的运行火花
									Apache Spark
							 
Apache spark OOzie Spark:代码101错误
									Apache Spark
							 
Apache spark 是否有数据管道的蓝图？
									Apache Spark
							 
Apache spark 卡夫卡与spark的整合
									Apache Spark
							 
Apache spark Spark在没有缓存的情况下耗尽内存
									Apache Spark
							 
Apache spark 使用spark jobserver提交spark作业时出错
									Apache Spark
							 
Apache spark Spark sql dataframe在联接后从alias表中删除所有列
									Apache Spark
							 
Apache spark 为什么是Spark'；s的第一次迭代很慢，而进一步的迭代速度更快？
									Apache Spark
							 									Pyspark
							 
Apache spark 在cassandra中，Pyspark在查询中出现错误
									Apache Spark
							 									Cassandra
							 									Pyspark
							 
Apache spark spark“在SparkyR中应用：无法运行程序”；Rscript"；：错误=13，权限被拒绝
									Apache Spark
							 
Apache spark spark java.lang.stackoverflow逻辑回归适合大数据集
									Apache Spark
							 									Pyspark
							 
Apache spark Spark中不平衡类的处理
									Apache Spark
							 
Apache spark SnappyData作业的依赖项和包含项
									Apache Spark
							 									Intellij Idea
							 
Apache spark 广播变量何时会发生变化？
									Apache Spark
							 
Apache spark 使用Python2.6.6计算Pyspark 2.0.1中的deltatime
									Apache Spark
							 									Pyspark
							 
Apache spark 如何增加Spark Streaming/Kafka中处理特定阶段的执行者数量？
									Apache Spark
							 									Apache Kafka
							 
Apache spark 如何加入3rdd'；s使用Spark Scala
									Apache Spark
							 									Hadoop
							 
Apache spark Spark executor在增加executor实例数时丢失
									Apache Spark
							 									Pyspark
							 
Apache spark 如何在spark中跟踪hdfs中已处理的文件
									Apache Spark
							 									Hadoop
							 
Apache spark 如何在mapPartitions返回的迭代器中的每个RDD上映射RDD函数
									Apache Spark
							 									Pyspark
							 
Apache spark 使用Spark SQL查询按使用情况进行集群
									Apache Spark
							 
Apache spark 是联合的+；火花中的orderBy可交换？
									Apache Spark
							 									Pyspark
							 
Apache spark 为什么spark应用程序会崩溃，出现异常java.net.SocketException:Connection重置，即使提供了足够的内存&；分区？
									Apache Spark
							 									Pyspark
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Dependency Injection
Dynamic
Listview
Grid
Struct
Hazelcast
Data Structures
Windows Phone 8
Mongodb
Influxdb
Caching
Sorting
Matrix
Graphics
Pip
Gnuplot
Gmail
Activerecord
Tinymce
C#
Teradata
Entity Framework 4
Asterisk
Apache Zookeeper
Openstack
Elm
Sap
Gcc
Xmpp
Discord.py
Ocaml
Mariadb
Gradle
Python
Browser
Protocol Buffers
Jasmine
Floating Point
Fiware
Windows Phone 7
Visual Studio
Google Visualization
Inheritance
Internet Explorer
Xcode
Swift3
Doctrine Orm
Maps
Webpack
Latex
Sql Server 2008
Silverlight
Certificate
Windbg
Vbscript
Reporting Services
Scripting
Prolog
Regex
Windows Services
Moodle
Project Management
Xquery
Postgresql
Autohotkey
Actions On Google
Windows Phone
Xml
Git
Magento2
Visual Studio Code
Couchbase
Ftp
Pandas
Lotus Notes
Ios4
Silverlight 4.0
Common Lisp
Visual Studio 2013
Firefox
Web Applications
Canvas
Open Source
Magento
Mediawiki
Spring Boot
Amazon Ec2
Gstreamer
Google Api
Orientdb
Windows Installer
X86
Notepad++
Usb
Wxpython
Ipython
Typescript
Mapreduce
Modelica
Go
Facebook
Sass
Quickbooks
Drools
Google Analytics
View
Statistics
Localization
Symfony
Applescript
Windows 7
Parsing
Drupal 6
Data Binding
Report
Netty
Polymer
Visual Studio 2008
Logging
Button
Django Rest Framework
Time
Twig
Active Directory
Mongoose
Ms Access
Jasper Reports
Openlayers
Jenkins
Ruby
Ubuntu
C++11
Database Design
Colors
Protractor
Odoo
Dependencies
Curl
Codenameone
Dynamics Crm
Clang
Install4j
Debian
Qt4
Cryptography
Lambda
Ruby On Rails
Scikit Learn
Fluent Nhibernate
Pytorch
Soap
Function
Server
Twitter Bootstrap
Amazon Cloudformation
Rally
Serial Port
Passwords
Racket
Triggers
Datetime
C# 4.0
Nginx
Twilio
Resharper
Express
Subsonic
Bootstrap 4
Nlp
Validation
Kernel
Cobol
Swing
Binary
Jwt
Architecture
Ionic2
Sqlite
Sapui5
String
Visual Studio 2010
Ide
Jms
Netlogo
Text
Windows 8
Io
Dll
Automated Tests
Batch File
Aws Lambda
Pagination
Tkinter
Openshift
Networking
Ant
Forms
Amazon S3
Azure Ad B2c
Terminal
Flutter


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网