Scala 匿名函数的参数类型必须完全已知。（SLS 8.5）当word2vec应用于数据帧时_Scala_Apache Spark_Dataframe_Apache Spark Mllib - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Scala 匿名函数的参数类型必须完全已知。（SLS 8.5）当word2vec应用于数据帧时_Scala_Apache Spark_Dataframe_Apache Spark Mllib - Fatal编程技术网

Scala 匿名函数的参数类型必须完全已知。（SLS 8.5）当word2vec应用于数据帧时

scala apache-spark dataframe

Scala 匿名函数的参数类型必须完全已知。（SLS 8.5）当word2vec应用于数据帧时,scala,apache-spark,dataframe,apache-spark-mllib,Scala,Apache Spark,Dataframe,Apache Spark Mllib,我使用数据帧应用Spark的word2vec。这是我的密码： val df2 = df.groupBy("LABEL").agg(collect_list("TERM").alias("TERM")) val word2Vec = new Word2Vec() .setInputCol("TERM") .setOutputCol("result") .setMinCount(0) val model = word2Vec.fit(df2)

我使用数据帧应用Spark的word2vec。这是我的密码：

val df2 = df.groupBy("LABEL").agg(collect_list("TERM").alias("TERM"))

    val word2Vec = new Word2Vec()
      .setInputCol("TERM")
      .setOutputCol("result")
      .setMinCount(0)

val model = word2Vec.fit(df2)
    val result = model.transform(df2)

    val synonyms = model.findSynonyms("4", 10)

    //synonyms.foreach(println)

    for((synonym, cosineSimilarity) <- synonyms) {
      println(s"$synonym $cosineSimilarity")
    }

从其他类似的stackoverflow问题和错误来看，似乎需要确切的参数类型。在for循环中，synonyms是一个数据帧，返回值的类型分别为String和Double。所以我所有的试验都失败了。我该如何补救呢？

FindSynoyms的结果是一个非物化的Spark internal

数据帧。您不能简单地对结果进行迭代
  def findSynonyms(word: Vector, num: Int): DataFrame = {
    ..
    sc.parallelize(wordVectors.findSynonyms(word, num)).toDF("word", "similarity")
  }

注意，foreach
工作的原因是，这是一种在DataFrame
上明确定义的物化方法，findSynonyms
的结果是一个非物化的火花内部DataFrame
。您不能简单地对结果进行迭代
  def findSynonyms(word: Vector, num: Int): DataFrame = {
    ..
    sc.parallelize(wordVectors.findSynonyms(word, num)).toDF("word", "similarity")
  }

注意，foreach
工作的原因是它是一种在DataFrame
上明确定义的物化方法




[apache spark]相关文章推荐



                                                        
                                       





随机文章推荐



                                                        
Tomcat 如何设置欢迎文件列表中引用的zip文件的内容处置标头？
tomcatweb-applications 
Railo、Tomcat IIS7和默认文档
tomcatiis-7 
TomcatServlet默认日期时间格式
tomcatservletsformattingjava 
又是JBoss vs Tomcat
tomcatjboss 
Tomcat 6没有'；看不到web.xml中映射的servlet
tomcatservlets 
Tomcat 我们可以更改WEB-INF的名称吗
tomcatweb-applications 
Tomcat 无法在MyEclipse for Spring 10中部署项目
tomcatdeployment 
webapps中的Tomcat安全文件夹
tomcat 
Spring mvc tomcat应用程序部署
tomcatspring-mvcnginx 
Tomcat 如何在ApacheSolr中索引pdf文件？
tomcatsolr 
Tomcat 如何在TOME中的同一事务中执行子请求？
tomcatservletstransactions 
Tomcat 错误：org.apache.http.MalformedChunkCodingException:区块末尾出现意外内容
tomcatjmeter 
Tomcat RabbitMq限制和集群
tomcatredisrabbitmq 
Tomcat服务器崩溃
tomcatsbt 
在tomcat中设置jsessionid cookie安全
tomcat 
Tomcat 圣杯&x27；运行应用程序&x27；詹金斯的工作干完后被吊死了
tomcatgrailsjenkins 
Tomcat 设置属性'；算法'；至'；MD5和x27；找不到匹配的属性
tomcat 
需要在Tomcat中运行同一web应用程序的多个实例
tomcatservlets 
如何在Tomcat8中实现热部署？
tomcatdeployment 
$CATALINA_HOME/shared/lib是Tomcat中的真正特性吗？
tomcat


                                        

                                        
                                        


                                                
                                                        [scala]相关推荐
                                                        
你能在Scala中返回一个可赋值的左值吗？
									Scala
							 
scala对象作为字段
									Scala
							 
使用；不应产生[例外情况]”；ScalaTest中的语法
									Scala
							 
Scala Buildr vs Gradle，利弊？
									Scala
							 									Ide
							 									Gradle
							 
Scala逐行调度流响应
									Scala
							 									Streaming
							 
Scala隐式在foreach lambda中不起作用
									Scala
							 									Lambda
							 
Scala LZW-TIFF解码
									Scala
							 
Scala build.sbt中的“？”、“？”、“
									Scala
							 									Sbt
							 
Scala进程：重定向的stdout和stderr总是延迟
									Scala
							 									Process
							 
Scala 案例类扩展特性不使用副本
									Scala
							 									Inheritance
							 
Scala 使默认sbt配置依赖于另一个
									Scala
							 									Build
							 									Sbt
							 
Scala 如何关闭Akka流Tcp服务器中的连接？
									Scala
							 									Akka
							 
Scala 为什么谓词下推不起作用？
程序草图

我创建了一个HiveContextHiveContext
在这个上下文中，我从JDBC关系表创建了一个DataFramedf
我通过df.registerTempTable（“TESTTABLE”）注册数据帧df
我通过启动HiveThriftServer2
HiveThriftServer2.startWithContext（hiveContext）
									Scala
							 									Apache Spark
							 
如何将命令行参数传递给spark shell scala脚本？
									Scala
							 									Shell
							 									Apache Spark
							 
Scala 如何跳过没有'；在构造RDD时不匹配模式
									Scala
							 									Apache Spark
							 
Scala 从avsc文件自动创建StructType
									Scala
							 									Apache Spark
							 
试图在scope-Spark/Akka/Scala中没有ActorSystem的情况下反序列化序列化的ActorRef
									Scala
							 									Apache Spark
							 									Akka
							 
带猫的Scala-笛卡尔+；验证
									Scala
							 
使用play引导的scalatag
									Scala
							 									Playframework
							 
Scala 更改嵌套JSON属性的类型
									Scala
							 									Apache Spark
							 
为什么Scala泡泡运动不起作用？
									Scala
							 
Spark/Scala—在配置单元表中加载数据帧的更快方法
									Scala
							 									Apache Spark
							 									Hive
							 
Scala 为什么这个简单的正则表达式不起作用
									Scala
							 
如何在spark scala中自动创建主键？
									Scala
							 									Apache Spark
							 
Scala 在数据帧中将WrappedArray转换为字符串
									Scala
							 									Apache Spark
							 									Dataframe
							 
Scala的第一种方法
									Scala
							 									Functional Programming
							 
如何在Scala中将rdd对象转换为数据帧
									Scala
							 									Dataframe
							 									Apache Spark
							 
Scala 如何使用Mill将模块依赖项与其父模块的依赖项相结合
									Scala
							 
scala猫遍历列表
									Scala
							 
Scala 使用spark CSV编写单个CSV文件
									Scala
							 									Csv
							 									Apache Spark
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Express
Azure Functions
Pdf
Validation
Spring Security
Redis
Sharepoint 2010
Python Sphinx
Concurrency
Ubuntu
Build
Drupal
Itext
D
Libgdx
If Statement
Asynchronous
Spring Batch
C#
Push Notification
Ibm Midrange
Python 2.7
Maps
Blockchain
Safari
Laravel 5
Mpi
Mvvm
Encryption
Memory Management
Ide
Symfony
Markdown
.net 4.0
Github
Zsh
Reactjs
Qml
Flutter
Nlp
Postgresql
Sequelize.js
Apache Storm
String
Aurelia
Openssl
Openid
Android Ndk
Email
Image Processing
Dll
Sml
Modelica
Ionic2
Dart
Logic
Liferay
Orchardcms
Filter
File Io
Elixir
Printing
Activerecord
Lambda
Ios8
Tcp
Openstack
Bootstrap 4
Iis 7
Azure Devops
Wxpython
Google Chrome Extension
Ipython
Discord
Hybris
Nest
Gis
Error Handling
Character Encoding
Cobol
Lisp
Dictionary
Sbt
Sharepoint 2013
Sas
Plsql
Playframework
Microsoft Graph Api
Hbase
Logstash
Linux Kernel
C++ Cli
Charts
React Native
Apache Kafka
Dynamics Crm 2011
Sublimetext2
Gatsby
Cocoa
Spotify
Sublimetext3
Windows Phone 8.1
Oop
Sdk
Scikit Learn
Azure Ad B2c
Asp.net Mvc 2
Office365
Database Design
Octave
Protocol Buffers
Hyperlink
Amazon Dynamodb
Spring
Wicket
Next.js
Git
Apache Nifi
Jboss
Install4j
Openlayers
Glassfish
Tableau Api
Node.js
Service
Orientdb
Bazel
Parameters
Class
Tkinter
Wso2
Ibm Mobilefirst
Oracle11g
Solr
Npm
Silverlight
Vaadin
Graphql
Windows Phone 8
Url
Generics
Asp.net Web Api
Spring Mvc
Llvm
Chef Infra
Facebook Graph Api
Cucumber
Core Data
Notepad++
Workflow
Vmware
Spring Cloud
Url Rewriting
Puppet
Windows Phone
Visual Studio 2010
Google Compute Engine
Symfony1
Ip
Data Binding
Mapreduce
Neo4j
Login
Fullcalendar
Kubernetes
Iphone
Openshift
Pytorch
Process
Swiftui
Windows 8
Cloud Foundry
Websphere
Notifications
Odoo
Razor
Indexing
Xcode
Prestashop
Webview
Uwp
Ruby On Rails
Debian
Language Agnostic
Jms
Mariadb
Select
Swagger
D3.js
Drupal 7
Tabs
Lucene
Rust
Terraform
Perl
Azure Sql Database
Teradata
Linkedin
Frameworks
Jsp
Ecmascript 6


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网