Apache spark 如何从文本文件创建mllib.linalg.Matrix_Apache Spark_Rdd_Apache Spark Mllib - Fatal编程技术网

Apache spark 如何从文本文件创建mllib.linalg.Matrix

apache-spark

Apache spark 如何从文本文件创建mllib.linalg.Matrix,apache-spark,rdd,apache-spark-mllib,Apache Spark,Rdd,Apache Spark Mllib,我知道我可以创建如下矩阵： val values = Array(0.0, 1.0, 2.0, 3.0, 4.0, 5.0) val mat = Matrices.dense(m, n, values).asInstanceOf[DenseMatrix] 0.0 1.0 2.0 3.0 4.0 5.0 但现在我有一个文本文件，它是一个矩阵，如下所示： val values = Array(0.0, 1.0, 2.0, 3.0, 4.0, 5.0) val mat = Matrices

我知道我可以创建如下矩阵：

val values = Array(0.0, 1.0, 2.0, 3.0, 4.0, 5.0)
val mat = Matrices.dense(m, n, values).asInstanceOf[DenseMatrix]

0.0 1.0

2.0  3.0

4.0  5.0

但现在我有一个文本文件，它是一个矩阵，如下所示：

val values = Array(0.0, 1.0, 2.0, 3.0, 4.0, 5.0)
val mat = Matrices.dense(m, n, values).asInstanceOf[DenseMatrix]

0.0 1.0

2.0  3.0

4.0  5.0

我想知道如何从这个文件创建矩阵

我可以这样做吗：

val test3=sc.textFile("textFile").map(_.split("\t").map(_.toDouble)).asInstanceOf[DenseMatrix]

但它似乎不起作用

有人帮我吗？

我想你可能跳过了一步

import org.apache.spark.mllib.linalg.{Matrix, Matrices}

val dValues = sc.textFile("textFile").map(_.split("\t").map(_.toDouble))
val matrix = Matrices.dense(3, 2, dValues)

您可以删除[DenseMatrix]的

.asInstanceOf[DenseMatrix]。这是不必要的。
矩阵。密集方法采用列主值列表。如果文本文件中有数据，则为行主数据。因此，请执行以下操作：
val dValues = sc.textFile("textFile").flatMap(_.split("\t").map(_.toDouble))
val matrix = Matrices.dense(rows, columns, dValues)

给你错误的矩阵类型。但是，有一个简单的解决方法：
val matrix = Matrices.dense(columns, rows, dValues).transpose

矩阵按列读取数据数组，因此需要将数据输入更改为[0.0,2.0,4.0,1.0,3.0,5.0]才能工作。您可能需要先对文本文件进行一些映射




[filter]相关文章推荐



                                                        
Filter google analytics profile简单过滤器工作不正常？
filtergoogle-analytics 
Filter 使用ETERCAP更改请求参数
filter 
如何在Powershell中使用-filter参数
filter 
Filter 剑道数据源在OData筛选器中发送错误的数据类型
filterkendo-uiodata 
Filter WSO2 4.8.0 ESB条件路由器
filterwso2 
Filter 摘录及；密码过滤器
filterneo4j 
Filter 日志存储创建嵌套字段
filterlogstash 
Filter 一个用于多个表的数据过滤器
filter 
Filter 在Shopify中按所有集合中的标签筛选
filtertagsshopify 
Elasticsearch 在ES中，如何将同义词文件用于术语过滤器，但也用于通配符查询？
filter 
Filter Tableau操作筛选器不工作问题
filtertableau-api 
Filter SAPUI5筛选器，具有多个参数上的and运算
filterbindingsapui5 
Filter SPARQL DBpedia筛选出特定的结果
filtersparql 
Filter 基于AD安全组的Ldap身份验证查询
filterldap 
Filter 筛选后剑道网格筛选器编号格式化
filterkendo-uiformattinggrid 
Solr-PatternCaptureGroupFilterFactory不索引regexp结果
filtersolr 
Filter DSP内核的并行版本
filterparallel-processing 
Filter FFmpeg-concat滤波器
filterffmpeg 
Filter 如何在杯子中安装链式过滤器
filter 
Filter 根据过滤器创建度量值
filterpowerbi 
                                       





随机文章推荐



                                                        
NSIS安装程序开始菜单目录
nsis 
Nsis 创建卸载程序时出错
nsis 
Nsis 如何在执行perl.exe时隐藏控制台窗口？
nsis 
如何在通过NSIS安装时使用后台进程安装jre？
nsisjava 
获取使用NSIS安装windows操作系统的硬盘驱动器名称
nsis 
Nsis VIProductVersion格式无效，应为X.X.X.X
nsis


                                        

                                        
                                        


                                                
                                                        [apache spark]相关推荐
                                                        
Apache spark 在“纱线簇”模式下运行spark应用程序时，找不到将HADOOP_带回家
									Apache Spark
							 
Apache spark “调试”；“检测到托管内存泄漏”；在Spark 1.6.0中
									Apache Spark
							 
Apache spark 基于导入/区分的分区
									Apache Spark
							 									Pyspark
							 
Apache spark 齐柏林飞艇火花Maxmind jackson.databind NoTouchMethodError
									Apache Spark
							 
Apache spark Spark RDD的示例方法无法按预期工作
									Apache Spark
							 
Apache spark 如何在spark 2.0中使用Cassandra上下文
									Apache Spark
							 									Cassandra
							 
Apache spark 为什么PySpark会随机失败；“插座已关闭”；错误？
									Apache Spark
							 									Pyspark
							 
Apache spark Apache Spark或Spark Cassandra连接器看起来不像是在并行读取多个分区？
									Apache Spark
							 									Cassandra
							 
Apache spark 如何在集群中高效地执行spark程序
									Apache Spark
							 
Apache spark （Py）Spark框架中数据帧数据的可视化
									Apache Spark
							 									Pyspark
							 
Apache spark SparkContext.addJar在本地模式下不工作
									Apache Spark
							 
Apache spark 从Lambda同时提交EMR中的Spark作业
									Apache Spark
							 
Apache spark 为什么硬代码重新划分值
									Apache Spark
							 
Apache spark 如何将Spark与弹性搜索连接起来
									Apache Spark
							 
Apache spark Mesos中的Spark streaming群集模式：java.lang.RuntimeException:未找到流jar
目标：
									Apache Spark
							 
Apache spark 通过spark scala程序访问HDFS
									Apache Spark
							 
Apache spark spark应用程序中的最小驱动程序内存应该是多少？
									Apache Spark
							 
Apache spark spark缓存的奇怪问题
									Apache Spark
							 									Hadoop
							 									Dataframe
							 									Caching
							 
Apache spark 无法解析字段名中的列名
									Apache Spark
							 									Dataframe
							 
Apache spark Tensorflow在AmazonEMR5.16上粉碎JVM
									Apache Spark
							 									Tensorflow
							 
Apache spark 在cloudera安装程序中安装livy或spark作业服务器的位置
									Apache Spark
							 
Apache spark 给定值未在Spark Scala中的if语句中赋值？
									Apache Spark
							 									If Statement
							 
Apache spark 使用广播应用映射转换时，pyspark Udf未按预期工作？
									Apache Spark
							 									Pyspark
							 
Apache spark 实例化JavaStreamingContext时发生AbstractMethodError异常
									Apache Spark
							 
Apache spark 未使用的火花工
									Apache Spark
							 
Apache spark 在pyspark 2.4中使用正则表达式时发生ParseException错误
									Apache Spark
							 									Pyspark
							 
Apache spark Apache Spark中分区拼花地板的延迟加载
									Apache Spark
							 
Apache spark 如何避免pyspark数据帧上每次转换的重复评估
									Apache Spark
							 									Pyspark
							 
Apache spark Google Dataproc上的Spark用户界面：数字解释
									Apache Spark
							 									Pyspark
							 
Apache spark Spark Scala：更新数据帧列'；来自另一个数据帧的值
									Apache Spark
							 									Pyspark
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Bluetooth
File Upload
Serial Port
Udp
Javafx 2
Pycharm
Email
Matlab
Clang
Command Line
Sharepoint 2013
Swiftui
Ios7
Vbscript
Glassfish
Lua
Macos
Google Chrome Devtools
Inheritance
Function
Combobox
Teamcity
Triggers
Twitter Bootstrap
Jwt
Computer Vision
Mfc
Identityserver4
Nunit
Sharepoint 2007
Eclipse Plugin
Error Handling
Coding Style
Gitlab
Jpa
Ms Office
Selenium Webdriver
Postman
String
Grafana
Exchange Server
Xaml
Google Drive Api
Jakarta Ee
Sails.js
Windows Mobile
Protocol Buffers
Aws Lambda
Boost
Laravel 4
Ionic2
Gruntjs
Ajax
Paypal
Graphql
Report
Ios
Sparql
Ada
Mdx
Android
Import
Internationalization
Coldfusion
Material Ui
Activerecord
Perforce
Menu
Drupal 6
Docker Compose
Acumatica
Plone
Jestjs
Nlp
Cygwin
Reflection
Spring
Google App Maker
Session
Compiler Construction
Firebase
Tcp
Cordova
Parsing
Windbg
Airflow
Timer
Pine Script
Bash
Tensorflow
Tomcat
Select
Syntax
Logstash
Reactjs
Time
Google Colaboratory
Exception
Mips
Go
Jmeter
Optimization
Socket.io
Sql Server 2005
Xamarin
Twilio
Audio
Graphics
Generics
Angularjs
Html5 Canvas
Core Data
Wordpress
Cobol
Express
Ios6
Orm
Data Structures
Msbuild
Swagger
Blazor
Prestashop
Spring Mvc
Vim
Asp.net Mvc 5
Windows Installer
Powershell
Wolfram Mathematica
Hive
C#
Vmware
Kibana
Zend Framework2
Seo
Cluster Computing
Winforms
Cocos2d Iphone
Node.js
Openlayers
Artificial Intelligence
Apache2
Notifications
Join
Meteor
Swing
Debugging
Sql Server 2012
Marklogic
Corda
Log4j
Vb.net
Nest
C
Flutter
Xpages
Sugarcrm
Jenkins
Ethereum
Magento
Kotlin
Devexpress
Azure Cosmosdb
Ssrs 2008
Drupal 7
Powerbi
Tabs
Https
Dynamic
Keras
Ibm Cloud
Cypress
Ruby
Stata
Visual Studio 2012
Ip
Google App Engine
Gps
Deep Learning
Mod Rewrite
Rspec
Webstorm
Xquery
Configuration
Http
Kernel
Zurb Foundation
Usb
Amazon S3
Orientdb
Google Plus
Microsoft Graph Api
Xamarin.forms
Data Binding
Vb6
Mysql
Flash
Codenameone
Django
Antlr4
Validation
Internet Explorer


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网