使用Scala在Spark中将RDD转换为数据帧时拆分Txt文件中的数据时出现问题_Scala_Apache Spark_Spark Dataframe - Fatal编程技术网

使用Scala在Spark中将RDD转换为数据帧时拆分Txt文件中的数据时出现问题

scala apache-spark

使用Scala在Spark中将RDD转换为数据帧时拆分Txt文件中的数据时出现问题,scala,apache-spark,spark-dataframe,Scala,Apache Spark,Spark Dataframe,我以RDD的形式从文本文件中读取数据并将其转换为数据帧，但没有得到所需的输出代码- val myFile = sc.textFile("car.txt") val df = myFile.map(_.split(" ")).map(line => Text(line(0))).toDF() df.show() 其中Text是case类案例类- case class Text(field: String) car.txt文件中的数据- hyundai honda honda maru

我以RDD的形式从文本文件中读取数据并将其转换为数据帧，但没有得到所需的输出

代码-

val myFile = sc.textFile("car.txt")
val df = myFile.map(_.split(" ")).map(line => Text(line(0))).toDF()
df.show()

其中Text是case类

案例类-

case class Text(field: String)

car.txt文件中的数据-

hyundai honda
honda maruti
maruti honda

执行时输出-

+-------+
|  field|
+-------+
|hyundai|
|  honda|
| maruti|
+-------+

为什么我没有从数据框中的文本文件中获取所有数据？

这是因为您正在

拆分空间中的数据，然后只输出该数据的第一个元素（第一个单词）->行（0）

如果您只需要行，那么您可以剪切.map（u.split（“”）
，然后只使用行（no（0）
）
这是因为您正在拆分空间上的数据，然后只输出该行的第一个元素（第一个单词）->行（0）

如果您只需要这些行，那么您可以剪切.map（u.split（“”）
，然后只使用行
（无（0）
）




[apache spark]相关文章推荐



                                                        
Apache spark 未能找到/usr/local/ceral/mesos/0.22.1/etc/mesos/masters
apache-spark 
Apache spark 如何在Spark数据帧中使用已注册的配置单元UDF？
apache-sparkhive 
Apache spark 在spark中创建不带文件的JavaRDD
apache-spark 
Apache spark 应用SUM agg函数的火花代码
apache-spark 
Apache spark 为什么计数函数不能在Spark中使用mapvalues？
apache-spark 
Apache spark 树冠“设置树冠环境”阶段未完成
apache-sparkpyspark 
Apache spark Spark sql错误
apache-spark 
Apache spark 关于Graphx三角形计数中规范方向的查询
apache-spark 
Apache spark 如何避免在编写拼花文件时出现空文件？
apache-sparkpyspark 
Apache spark 为什么spark会创建空分区以及默认分区是如何工作的？
apache-spark 
Apache spark ApplicationMaster-在纱线中运行的不同类型的应用程序是否有所不同？
apache-sparkhadoopmapreduce 
Apache spark 向pyspark数据帧添加向量列
apache-sparkdataframepyspark 
Apache spark 如何使用Spark数据帧读写Cassandra表？
apache-sparkcassandra 
Apache spark Executor Core的数量和好处或其他-Spark
apache-spark 
Apache spark 使用带Kafka的Spark结构化批处理作业管理补偿
apache-sparkapache-kafka 
Apache spark Spark SQL–如何使用动态生成的密钥进行分组或聚合？
apache-spark 
Apache spark 为什么Spark RDD为小数据保留更多的分区
apache-spark 
Apache spark 动态添加填充零
apache-sparkpyspark 
Apache spark 大窗口spark结构化流媒体：内存消耗
apache-spark 
Apache spark 尽管作业成功，但有些纱线日志在纱线UI中不可见
apache-sparkhadoop 
                                       





随机文章推荐



                                                        
Telegram 如何通过单击电报中的按钮发送命令
telegram 
Telegram 获取电报组ID（使用我的用户，不使用BOT）
telegram 
Telegram 如何通过bot自身发送消息？
telegram 
可以使用Telegram Bot Api从我的电报帐户获取未读邮件吗？
telegram 
Telegram 电报机器人中的待定更新计数是多少？
telegramphpmysql 
Telegram 如何使用电报机器人API发送表格？
telegram 
Telegram 通过电报bot通过消息id链接消息
telegram 
Telegram 如何在电报即时视图中从html中的数据惰性src中提取图像url
telegram 
Telegram 电报API sdk或库文件在哪里？
telegram 
Telegram 电报从哪里获取我网站链接的缩略图？
telegram


                                        

                                        
                                        


                                                
                                                        [scala]相关推荐
                                                        
Scala dbc update语句
									Scala
							 									Jdbc
							 
Scala 承诺的反面是什么？
									Scala
							 									Haskell
							 									Language Agnostic
							 
Scala 播放2.4 Slick 3.0-删除表中的所有行
									Scala
							 
如何在scalaz流中实现接收可用传感器
简短版本：
									Scala
							 
Scala 如何确定传递给宏的表达式是否总是产生相同的值？
									Scala
							 
Scala 范围'；spark.driver.maxResultSize'；
									Scala
							 									Apache Spark
							 
Scala SparkStreaming:文件流（）中出现错误
									Scala
							 									Apache Spark
							 
使用Scala breeze.optimize.linear.LinearProgram时出现意外类型不匹配
									Scala
							 
Scala Case类默认应用方法
									Scala
							 
Scala.Rx与ScalaTags示例编译错误
									Scala
							 
Scala 按对象数缩放窗口长度
									Scala
							 									Apache Spark
							 									Streaming
							 
Scala 斯卡拉河
									Scala
							 									Stream
							 
Scala 在大数据流中计算我的RDD记录
									Scala
							 									Apache Spark
							 
Scala Slick 3.1中的MySQL
									Scala
							 
Scala 带元组的spark aggregateByKey
									Scala
							 									Apache Spark
							 									Functional Programming
							 
Scala 类型与类型参数不匹配
									Scala
							 
Scala 我如何在scopt中接受未标记的论点？
									Scala
							 
spark scala rdd/dataframe保存筛选和拒绝的数据
									Scala
							 									Apache Spark
							 
Scala 如何使用akka http将html、css和js集于一身？
									Scala
							 									Playframework
							 									Akka
							 
Scala 为什么；错误：…发散隐式扩展…“；当我使用SortedSet时？
									Scala
							 
Scala PrivateMethodTester与继承
									Scala
							 
Scala 在主方法中使用时找不到隐式
									Scala
							 
Spark Scala Jaas配置
									Scala
							 									Apache Spark
							 									Apache Kafka
							 
Scala 使用Spark DataFrame中的多列更改行的值
									Scala
							 									Apache Spark
							 
Scala 将RDD每行中的键值对列表转换为每行中的单个键值
									Scala
							 									Apache Spark
							 
Scala slick：使用“过滤”；在；关于多列
									Scala
							 
如何从解释器中找到scala文档api
									Scala
							 									Documentation
							 
从HBase检索数据并将其格式化为scala数据帧
									Scala
							 									Apache Spark
							 									Hbase
							 
如何从scala spark中的并行化列表构造（键、值）列表？
									Scala
							 									Apache Spark
							 
Scala行动图实施问题（跟进）
									Scala
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Compiler Construction
Computer Vision
Asynchronous
Microsoft Graph Api
Wix
Server
Verilog
Artifactory
Binary
Lambda
Service
Jasmine
Google Bigquery
Aurelia
Cryptography
Ember.js
Powerbi
Rss
Jqgrid
Xcode4
Ibm Mobilefirst
Datetime
Sms
Tomcat
Orm
Ssas
Visual Studio 2017
Sql
Symfony1
Dask
Mips
Testing
Yii2
Architecture
Windows Phone 7
Jaxb
Vaadin
Netlogo
Material Ui
Phpmyadmin
Asp.net Mvc 4
Wcf
Ibm Cloud
Video
Pascal
Android
Entity Framework Core
Ipython
Docker Compose
Dependencies
Jms
Google Chrome Devtools
Arrays
Xamarin.forms
Jdbc
Pdf
Model
Seo
Loops
Post
File Io
Paypal
If Statement
Keyboard
Activerecord
Opengl Es
Ruby On Rails 3.1
Vbscript
Drupal
Office Js
Kernel
Drupal 7
Gulp
Combobox
Command Line
Yaml
Utf 8
Domain Driven Design
Dart
Netty
Google Cloud Dataflow
Nginx
Scheme
Serialization
Image Processing
Ssrs 2008
Download
Plsql
Xamarin
Serial Port
Internet Explorer
Windows 7
Data Binding
Log4j
Jakarta Ee
Com
Network Programming
Dns
Windows Phone 8.1
Docusignapi
Opencv
Python 3.x
Less
Automation
Gtk
Io
Algorithm
Opencl
Rxjs
Error Handling
Compilation
Certificate
Open Source
Jar
Google Maps Api 3
Kibana
Robotframework
Actions On Google
Clojure
Speech Recognition
Graphql
Centos
Mercurial
Windows Phone
Laravel
Google Compute Engine
Ckeditor
Windows 10
Matrix
Gmail
Ssis
Debugging
Asp.net Core
.net 4.0
Scikit Learn
Vue.js
Hadoop
Maven 2
Swift3
Python Sphinx
Amazon Cloudformation
Coffeescript
Forms
Mapping
Synchronization
Here Api
Deep Learning
Azure Sql Database
Jhipster
Sass
Flutter
Discord.js
Subsonic
Sorting
Reporting Services
File
Cakephp
Abap
Twitter
Winapi
Web Applications
Process
Rest
Titanium
Wxpython
Curl
Microservices
Big O
Twig
Amazon Ec2
Azure
Cocoa
Asp Classic
Signalr
Drop Down Menu
Pentaho
Installation
Exchange Server
Xaml
Winforms
Monitoring
Ipad
Ignite
Google Calendar Api
Windows Runtime
Mobile
Properties
Devexpress
Exception
Menu
Glassfish
Couchbase
Api
Quickbooks
Orientdb
Unity3d
Asp.net
Ms Office
Apache2
Project Management
Google Sheets


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网