Scala 如何使用spark中的过滤功能卸下收割台？_Scala_Apache Spark - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Scala 如何使用spark中的过滤功能卸下收割台？_Scala_Apache Spark - Fatal编程技术网

Scala 如何使用spark中的过滤功能卸下收割台？

scala apache-spark

Scala 如何使用spark中的过滤功能卸下收割台？,scala,apache-spark,Scala,Apache Spark,我想从文件中删除头。但是，由于文件将被分割成多个分区，我不能只删除第一项。所以我使用了一个过滤函数来计算它，下面是我使用的代码： val noHeaderRDD = baseRDD.filter(line=>!line.contains("REPORTDATETIME")); 我得到的错误是“error not found value line”，这段代码有什么问题使用textFile如下： val rdd = sc.textFile(<<path>>) rdd

我想从文件中删除头。但是，由于文件将被分割成多个分区，我不能只删除第一项。所以我使用了一个过滤函数来计算它，下面是我使用的代码：

val noHeaderRDD = baseRDD.filter(line=>!line.contains("REPORTDATETIME"));

我得到的错误是“error not found value line”，这段代码有什么问题

使用

textFile

如下：

val rdd = sc.textFile(<<path>>)
rdd.filter(x => !x.startsWith(<<"Header Text">>))

我认为没有人回答这个显而易见的问题，因此行。包含也有可能：

val noHeaderRDD = baseRDD.filter(line => !(line contains("REPORTDATETIME")))

您就快到了，只是一个语法问题，但这当然很重要
你检查过这个问题吗？如果是，你的有什么不同？是的。实际上，我的标题不是一个标准模式，它只是另一行，但字段定义了不同的类别。我不确定我是否理解您的解释。请你复习一下好吗？添加一个包含一些输入和预期输出的示例。如果我已经从文件中加载了数据并创建了一个RDD，现在想创建另一个RDD，从中获取一部分数据并删除其中的标题，该怎么办？提供您的示例输入文件和预期输出使用spark.read的最后一个选项会产生一些您不知道的副作用提到
val noHeaderRDD = baseRDD.filter(line => !(line contains("REPORTDATETIME")))

[apache spark]相关文章推荐

随机文章推荐

与多语言IDE的插件相比，特定语言的IDE有什么优势吗？ ide

Ide 你用什么来写围棋 ide go

开发完整的编程语言、编译器和IDE需要多少时间和精力？ ide compiler-construction programming-languages

Ide 详细AspectJ编译器输出 ide intellij-idea

Ide 在vim中，在相对枚举器打开的情况下跳转到行 ide vim

Ide 为什么我们不使用函数数据库而不是包/库？ ide programming-languages

Ide 跑步进入格尼 ide go

对WordPress主题\插件开发IDE有疑问，如何获得IDE代码帮助？ ide wordpress

IDE与使用Antlr4实现的自定义语言的集成 ide antlr4

Ide 如何在Mac上安装Gnat编程工作室（GPS）？ ide installation ada

Ide 用于导出日历的Outlook加载项 ide

如何为XE7运行IDE修复包 ide

将代码输入PyCharm IDE for Python时出现的问题？ ide pycharm

Ide PhpStorm中具有垂直线的文件树 ide phpstorm

[scala]相关推荐

Scala最佳实践：特征继承与枚举
Scala Object

scala列表映射与MapSave
Scala

Scala 在Neo4j中创建多线程节点
Scala Transactions Neo4j

Scala SBT native packager中的多个项目依赖项
Scala Jar Debian Sbt

Scala 防止游戏框架'；s模板引擎从转义我的字符串
Scala Templates

如何检查Scala中是否存在路径或文件
Scala

配置scaladoc以包括扩展方法
Scala

Scala 函数[任意，字符串]特性和方差
Scala

Scala 如何改进“代码”；嵌套尝试。。匹配；？
Scala

Scala 在Akka中动态（以编程方式）生成参与者
Scala Akka

Scala 空间密码查询don'；行不通
Scala Neo4j Playframework 2.0

Scala中Pi的montecarlo计算
Scala

使用scala/play将HOCON（.conf）转换为JSON？
Scala Playframework 2.0

Scala rdd或数据帧apache spark中的增量更新
Scala Apache Spark Dataframe

具有路径相关/嵌套类型的Scala类型擦除问题
Scala

Scala 将可缩放[元组]转换为RDD
Scala Apache Spark

Scala 如何合并迭代器解析器
Scala

Scala 需要关于将数百万时间序列数据高效插入Cassandra数据库的建议吗
Scala Cassandra

Scala 如何用sbt组件制作多项目胖罐
Scala Apache Spark Jar Sbt

Scala 下限类型中的类型不匹配
Scala

Scala 是否可以对Spark UDAFs进行单元测试？
Scala Unit Testing Apache Spark

Scala 为什么Spark会把我的舞台分成3个不同的舞台，用相同的描述和DAG？
Scala Apache Spark

火花-为什么我会得到“火花”；找到：Int（）必需整数"；在Scala的一个匹配案例中
Scala Apache Spark

Scala 具有可变十进制精度的双精度格式
Scala

Scala 取而代之的是，将数据帧提取到Case类中会导致读取Tuple1
Scala Apache Spark

获取网关“使用时超时”；sbt intellij”；在scala源文件夹下
Scala Intellij Idea

Scala 将Scio类型的bigquery api与apache beam一起使用时编译管道时出错
Scala Google Cloud Dataflow

如何在Scala中使用带Unparyseq的星形图案？
Scala

Scala sbt的提取方案
Scala Sbt

Scala Spark Standalone：如何避免sbt组装和uber jar？
Scala Apache Spark Sbt

Tags

Autohotkey Cuda Netty Facebook Graph Api Ftp Sqlite Android Emulator Extjs4 Authentication Grafana Logstash Latex Xamarin.forms Php Swiftui Matrix Openlayers 3 Tfs Webview Azure Cosmosdb Compression Safari Lambda Twitter Bootstrap .net 4.0 Exchange Server Cocos2d X Silverlight 4.0 Netsuite Material Ui Jsp Xpath Aem Cookies Gcc Rss Ffmpeg Windbg Yii2 Compiler Construction Random Airflow Cron Silverlight EmptyTag Subsonic Socket.io Regex Mapping Input Ibm Mobilefirst Jpa Google Api Sencha Touch 2 Streaming Character Encoding Asp.net Mvc 2 Facebook Import Salesforce Azure Devops Unity3d Signalr Influxdb Jar Iphone Azure Functions Llvm Vb6 Nsis Class Asp.net Mvc 4 Cassandra Amazon Ec2 Path Com Scrapy Android Fragments Checkbox Asterisk Module Ethereum Codeigniter Curl Windows Phone 8 Wcf Jvm Reactjs Tinymce Sequelize.js Symfony1 Tkinter Heroku Plot Cucumber Drupal 7 Excel Text Jekyll Rabbitmq Datatables Ios6 Jquery Plugins Mapbox Keyboard Monitoring Bash Amazon Dynamodb C# 3.0 Recursion Shopify Eclipse Rcp Layout Nservicebus Pine Script Azure Data Factory Webgl 3d Ant Teradata Express Directx Julia Kentico Azure Yocto Extjs Login Hazelcast Camera Maven 2 Ms Office Mqtt Cryptography Model View Controller Uwp Fonts Autodesk Forge Teamcity Markdown Enums Stream React Native View Adobe Canvas Kernel Ckeditor Gatsby Jquery Office365 Sockets Perl Laravel 5 Apache2 Doctrine Microsoft Graph Api Single Sign On Gulp Antlr Windows Services Netlogo Vmware Swift2 Selenium Webdriver Http Backbone.js Websphere Spring Cloud Clearcase Reflection Gnuplot Openid Migration C# 4.0 Postman Wpf Requirejs Ios7 Libgdx Maps Ocaml Gitlab Openshift Haskell Reference Video Streaming Office Js Itext Internationalization Dynamic Visual Studio 2008 Jersey Wordpress Macros Join Kubernetes Phpmyadmin Keycloak Json Apache Kafka

Copyright © 2024. All Rights Reserved by - Fatal编程技术网