Csv TXT文件读取"；“空记录”；造成不良记录_Csv_Apache Spark_Text_Pyspark - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Csv TXT文件读取"；“空记录”；造成不良记录_Csv_Apache Spark_Text_Pyspark - Fatal编程技术网

Csv TXT文件读取"；“空记录”；造成不良记录

csv apache-spark text pyspark

Csv TXT文件读取"；“空记录”；造成不良记录,csv,apache-spark,text,pyspark,Csv,Apache Spark,Text,Pyspark,我们正在读取一个以制表符分隔的.txt文件，没有值的记录缺少制表符。例如，Thor中M后面的选项卡丢失。使用Pyspark read读取文件会将记录移动到坏记录 Name Age Sex Final Cold 18 M Yes Bold 20 M No Thor 30 M Ice 40 Pyspark代码示例 source_schema = StructType([ StructField("Name", StringType(), True), St

我们正在读取一个以制表符分隔的.txt文件，没有值的记录缺少制表符。例如，Thor中M后面的选项卡丢失。使用Pyspark read读取文件会将记录移动到坏记录

Name    Age Sex Final
Cold    18  M   Yes
Bold    20  M   No
Thor    30  M
Ice 40

Pyspark代码示例

source_schema = StructType([
 StructField("Name", StringType(), True),
 StructField("Age", StringType(), True),
 StructField("Sex", StringType(), True),
 StructField("Final", StringType(), True)])

in_delimiter = "\t"

df_raw_file = sparkSession.read \
            .format("csv") \
            .option("delimiter", in_delimiter) \
            .option("header", "false") \
            .option("inferSchema", "true") \
            .option("nullValue", "null") \
            .option("treatEmptyValuesAsNulls", "true") \
            .option("columnNameOfCorruptRecord", "BAD_RECORD") \
            .schema(source_schema) \
            .load("CSV_READ.txt")

已经尝试了治疗空值空值和空值空值，但仍然没有成功，因为这些记录仍被记录在坏记录中

是否有任何其他可能的Spark选项可以尝试？
是否可以尝试显式应用模式而不是“推断模式”@Gladiator该模式被传递到读取函数源\u模式是否可以尝试显式应用模式而不是“推断模式”@Gladiator该模式被传递到读取函数源\u模式

[apache spark]相关文章推荐

随机文章推荐

Cordova 没有internet连接时的警报框-Phonegap cordova

Cordova/phonegap项目未复制模板文件 cordova

Cordova phonegap-如何在应用程序启动时禁用网络连接？ cordova

Cordova 在使用jQuery的$load方法加载的页面中触发哪些事件？ cordova jquery-mobile

流星与phonegap/cordova cordova meteor

使用cordova构建android平台时出现异常 cordova

Cordova 科尔多瓦和森查之触 cordova sencha-touch

Cordova 如何处理pushplugin的多推通知 cordova push-notification

从Cordova媒体插件上传录制 cordova

Cordova 使用sencha touch 2.4.1从iphone获取联系人 cordova

如何在phonegap Cordova中播放RTMP视频：视频扩展SDP cordova video-streaming

在cordova应用程序中加载多个视图 cordova

Cordova phonegap摄像头使应用程序崩溃 cordova camera

Cordova OnsenUI onresume重新加载应用程序 cordova

Cordova hybrid iframe应用程序集成facebook登录 cordova

Cordova 使用最新cli构建ionic 2应用程序时出错 cordova ionic2

使用electron cordova的离子3构建应用程序不可用 cordova ionic-framework

Cordova firebase云消息中的phonegap推送插件v1.10.4以获得支持 cordova firebase ionic-framework

Cordova不使用录音机录制音频 cordova

Cordova 在爱奥尼亚3移动应用程序中使用linkedin登录 cordova

[csv]相关推荐

使用AWK获取文本并在csv中循环
Csv Awk

如何让海图理解；年份类别“；在CSV文件中？
Csv Highcharts

Csv 清管器使用PigStorage（'；，'；）加载地图
Csv Map Apache Pig

使用Labview中的报告生成工具包创建CSV文件
Csv Report

Csv 在运行命令行时，有没有办法强制JMX jmeter插件生成图形？
Csv Jmeter

在批量CSV文件中添加缺少的文本
Csv

如何在java中从我的csv文件中提取url
Csv Url

Apache Pig CsvExcelStorage
Csv Apache Pig

在awk中使用条件语句解析csv
Csv Awk

Csv JMeter：有没有办法注入值；病人1077，ELLA（161号药房地址）；在输入字段中
Csv Testing Jmeter

在Apache Drill中将CSV字符串转换为多列
Csv

Csv 如何创建scikit学习数据集？
Csv Machine Learning Scikit Learn

Csv 当源为gzip时，Vertica COPY拒绝所有数据
Csv

SSIS-使用脚本任务在csv输出文件中将null值保留为null
Csv Ssis

Neo4j将属性从CSV添加到节点
Csv Neo4j

在JMeter中按列解析CSV
Csv Jmeter

使用批处理脚本将具有不同日期名称的所有csv文件合并到一个csv文件中
Csv Batch File

JMeter CSV读取不同的值-需要读取相同的值
Csv Jmeter

Neo4j LOAD CSV错误：查询无法以LOAD CSV结束
Csv Neo4j

CSV行的第一个字母移动到字段末尾
Csv Sed

SSI在CSV中重新排序列标题
Csv Ssis

从我的服务器下载*.csv
Csv Http Go

Csv Spark：没有输入文件名
Csv Apache Spark

是否有任何开放库可用于在web api core中读取/写入csv/xls文件？
Csv Import

Spark SQL使用whitepsace分隔符读取csv并忽略括号内的空格
Csv Pyspark

Csv 表格化文本文件数据
Csv Awk Sed

我需要从Mule 3.8.4 EE中的每个CSV管道分离文件创建XML
Csv Mule

如何使用akka stream alpakka编写带有标题的CSV文件？
Csv

Csv 需要在Jmeter中生成大容量文件，并上载带有| |符号的UUID文件名格式的文件
Csv Jmeter

如何阅读不同的'；通过在Go中使用CSV创建字段行？
Csv Go

Tags

Biztalk Microservices Jestjs Jboss Fluent Nhibernate Ibm Mq Requirejs Charts Stream Silverlight 4.0 Apache Kafka Ruby Netsuite Date Redis Protocol Buffers Pascal Cryptography Java 8 Vector Map Keyboard Macos Stanford Nlp Ftp Stm32 Gcc Lucene Eclipse Plugin Actions On Google Polymer Cmake Reference Socket.io Blockchain Yii2 Cassandra Drupal String Ios4 Stripe Payments Scikit Learn Junit Service Opengl Vbscript Xcode Certificate Jquery Mobile Windbg Hash If Statement Apache Flex Hyperlink Silverstripe Facebook Graph Api Jasper Reports Project Management Firefox Addon Spring Boot Datatables Sharepoint 2013 Floating Point Automation Sapui5 Couchdb Ldap Joomla Sharepoint 2010 Webview Encoding Codeigniter Ckeditor Loops Configuration Activemq Redirect Twilio For Loop Collections Google Plus Discord.py Sonarqube Julia Menu Shell Algorithm Python Sphinx Automated Tests Big O Knockout.js Transactions Iis Regex Entity Framework 4 Random Python 2.7 Jpa Browser Path Ipad Clearcase Breeze Design Patterns Highcharts Windows Phone 8.1 Leaflet Common Lisp Zurb Foundation Push Notification Scheme Actionscript Tinymce Swing Calendar Puppet Flash Kubernetes Sip Azure Service Fabric Arduino Multithreading Grafana Django Ravendb Racket Wso2 Layout Arm Ant Wicket Nunit Domain Driven Design Asterisk Delphi Compression Oop Zend Framework2 Coding Style Asp.net Web Api Tsql Jquery Plugins Groovy Editor Azure Interface Uml Com Select Javafx Web Applications Syntax Identityserver4 Directx Asp.net Mvc Apache Storm Appium Angular Material Bazel Oracle10g Ms Word Applescript Jenkins Php Material Ui Iframe Networking Nosql Terminal Npm Api Llvm Rust Jwt Sencha Touch 2 Apache Flink Vim Documentation Airflow Cocoa Markdown Instagram Dynamic Rx Java Omnet++ Asp Classic Outlook Asp.net Core Ansible Mule Twitter Bootstrap 3 Selenium Webdriver Qml Amazon Web Services Meteor Smtp Microsoft Graph Api Tree Itext Safari Visual Studio 2012

Copyright © 2024. All Rights Reserved by - Fatal编程技术网