json的Spark异常处理_Json_Scala_Exception Handling_Apache Spark - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/scala/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
json的Spark异常处理_Json_Scala_Exception Handling_Apache Spark - Fatal编程技术网

json的Spark异常处理

json scala exception-handling apache-spark

json的Spark异常处理,json,scala,exception-handling,apache-spark,Json,Scala,Exception Handling,Apache Spark,我试图在读取json文件时捕获/忽略解析错误 val DF = sqlContext.jsonFile("file") 有几行不是有效的json对象，但数据太大，无法单独通过（~1TB）我遇到过使用import scala.util.Try和in.map（a=>Try（a.toInt））引用的映射异常处理：在使用函数sqlContext.jsonFile读取json文件时，如何捕获异常谢谢不幸的是，你在这里运气不好DataFrameReader.json在引擎盖下使用，几乎是全部或全

我试图在读取json文件时捕获/忽略解析错误

val DF = sqlContext.jsonFile("file")

有几行不是有效的json对象，但数据太大，无法单独通过（~1TB）

我遇到过使用

import scala.util.Try

和

in.map（a=>Try（a.toInt））

引用的映射异常处理：

在使用函数

sqlContext.jsonFile

读取json文件时，如何捕获异常

谢谢

不幸的是，你在这里运气不好<代码>DataFrameReader.json在引擎盖下使用，几乎是全部或全部。如果输入包含格式错误的行，则必须手动筛选这些行。基本解决方案可能如下所示：

import scala.util.parsing.json._

val df = sqlContext.read.json(
    sc.textFile("file").filter(JSON.parseFull(_).isDefined)
)

由于上面的验证非常昂贵，您可能更愿意完全删除

jsonFile

/

read.json

，直接使用解析后的json行。

我是否可以建议定义

而不是匹配{…}
。谢谢，谢谢@zero323！这要慢得多，但它可以工作，让作业在夜间运行也没有什么错：）您可以尝试不同的解析库。我认为Spark在内部使用。使用mapPartitions
而不是map
也可以提高性能。在读取json时，您可以应用.option（“mode”，“DROPMALFORMED”）
忽略错误记录，或者应用.option（“mode”，“FAILFAST”）
以中断作业并出现有用的异常。




[scala]相关文章推荐



                                                        
                                       





随机文章推荐



                                                        
Content management system 谷歌网站有好的竞争对手吗？
content-management-systemservice 
Content management system mojoPortal还是Umbraco？
content-management-systemumbraco 
Content management system 匿名友好CMS
content-management-system 
Content management system 在Sitefinity 4.0中为模板布局/设计使用主文件
content-management-system 
Content management system CMS中多语言内容的数据建模？
content-management-system 
Content management system 如何为数据库构建cms？
content-management-systemcouchdb 
Content management system 简单字段Wordpress
content-management-systemwordpress 
Content management system Silverstripe 3.1.x从父级获取值
content-management-systemsilverstripe 
Content management system dct文件中与teamsite相关的新文本框
content-management-system 
Content management system 如何生成magnolia引导文件？
content-management-system


                                        

                                        
                                        


                                                
                                                        [json]相关推荐
                                                        
从json解码后无法调用方法
									Json
							 									Lua
							 
使用HTML5缓存JSON对象
									Json
							 									Html
							 
当JSON字符串包含字符串和字符串数组时，JSON序列化程序出现问题
									Json
							 									String
							 									Serialization
							 
将JSON转换为grails对象
									Json
							 									Grails
							 
Grails：无法从JUNIT Grails访问呈现的JSON对象
									Json
							 									Grails
							 									Junit
							 
Json symfony 2仅当对象为新对象时才在反序列化后保留对象
									Json
							 									Symfony
							 									Merge
							 									Doctrine Orm
							 
Json Backbone.js集合
									Json
							 									Backbone.js
							 
JSON标准-浮点数
									Json
							 									Floating Point
							 
无法在go lang中解析JSON
									Json
							 									Go
							 
Json 运行'后出错；咕噜'；
									Json
							 									Gruntjs
							 
如何使用Scala获得json中所有元素的总和？
									Json
							 									List
							 									Scala
							 
树形图<；字符串，字符串>；到json
									Json
							 									Rust
							 
SwiftyJSON不工作/Swift 1.2 SwiftyJSON文件
									Json
							 									Swift
							 
如何使用swift检索JSON数据
									Json
							 									Swift
							 
发布JSON后的代码500？
									Json
							 									Cakephp
							 
Json 解码和解码的区别是什么；来自aeson软件包的功能？
									Json
							 									Haskell
							 
在web API中更改json结果
									Json
							 
JSON模式可以指定跨字段约束吗？
									Json
							 									Validation
							 
xslt 3.0 json到xml和xml到json的转换
									Json
							 									Xml
							 									Xslt
							 
来自JSON字符串的Sh脚本JSON值
									Json
							 									Grep
							 
在scala编程语言中将jsonObject转换为Map
									Json
							 									Scala
							 
Json 自动派生所有类型的已配置编解码器
									Json
							 									Scala
							 
在Swift中访问解码JSON字典项的语法
									Json
							 									Swift
							 
在BigQuery之前使用Google云平台转换JSON，最佳实践？
									Json
							 									Google Cloud Platform
							 									Google Bigquery
							 
Json 如何对同一个值使用不同类型的结构进行封送和解封？
									Json
							 									Go
							 
将2个JSON对象与jq合并
									Json
							 									Bash
							 									Merge
							 
Json 如何解析键为'；带aray的字符串中的s值
									Json
							 									String
							 									Flutter
							 
字段API-自定义JSON字段
									Json
							 
如何从Splunk中的Json字符串中提取键值字段
									Json
							 
Terraform plan会破坏jq/json输出，但Terraform控制台不会'；T
									Json
							 									Amazon Web Services
							 									Terraform
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Spring Boot
Dynamics Crm
Vmware
Documentation
Pycharm
Indexing
Windows Phone 8.1
Android Ndk
Llvm
Windows Store Apps
Video
Junit
Embedded
Appium
Types
Compiler Errors
Assembly
Dependency Injection
Oop
Actions On Google
Caching
Xquery
Javafx
Netty
Karate
Security
Signalr
Image Processing
Stripe Payments
Jasmine
Rally
Ravendb
Linkedin
Gtk
Sqlalchemy
Dart
Unity3d
Concurrency
Terminal
Bots
Openssl
Protractor
Web Crawler
Windows 7
Xml
Phpstorm
Aws Lambda
Twitter Bootstrap
Fluent Nhibernate
Neo4j
Internet Explorer 8
Msbuild
Arduino
Join
Silverlight
Aem
.net
Maven 2
Ios
Configuration
Google Cloud Storage
Cluster Computing
Osgi
Visual C++
Visual Studio 2017
Delphi
Sdk
Asp.net Mvc 2
Sharepoint 2007
Speech Recognition
Url Rewriting
Sparql
Date
Installation
Collections
Windows 8
Sql
Service
Smtp
Qml
Soap
Xslt
Dictionary
Login
Itext
D3.js
Haskell
Oauth
Windows Phone 8
Email
Drupal 7
Mobile
Build
Design Patterns
Dynamics Crm 2011
Post
Django
Model View Controller
.net 4.0
Git
Powerbi
Postman
Reflection
Apache Pig
Jekyll
Grafana
Windows 10
Openid
Ansible
Cakephp
Elm
Jqgrid
Unicode
Server
EmptyTag
Ipython
Scripting
Winapi
Fonts
Akka
Sass
Web Scraping
Spring Cloud
Emacs
Jar
Coffeescript
Tkinter
Ant
Mono
Object
R
Here Api
Certificate
Animation
Teradata
Cygwin
C++
Android Layout
Omnet++
Sql Server 2008
Push Notification
Protocol Buffers
Matlab
Gwt
Bazel
Jupyter Notebook
Opencl
Interface
Active Directory
Wpf
Acumatica
Web Services
Version Control
Extjs
Gradle
Web
Discord
Html5 Canvas
Jquery Plugins
Drupal
Windows Mobile
Rspec
Atom Editor
Vb6
Docker Compose
Google Apps Script
Ruby On Rails
Rss
Spring Batch
Google Cloud Dataflow
Gruntjs
C++11
Bison
Character Encoding
Isabelle
Mapreduce
Go
Webstorm
Bootstrap 4
List
Glsl
Jestjs
Mercurial
Workflow
Outlook
Json
Typo3
Airflow
Cmd
Python
Syntax
If Statement
Api
Raspberry Pi
Batch File
Vhdl
Maven
Kendo Ui
Activemq
Macos
Iis


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网