数据帧列scala中的spark streaming JSON值_Json_Scala_Spark Streaming - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/json/13.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
数据帧列scala中的spark streaming JSON值_Json_Scala_Spark Streaming - Fatal编程技术网

数据帧列scala中的spark streaming JSON值

json scala

数据帧列scala中的spark streaming JSON值,json,scala,spark-streaming,Json,Scala,Spark Streaming,我有一个带有json值的文本文件。这会被读入DF {"name":"Michael"} {"name":"Andy", "age":30} 我想在流式传输时动态推断每一行的模式，并根据其模式将其存储在不同的位置（表）不幸的是，当我尝试读取value.schema时，它仍然显示为字符串。由于流媒体中不允许使用RDD，请提供有关如何在流媒体上执行此操作的帮助我想使用以下代码，但它不起作用，因为值仍然是以字符串格式读取的 val jsonSchema = newdf1.select("value

我有一个带有json值的文本文件。这会被读入DF

{"name":"Michael"}
{"name":"Andy", "age":30}

我想在流式传输时动态推断每一行的模式，并根据其模式将其存储在不同的位置（表）
不幸的是，当我尝试读取value.schema时，它仍然显示为字符串。由于流媒体中不允许使用RDD，请提供有关如何在流媒体上执行此操作的帮助
我想使用以下代码，但它不起作用，因为值仍然是以字符串格式读取的

val jsonSchema = newdf1.select("value").as[String].schema val df1 = newdf1.select(from_json($"value", jsonSchema).alias("value_new")) val df2 = df1.select("value_new.*")
我甚至试着用

schema_of_json("json_schema")) val jsonSchema: String = newdf.select(schema_of_json(col("value".toString))).as[String].first()

还是没有希望。。请帮助..
您可以将数据加载为文本文件，为person创建case类，并使用json4s或gson将每个json字符串解析为person实例，然后按如下方式创建数据框：

case class Person(name: String, age: Int) val jsons = spark.read.textFile("/my/input") val persons = jsons.map{json => toPerson(json) //instead of 'toPerson' actually parse with json4s or gson to return Person instance} val df = sqlContext.createDataFrame(persons)
使用json4s将json反序列化到case类：

使用gson将json反序列化到case类：

谢谢Ofek，但是如果我给case类或structtype，它就会变成一个静态模式。但我希望我的流媒体能够读取数据并自行生成动态模式。。

[scala]相关文章推荐

Scala 为什么单例对象更面向对象？ scala

Scala 如何动态设置提升代码段的参数？ scala

Scala 递归函数不返回Int scala recursion functional-programming

Scala Play2 Framework代理流式传输内容到客户端在流式传输完成后保持连接打开 scala streaming playframework-2.0

如何代理scala 2.10.3的静态快照 scala sbt

向量数组按字段之一求和-scala scala vector

Can'；看来Future无法在Scala中运行回调 scala

如何更改滚动窗格（JavaFX/ScalaFX）的背景？ scala javafx

Scala Json4s:尝试将Json属性转换为java.sql.Date时出现问题 scala

Scala 使用sbt控制台的类Shell应用程序 scala sbt

Scala 如何让sbt任务使用控制台参数调用项目代码 scala sbt

Scala 将并行集合的内容写入文件 scala apache-spark

scalapb和自定义源生成器冲突 scala sbt

Scala 将Spark数据帧Groupby转换为数据帧序列 scala apache-spark

Scala Spark中导入lib的问题 scala apache-spark

在Scala中的元组列表上使用groupBy scala

Scala Akka grpc带平板缓冲器怎么样？ scala protocol-buffers

Scala samza KafkayStemFactory.getAdmin上出现异常 scala apache-kafka

Ciris.ConfigDecoder在scala中到底做了什么 scala

Scala InvalidQueryException用于查询日期列：无法从以下位置生成未签名的int（用于日期）：'；1601856000000'； scala cassandra

随机文章推荐

Routes 在Ember中定义资源路由的正确方法？ routes ember.js

Routes PHP Silex路由基本url routes

从InitialRouteStack的第一条路线开始 routes react-native

Routes RouteCollection.yml中的中间件 routes

Routes 下一个js-控制返回按钮 routes next.js

[json]相关推荐

Tags

Electron Glsl Rdf Generics Amazon Ec2 Windows Phone 8 Eclipse Plugin Atom Editor Azure Service Fabric Session Deployment Google Compute Engine Uiview Visual Studio 2008 Opencv Leaflet D3.js Reporting Services Autodesk Forge Linkedin Objective C Wolfram Mathematica Fullcalendar Wcf Google Plus Stata Browser Xpages Angular6 Transactions Cron Editor Mod Rewrite Unix Optimization Perl Seo Doxygen Latex Ffmpeg Reference Post Django Models Axapta Spotify Discord Tomcat Datatables Logstash Openid Breeze Javafx 2 Discord.py Exception Entity Framework 4 Spring Mvc Video Streaming Redis Serialization Nativescript Struct Extjs Methods Flutter Extjs4 Botframework Uitableview Openshift Canvas Spring Batch Bash Asp.net Mvc Ruby On Rails 3.1 Java 8 Playframework Actionscript 3 Magento List Ubuntu Asp.net Mvc 4 Cloud Opengl Es Firefox Ruby On Rails 4 C Shiny Xslt Java Cluster Computing Prometheus Parsing Google Cloud Dataflow Firebase Mapreduce Testng Visual Studio 2017 Sugarcrm Visual C++ Angularjs Mdx Antlr Uwp C# 4.0 Air Hyperlink Gitlab Knockout.js Jquery Virtualbox Activerecord For Loop Cocos2d Iphone Google Cloud Firestore Vaadin Kotlin Octave Rally Ravendb X86 Quickbooks Oracle11g Xsd Asp.net Core Opengl Symfony Rss Tags Sml Symfony1 Vue.js Makefile Version Control Discord.js Scala Mercurial Sapui5 Scheme Codeigniter Oop Character Encoding Content Management System Continuous Integration Svn Robotframework Jar Apache Spark Drupal Logging Datetime Xna Z3 Servlets Postman Swing Neo4j Asp Classic Automated Tests Apache Zookeeper Outlook Puppet Regex Azure Ad B2c Blackberry Colors Serial Port Smtp Lotus Notes Nsis Twitter Clojure Sencha Touch 2 Oracle Yii2 Ms Access Import Junit Typo3 Safari Twitter Bootstrap Modelica Image Moodle Install4j Amazon Redshift Udp Graphql Passwords Machine Learning Ionic Framework Google Bigquery Matplotlib Fiware Xamarin.ios Umbraco Entity Framework Core Aurelia Com Kubernetes Cryptography Orientdb Apache Storm

Copyright © 2024. All Rights Reserved by - Fatal编程技术网