Scala-如何调用RESTAPI并在HDFS中另存为json文件？_Json_Scala_Rest_Apache Spark_Hdfs - Fatal编程技术网

Scala-如何调用RESTAPI并在HDFS中另存为json文件？

json scala rest apache-spark

Scala-如何调用RESTAPI并在HDFS中另存为json文件？,json,scala,rest,apache-spark,hdfs,Json,Scala,Rest,Apache Spark,Hdfs,环境：Scala和spark 1.6 我正在尝试- 1.通过RESTAPI调用获取json数据 2.以json文件的形式写入HDFS 3.将json文件转换为数据帧 val rawdata = "curl http://services.groupkt.com/state/get/USA/all"!! println(rawdata) // can see json output, but can't save as file in HDFS 我可以在屏幕上看到输出，但如何将原始数据的内容写

环境：Scala和spark 1.6

我正在尝试-
1.通过RESTAPI调用获取json数据
2.以json文件的形式写入HDFS 3.将json文件转换为数据帧

val rawdata = "curl http://services.groupkt.com/state/get/USA/all"!!
println(rawdata)  // can see json output, but can't save as file in HDFS

我可以在屏幕上看到输出，但如何将原始数据的内容写入HDFSURL(hdfs://quickstart.cloudera:8020/user/hive/warehouse/test/)? 或者有没有办法不保存为文件而获取原始数据的内容？我还需要将json转换为dataframe

提前感谢
侯赛因

val rawdata = "curl http://services.groupkt.com/state/get/USA/all"!!
println(rawdata)

一旦您有了

数据

，您就可以使用此数据中的代码将其保存在

Hadoop

中

创建数据帧：

假设您的json字符串如下所示：

{"time":"sometext1","host":"somehost1","event":  {"category":"sometext2","computerName":"somecomputer1"}}

您可以从以下代码将

json转换为数据帧

：

// Creating Rdd    
val vals = sc.parallelize(
  """{"time":"sometext1","host":"somehost1","event":  {"category":"sometext2","computerName":"somecomputer1"}}""" ::
    Nil)

// Creating Schema   
val schema = (new StructType)
  .add("time", StringType)
  .add("host", StringType)
  .add("event", (new StructType)
    .add("category", StringType)
    .add("computerName", StringType))

import sqlContext.implicits._
val jsonDF = sqlContext.read.schema(schema).json(vals)

创建

dataframe

后，您仍然可以选择使用lib或使用RDD
上的
saveAsTextFile
方法将其保存在
hadoop
中。

[scala]相关文章推荐

带有额外约束的Scala无形状KList scala

如何添加模块来使用Scala？ scala playframework-2.0 sbt

Scala 尾部递归列出给定文件位置的所有子目录 scala

Scala 如何在执行过程中为确切的插件添加库依赖项？ scala sbt

scala使用选项实现二叉树结束节点 scala

Scala 为什么要在中使用“Try”来理解？ scala exception-handling functional-programming

Scala 替换RDD的某些元素 scala apache-spark

Scala 如何使用不变的设计跟踪依赖关系？ scala functional-programming

Scala 如何使用密钥作为文件名，使用值作为内容将文件保存在Spark PairRDD中？ scala apache-spark

Scala 类型失配；找到：列表[Double.type]必需：列表[Double] scala

在scala spark运行时设置目录权限 scala hadoop apache-spark pyspark

Scala 如果方法不'；你没有完全相同的签名吗？ scala oop inheritance

Scala sparkml：数据去规范化 scala apache-spark dataframe machine-learning

如何使用普通Scala集合压缩HList？ scala

如何在Scala模式匹配中抛出异常？ scala exception

Scala slick.jdbc.SetParameter[List[Int]]的隐式值 scala

Scala 带有HList形状的光滑拉链连接在运行时显示为元组 scala generics

Scala 如何在不使用大内存的情况下编写功能性和可并行化的代码？ scala functional-programming

Scala 如何使用spark内部映射创建laod文件 scala apache-spark

Scala 在可变列数的数据帧中查找最需要的1 scala apache-spark

随机文章推荐

Stata的行为完全不同，这取决于我是否在注释中使用分号 stata

Stata 将观察值复制到同一变量内的空条目中 stata

如何使用Stata标准化变量中的观察值 stata

将headers（）和rename（）与coefplot（Stata）相结合 stata

Stata 如果某一特定年份的变量缺少值，则删除整个面板id/公司 stata

Stata 更改变量的单个值 stata

Stata 如何在不替换的情况下进行比例分层抽样？ stata

是否将整个文件读入Stata宏变量？ stata

Stata：使用forvalue循环标记变量 stata

创建重复的观测值作为Stata中的变量进行比较 stata

Stata 按字母顺序对字符串变量中的字母进行排序 stata

Stata 无法在graph note（）参数中显示统计信息 stata

Stata 在宏中将数字序列生成为字符串 stata

Stata 如何删除所有缺少的值？ stata

Stata 通过将具有相同名称后缀的变量相乘来创建变量 stata

Stata 条形图的位置 stata

[json]相关推荐

在KRL中使用Json
Json

如何将JSON数据放入CoffeeScript？
Json Coffeescript

通过JSON对象显示我的数组时出现问题
Json Jquery

在json编码的字段上查找CakePHP
Json Model

Json 从我的谷歌+；页
Json Api Events Google Plus

Json 从ResourceBundle注入注释值
Json Spring Spring Mvc

Json 无法调用类型为'；对象'；迅速地
Json Swift

如何在MVC中将JSON有效负载中的值插入数据库？
Json Asp.net Mvc Vb.net

Json 配置单元服务器处理嵌套结构时出现问题
Json Struct Hive

Json MongoDB中的招摇过市引用对象（$ref）
Json Mongodb Swagger

Json 变量具有特殊字符时如何使用jq
Json

Spring引导-实体到json-递归
Json Spring Hibernate

R:json到data.frame的向量
Json R

Json 从Postman中的对象数组中提取值
Json Postman

Json 正文中的Http Post字符串值
Json Ajax Angular Http Post

可以引用JSON整数属性吗？
Json

将复杂的JSON文件解析为CSV[魔法聚集]
Json Python 3.x Csv Parsing

用wreq在Haskell中遍历JSON-关键问题
Json Haskell

在Docker映像中使用本地json文件运行Swagger
Json Docker Swagger

彻底编写JSON对象类型的正确方法
Json Typescript

Json PerlHTTP微小响应
Json Perl Http

Json Django框架的Haystack替代方案是什么？简述
Json Django Nosql

Json AWS IAM基于IAM用户限制S3访问（前缀）的策略'；s标签
Json Amazon Web Services Amazon S3

Json firebase安全规则中的访问属性
Json Firebase

Json 调用CreatePolicyVersion操作时发生错误（AccessDenied）
Json Amazon Web Services Amazon Ec2

Json 如何在ansible add_主机模块中使用set_fact打印数组变量
Json Ansible

在Django中，当从AJAX视图发送响应时，如何在JSON中呈现queryset中的字段字段？
Json Django Serialization

Json 颤振-无实例getter'；长度'；错误
Json Flutter Dart

如何在angular中使用带有类图的图形可视化Json对象
Json Angular

ElasticSearch特定JSON
Json

Tags

Gnuplot E Commerce Cluster Computing Soap Composer Php Dynamics Crm 2011 Geometry Silverlight 4.0 Twitter Bootstrap 3 Mdx Mvvm Sed .net Sas Cmake Spring Security Dart Active Directory Ionic2 Laravel 4 Vhdl Rx Java Yocto Webstorm Mongodb C++11 Umbraco Types Magento Vue.js Cookies User Interface Open Source Xna Scrapy Indexing Ecmascript 6 Mercurial Big O Character Encoding Bots Wicket Automation Youtube Cocoa Touch Bootstrap 4 Twilio Ada Heroku Firefox Addon Asp.net Mvc 5 Macros Windows Phone 8.1 Graph Graphviz Apache2 Java Me Csv Google Chrome Extension Facebook Visual Studio 2012 C# 4.0 X86 Ios7 Parse Platform Twitter Bootstrap Libgdx Codenameone Exception Sql Server 2012 Camera Ubuntu Mfc Single Sign On Templates Methods Backbone.js Amazon Cloudformation Webgl Qml Lua Macos Aurelia Jmeter Jasmine R Sapui5 File Upload Hive Identityserver4 Math Office365 Jar Asp Classic Corda Influxdb Ldap Logstash Ravendb Localization Ios5 Data Binding Phantomjs Replace Jpa Apache Zookeeper Actions On Google Three.js Iframe Kdb Python 3.x Arduino Dll Error Handling .htaccess Collections Udp Webview Yii Performance Sap Xcode Sphinx Objective C Google Calendar Api Animation Seo Django Rest Framework Jquery Mobile Amp Html Mapping Google Cloud Platform Octave Mapbox Ant Elm Liferay Reference Syntax Orm Reporting Services Scroll Botframework Marklogic Swing Openlayers Uml Jsf Documentation Ipython Hyperlink Antlr Gatsby Stm32 Model View Controller Tableau Api Quickbooks Ocaml Go Intellij Idea Google App Engine If Statement Python Resharper Sharepoint 2007 Symfony Air Filesystems Swift2 Visual Studio Devexpress Opencart Regex Windows 10 Api Discord.js Sequelize.js Github Openlayers 3 Version Control Linux Kernel Antlr4 Excel Oop Gmail Netsuite Ibm Mq Artifactory Tcl Pentaho Python Sphinx Visual C++ Snmp Matlab Google Plus Scikit Learn Youtube Api Button Stripe Payments Compiler Errors Hazelcast

Copyright © 2024. All Rights Reserved by - Fatal编程技术网