Json 未能将数据放入pyspark中所需的架构_Json_Apache Spark_Pyspark - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/json/13.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Json 未能将数据放入pyspark中所需的架构_Json_Apache Spark_Pyspark - Fatal编程技术网

Json 未能将数据放入pyspark中所需的架构

json apache-spark pyspark

Json 未能将数据放入pyspark中所需的架构,json,apache-spark,pyspark,Json,Apache Spark,Pyspark,我有pyspark数据框架，如下所示 >>> df.show(1, False) {"data":{"probability":0.2345,"customerId":1234567,"region":"BR"},"uploadedDate":

我有pyspark数据框架，如下所示

>>> df.show(1, False)                                                           
{"data":{"probability":0.2345,"customerId":1234567,"region":"BR"},"uploadedDate":1542548806295}

上面是当我没有传递任何模式作为输入时的输出

我正在尝试按照下面的脚本加载带有上述模式的数据

SCHEMA = StructType([ StructField('probabilityMale',LongType(),True),\
                    StructField('customerId',LongType(),True),\
                    StructField('region',StringType(),True),\
                    StructField('uploadedDate',StringType(),True)])

df = spark.read.format('csv').\
     option('header','false').\
     option('delimiter','\t').\
     schema(SCHEMA).\
     load(path)

但这并没有在单独的列中给出所有数据点。我还尝试了

inferSchema

df = spark.read.format('csv').\
     option('header','false').\
     option('delimiter','\t').\
     option("inferSchema", "true").\
     load(path)

但获得与前面提到的相同的输出

如何提及模式并在每列中包含数据？

您有一个JSON输入，应该使用JSON读取器而不是CSV读取器读取：

df = spark.read.json(path)

要单独获取列，可以展开结构

数据：
df2 = df.select('data.*', 'uploadedDate')




[apache spark]相关文章推荐



                                                        
Apache spark “线程中的异常”；“主要”；java.lang.IllegalStateException:库目录'/Users/dbl/spark/lib#u managed/jars'；不存在
apache-spark 
Apache spark 关于在spark中保存模型文件
apache-spark 
Apache spark Spark:与RDD[LabeledPoint]并集的尺寸不匹配错误
apache-spark 
Apache spark Spark SQL—隐式创建模式与；编程的
apache-spark 
Apache spark 当我们在数据帧上运行sql更新时，Apache spark sql沿袭是如何演变的？
apache-spark 
Apache spark 如何在spark数据帧上使用超前滞后窗口进行过滤？
apache-sparkdataframefilter 
Apache spark 使用ApacheSpark处理来自web的文件
apache-spark 
Apache spark 在spark流式转换中使用共享可变状态
apache-sparkignite 
Apache spark 将python与spark dataframes结合使用如何过滤具有列值的数组
apache-sparkdataframepyspark 
Apache spark 从hdfs读取并写入oracle 12
apache-spark 
Apache spark ETL-SFTP服务器到配置单元表
apache-spark 
Apache spark SecurityManager：已禁用身份验证；ui ACL被禁用；具有查看权限的用户：
apache-spark 
Apache spark ApacheSpark是直接从RDBMS处理数据的正确选择吗？
apache-spark 
Apache spark spark中用于添加新列的withcolumn（）未显示结果
apache-spark 
Apache spark Spark-执行器心跳在X毫秒后超时
apache-spark 
Apache spark Spark sql拼花地板压缩设置似乎不起作用
apache-spark 
Apache spark 根据数据框中的bin值替换单元格值
apache-sparkpyspark 
Apache spark 如何使用Spark Streaming与Azure EventHub和HDFS blob一起识别数据拷贝延迟
apache-spark 
Apache spark 在pyspark[非pandas]中为数据帧的每一行调用函数
apache-sparkpyspark 
Apache spark 根据pyspark数据帧的两列添加唯一标识符
apache-sparkpyspark 
                                       





随机文章推荐



                                                        
Sorting Silverlight 3数据网格（带PagedCollectionView）RowGroupHeaderStyles未重新应用于排序
sorting 
Sorting 按日期列出的SSRS值
sortingdatereporting-services 
Sorting 可以将自平衡二叉搜索树应用于对象吗？
sortinglanguage-agnostictree 
Sorting XSL按标题排序
sorting 
Sorting 在Elount和会话中对相关表格的结果进行排序
sortinglaravellaravel-4 
Sorting 在计算每个字符数之后，我需要对结果进行排序
sortingpython-2.7 
Sorting 说谎
问题：考虑排序N项的问题，在算法执行中比较甲骨文允许最多放置一次。复杂性是根据所使用的比较次数（oracle咨询）来衡量的。演示如何在此模型中仅使用nlgn+O（n）比较对n个项目进行排序，并给出算法和正确性证明
sorting 
Sorting 使用谷歌表单创建可排序、排名的列表
sortinggoogle-sheets 
Sorting 使用SORT命令从Redis中的排序集获取散列字段
sortingredis 
Sorting 弹性搜索对字符串本身中的单词进行排序，而不是对整个结果进行排序
sorting 
Sorting 选择排序算法交换
sorting 
Sorting Joda DateTime数组按日期时间排序数组
sortingdatetime 
Sorting groovy脚本中的弹性搜索返回列表
sortinggroovy 
Sorting 关联Cakephp 3上的简单计数和排序
sortingcakephp 
Sorting 选择存储在列中的多个可能值
sorting 
Sorting 皮卡德·索萨姆，加速？
sorting 
Sorting 康陶新闻的分类
sorting 
Sorting 除了教人们排序的基本知识外，冒泡排序还有其他用途吗？
sorting 
Sorting 按Lua中的值对表进行关联排序
sortinglua 
Sorting 按查询获取分组小计Cassandra
sortingcassandra


                                        

                                        
                                        


                                                
                                                        [json]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Biztalk
Microservices
Jestjs
Jboss
Fluent Nhibernate
Ibm Mq
Requirejs
Charts
Stream
Silverlight 4.0
Apache Kafka
Ruby
Netsuite
Date
Redis
Protocol Buffers
Pascal
Cryptography
Java 8
Vector
Map
Keyboard
Macos
Stanford Nlp
Ftp
Stm32
Gcc
Lucene
Eclipse Plugin
Actions On Google
Polymer
Cmake
Reference
Socket.io
Blockchain
Yii2
Cassandra
Drupal
String
Ios4
Stripe Payments
Scikit Learn
Junit
Service
Opengl
Vbscript
Xcode
Certificate
Jquery Mobile
Windbg
Hash
If Statement
Apache Flex
Hyperlink
Silverstripe
Facebook Graph Api
Jasper Reports
Project Management
Firefox Addon
Spring Boot
Datatables
Sharepoint 2013
Floating Point
Automation
Sapui5
Couchdb
Ldap
Joomla
Sharepoint 2010
Webview
Encoding
Codeigniter
Ckeditor
Loops
Configuration
Activemq
Redirect
Twilio
For Loop
Collections
Google Plus
Discord.py
Sonarqube
Julia
Menu
Shell
Algorithm
Python Sphinx
Automated Tests
Big O
Knockout.js
Transactions
Iis
Regex
Entity Framework 4
Random
Python 2.7
Jpa
Browser
Path
Ipad
Clearcase
Breeze
Design Patterns
Highcharts
Windows Phone 8.1
Leaflet
Common Lisp
Zurb Foundation
Push Notification
Scheme
Actionscript
Tinymce
Swing
Calendar
Puppet
Flash
Kubernetes
Sip
Azure Service Fabric
Arduino
Multithreading
Grafana
Django
Ravendb
Racket
Wso2
Layout
Arm
Ant
Wicket
Nunit
Domain Driven Design
Asterisk
Delphi
Compression
Oop
Zend Framework2
Coding Style
Asp.net Web Api
Tsql
Jquery Plugins
Groovy
Editor
Azure
Interface
Uml
Com
Select
Javafx
Web Applications
Syntax
Identityserver4
Directx
Asp.net Mvc
Apache Storm
Appium
Angular Material
Bazel
Oracle10g
Ms Word
Applescript
Jenkins
Php
Material Ui
Iframe
Networking
Nosql
Terminal
Npm
Api
Llvm
Rust
Jwt
Sencha Touch 2
Apache Flink
Vim
Documentation
Airflow
Cocoa
Markdown
Instagram
Dynamic
Rx Java
Omnet++
Asp Classic
Outlook
Asp.net Core
Ansible
Mule
Twitter Bootstrap 3
Selenium Webdriver
Qml
Amazon Web Services
Meteor
Smtp
Microsoft Graph Api
Tree
Itext
Safari
Visual Studio 2012


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网