Spark流式处理XML文件并将其转换为数据帧_Xml_Scala_Xml Parsing_Spark Streaming_Spark Structured Streaming - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/xml/15.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/scala/16.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Spark流式处理XML文件并将其转换为数据帧_Xml_Scala_Xml Parsing_Spark Streaming_Spark Structured Streaming - Fatal编程技术网

Spark流式处理XML文件并将其转换为数据帧

xml scala

Spark流式处理XML文件并将其转换为数据帧,xml,scala,xml-parsing,spark-streaming,spark-structured-streaming,Xml,Scala,Xml Parsing,Spark Streaming,Spark Structured Streaming,我的目标是：使用Spark从Kafka主题或任何其他HDF流式传输POS日志（XML文件）将流数据转换为Spark数据帧分析结果数据帧并将其存储为csv 为了确定我在做什么，我现在正在尝试使用sparkshell在本地运行它。POS日志XML文件每1-2秒使用python脚本生成一次。批次间隔设置为15秒 val ssc=新的StreamingContext（sc，秒（15））将XML流设置为：val XML_stream=ssc.fileStream（路径）如何有效地将xml\u流

我的目标是：

使用Spark从Kafka主题或任何其他HDF流式传输POS日志（XML文件）

将流数据转换为Spark数据帧

分析结果数据帧并将其存储为csv

为了确定我在做什么，我现在正在尝试使用

sparkshell

在本地运行它。POS日志XML文件每1-2秒使用python脚本生成一次。批次间隔设置为15秒

val ssc=新的StreamingContext（sc，秒（15））
将XML流设置为：val XML_stream=ssc.fileStream（路径）
如何有效地将xml\u流
转换为Spark数据帧

我偶然发现了这个包裹。但是，对于如何在从XML文件生成的Dstream
上使用它，它没有给出太多的想法
我现在使用的是scala
，因为pySpark
只支持textFileStream




[scala]相关文章推荐



                                                        
                                       





随机文章推荐



                                                        
Flutter 颤振容器高度与母体高度相同
flutter 
Flutter 如何在有状态或无状态小部件之外访问BuildContext？
flutter 
Flutter 如何从列表中访问上下文<；小部件>；？
flutterdart 
Flutter 如果要滑动的项目很多，滑块将挂起
flutterdart 
Flutter 颤振中的异步Listview更新
flutter 
Flutter 关于flatter中的'native'关键字
flutterdart 
Flutter 有效的飞镖警告要避开飞镖。改为使用内置的
flutterdart 
Flutter 如何以编程方式在颤振中获取Android导航栏的高度和宽度？
flutter 
Flutter 扑腾火焰与国际化？
flutterdartinternationalization 
Flutter 具有设定大小和位移动问题的颤振/省道列表
flutterdart 
Flutter 未处理的异常：未找到MaterialLocalization
flutter 
Flutter 颤振Web：预渲染列表视图
flutter 
Flutter 运行时Http包和JsonPlaceholder中出错
flutterdart 
Flutter 颤振-如何更改收音机背景颜色
flutterbutton 
Flutter 颤振：使用按钮输入静态文本
flutter 
Flutter Flatter workmanager不使用服务定位器？
flutter 
Flutter 如何在颤振中获取未来数据
flutterdart 
Flutter 我如何识别哪些颤振包阻止其他人更新到最新版本？
flutter 
Flutter 在http包中使用get方法时发生颤振抛出错误
flutterdart 
Flutter 切换选项卡上的指针动画
flutter


                                        

                                        
                                        


                                                
                                                        [xml]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Swiftui
Multithreading
Angular Material
Airflow
Tags
Java
Maven
Autocomplete
Linux Kernel
Db2
Activemq
Django Models
Appium
Path
Uiview
Wix
Hash
Jdbc
Libgdx
Firefox
Shiny
Printing
Grails
Spring
Html
Neural Network
Iphone
Jquery Plugins
Internet Explorer
Woocommerce
Recursion
Sphinx
Pyspark
Stream
Visual Studio Code
Orchardcms
Xquery
Google Colaboratory
Unix
Maven 2
Intellij Idea
Linkedin
Symfony
Gcc
Silverlight 4.0
Sass
Typo3
Winapi
Virtual Machine
Caching
Sharepoint 2010
Pdf
Lua
Text
Amazon Dynamodb
Wcf
Monitoring
Mule
Windows 7
Netbeans
Python
Xcode
Google Compute Engine
Struct
Browser
Omnet++
Nlp
Apache Storm
Liferay
Project Management
Flutter
Azure Data Factory
Symfony1
Ipython
Javafx 2
Checkbox
Numpy
Menu
Ocaml
Xna
Regex
Protocol Buffers
Navigation
Mapreduce
Io
Jms
Arduino
Sqlalchemy
React Native
Cakephp
Couchdb
Glassfish
Paypal
Drop Down Menu
Markdown
Dll
List
Spring Integration
Ldap
Safari
Influxdb
Autohotkey
Google Cloud Dataflow
Gis
Facebook Graph Api
Workflow
Floating Point
Android
Common Lisp
Dart
Sed
Jpa
Jsf
Google Cloud Storage
Post
Visual Studio 2017
Kibana
3d
Cmd
Oop
Aem
Ide
Geolocation
Automated Tests
Redirect
Amazon Web Services
Mono
Parameters
Django Rest Framework
Arrays
Svg
Interface
Apache Zookeeper
Layout
Phpstorm
Docker Compose
Compiler Errors
Modelica
Sms
Ssh
Exception
Pine Script
Exchange Server
Ip
Terminal
Next.js
Clearcase
Openshift
Mongodb
If Statement
Camera
Spotify
Tridion
Coq
Bison
Angularjs
Perforce
Telegram
Karate
Core Data
Active Directory
Filter
Sockets
Pointers
Google Calendar Api
Google Cloud Platform
Data Structures
Asterisk
C++
Unicode
Jquery
Jersey
Colors
Ios7
Ssis
Unity3d
Doctrine
E Commerce
Android Studio
Seo
Msbuild
Open Source
Ruby
Coffeescript
Azure
Service
Servlets
Hadoop
Passwords
Linq
Jquery Ui
Syntax
Ibm Cloud
Amazon Ec2
Coldfusion
Pip
Yii
Stm32
Ravendb
Youtube
Anaconda


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网