Python 如何捕获pyspark foreachPartition的日志输出？_Python_Pyspark_Spark Streaming - Fatal编程技术网

Python 如何捕获pyspark foreachPartition的日志输出？

python pyspark

Python 如何捕获pyspark foreachPartition的日志输出？,python,pyspark,spark-streaming,Python,Pyspark,Spark Streaming,皮斯帕克当我在foreachRdd方法中使用print（）时，它就工作了 def echo(data): print data .... lines = MQTTUtils.createStream(ssc, brokerUrl, topics) topic_rdd = lines.map(lambda x: get_topic_rdd(x)).filter(lambda x: x[0]!= None) topic_rdd.foreachRDD(lambda x: echo(x)) 我可

皮斯帕克

当我在foreachRdd方法中使用print（）时，它就工作了

def echo(data):
print data
....
lines = MQTTUtils.createStream(ssc, brokerUrl, topics)

topic_rdd = lines.map(lambda x: get_topic_rdd(x)).filter(lambda x: x[0]!= None)

topic_rdd.foreachRDD(lambda x: echo(x))

我可以看到登录控制台上有火花

但是如果我使用foreachPartition方法，它就看不到print（）的任何日志

如果我想查看日志，我需要输入不同的分区来查看日志？我可以在单控制台中查看日志吗？顺便说一下，我可以在单控制台中使用scala而不是python查看日志。

rdd.foreachRDD运行在驱动程序节点上，该节点将消息发送到终端
rdd.foreachPartition正在worker节点上运行，该节点将消息发送到worker的终端，您看不到这一点
如果您想查看日志，只需将它们另存为文件

topic_rdd = lines.map(lambda x: get_topic_rdd(x)).filter(lambda x: x[0]!= None) topic_rdd.foreachRDD(lambda x: x.foreachPartition(lambda y: echo(y)))

[pyspark]相关文章推荐

在pyspark数据框中显示不同的列值：python pyspark

Can'；t在浏览器（windows 10）中启动PySpark pyspark jupyter-notebook

Pyspark 按组查找所有组合 pyspark

Pyspark 使用groupBy获取Spark列中的模式（最常见）值 pyspark

Pyspark数据帧元数据 pyspark

数据过滤时忽略Pyspark中的大小写 pyspark

Pyspark 将列表的列转换为Dataframe pyspark

Pyspark 无法通过spark流媒体读取kakfa消息 pyspark apache-kafka

使用pyspark解析要在特定位置拆分的文本文件 pyspark

Pyspark 从azure数据库中删除azure sql数据库行 pyspark azure-sql-database

尝试更改pyspark中的数据类型时获取null pyspark

使用dataframe中的值作为字符串调用pyspark中的函数 pyspark

Pyspark 如何以小时而不是秒过滤时间戳？ pyspark

Pyspark 删除数据帧中的重复列 pyspark

pyspark使用与上次非空值相关的计算替换空值 pyspark

Pyspark--如何左合并数据帧 pyspark

Pyspark flatMapValues（整个列表、元素列表） pyspark

Pyspark AnalysisException:无法解析给定的输入列： pyspark

Pyspark提高了多列操作的性能 pyspark

Pyspark Pypark中的累积移动平均值 pyspark

随机文章推荐

Gremlin 按源节点小精灵筛选节点 gremlin

为什么Gremlin JavaScript使用；从“uquot；映射而不是“映射”；从；？ gremlin

Gremlin 关于repeat（）功能的查询。直到（）为止 gremlin

Gremlin 如何返回单个对象而不是数组中的单个项？ gremlin

Gremlin step.map.PropertyMapStep无法转换为step.ByModulating gremlin

Gremlin 小精灵合并步骤不一致（Cosmos DB/一般情况下？） gremlin

使用Gremlin，如何像从外顶点返回属性一样从内顶点返回属性？（不作为数组） gremlin

Gremlin 如何查询顶点与具有相同标签的其他顶点之间是否有多条边 gremlin

Gremlin Cosmos DB:图形-查询所有嵌套顶点&；边缘 gremlin

Gremlin 如何在janusgraph中将数组设置为属性？ gremlin

匿名遍历与正常遍历gremlin gremlin

[python]相关推荐

Python 未定义提供强连接检查的Networkx
Python

Python igraph中的图像缩放有什么问题？
Python Plot

Python 如何将PostgreSQL数据库链接到Django 1.9？窗户
Python Django Database Postgresql

如何在python中调用列/行
Python

Python 从c+；自动生成cython声明+；代码为了在Cython代码中使用C++类，需要编写。是否有生成这些声明的工具自动从C++头文件中自动获得？如果不是，这是否是不常见的原因练习，这就是为什么我可能不应该尝试这样做？我不相信有。我相信为
Python C++

Python 将Facebook广告代币升级为；基本的；
Python Facebook Facebook Graph Api

Python3.3+；中的包是否不需要uu init_uuuuuuuuuuuuuuupy.py；
Python Python 3.x

python：导入不带分隔符的平面文本文件
Python Regex Text Import

Python 如何更新列数据帧数据？
Python Pandas Dataframe

Python 在字典中放置函数
Python

Python 在机器学习和深度学习项目中进行分析之前，我是否应该重新组合训练集和测试集？
Python Pandas Machine Learning Scikit Learn Deep Learning

如何制作python'；s替换忽略转义字符
Python

Python 使用makedirs将文件夹转换为csv文件
Python

Python来确定数组何时不再显著增加或减少
Python Arrays Pandas

如何使用python中的osmnx将图形保存为.osm格式？
Python Graph

Python 如何在字典中正确显示长字符串？
Python String Dictionary

Python 检查未知类型的参数
Python Python 3.x If Statement

Python 正在尝试在列表中创建列表
Python

如果我必须要求用户从所描述的字典中选择一个选项，我将如何在python中使用if语句？
Python

Python requests.get（）返回空结果
Python Python 3.x

Python Tkinter文本未按预期显示
Python Tkinter

Python Tkinter-如何在画布中包含小部件？
Python Python 3.x Tkinter

计算Python中使用元类的实例数
Python

Python 如何在定义自己的函数时迭代列表中的条目
Python Pandas List Function

Python TIF到JPEG转换-无此类文件或目录
Python Pycharm

尝试用python了解元音和常量
Python

Python 如何使用openCV准确检测此图片上的棕色/黑色/灰色/白色
Python Opencv Colors

Python csv.writer编码'；utf-8'；，但是阅读编码'；cp1252'；
Python Python 3.x Csv

Python 发现今天和今天的差异'；s日期和输入的日期
Python

Python 从dict中的值获取密钥
Python Dictionary

Tags

Autohotkey Cuda Netty Facebook Graph Api Ftp Sqlite Android Emulator Extjs4 Authentication Grafana Logstash Latex Xamarin.forms Php Swiftui Matrix Openlayers 3 Tfs Webview Azure Cosmosdb Compression Safari Lambda Twitter Bootstrap .net 4.0 Exchange Server Cocos2d X Silverlight 4.0 Netsuite Material Ui Jsp Xpath Aem Cookies Gcc Rss Ffmpeg Windbg Yii2 Compiler Construction Random Airflow Cron Silverlight EmptyTag Subsonic Socket.io Regex Mapping Input Ibm Mobilefirst Jpa Google Api Sencha Touch 2 Streaming Character Encoding Asp.net Mvc 2 Facebook Import Salesforce Azure Devops Unity3d Signalr Influxdb Jar Iphone Azure Functions Llvm Vb6 Nsis Class Asp.net Mvc 4 Cassandra Amazon Ec2 Path Com Scrapy Android Fragments Checkbox Asterisk Module Ethereum Codeigniter Curl Windows Phone 8 Wcf Jvm Reactjs Tinymce Sequelize.js Symfony1 Tkinter Heroku Plot Cucumber Drupal 7 Excel Text Jekyll Rabbitmq Datatables Ios6 Jquery Plugins Mapbox Keyboard Monitoring Bash Amazon Dynamodb C# 3.0 Recursion Shopify Eclipse Rcp Layout Nservicebus Pine Script Azure Data Factory Webgl 3d Ant Teradata Express Directx Julia Kentico Azure Yocto Extjs Login Hazelcast Camera Maven 2 Ms Office Mqtt Cryptography Model View Controller Uwp Fonts Autodesk Forge Teamcity Markdown Enums Stream React Native View Adobe Canvas Kernel Ckeditor Gatsby Jquery Office365 Sockets Perl Laravel 5 Apache2 Doctrine Microsoft Graph Api Single Sign On Gulp Antlr Windows Services Netlogo Vmware Swift2 Selenium Webdriver Http Backbone.js Websphere Spring Cloud Clearcase Reflection Gnuplot Openid Migration C# 4.0 Postman Wpf Requirejs Ios7 Libgdx Maps Ocaml Gitlab Openshift Haskell Reference Video Streaming Office Js Itext Internationalization Dynamic Visual Studio 2008 Jersey Wordpress Macros Join Kubernetes Phpmyadmin Keycloak Json Apache Kafka

Copyright © 2024. All Rights Reserved by - Fatal编程技术网