Python PySpark：从字符串中提取小时和分钟_Python_Pyspark_Databricks - Fatal编程技术网

Python PySpark：从字符串中提取小时和分钟

python pyspark

Python PySpark：从字符串中提取小时和分钟,python,pyspark,databricks,Python,Pyspark,Databricks,我正在寻求帮助，了解如何从PySpark中的字符串中分别提取小时和分钟： df = spark.createDataFrame([['1325'], ['1433'], ['730']], ['time']) df = df.withColumn("time", to_timestamp("time")) # cast timestamp display(df) # example timestamp results time 1 1325-01-

我正在寻求帮助，了解如何从PySpark中的字符串中分别提取小时和分钟：

df = spark.createDataFrame([['1325'], ['1433'], ['730']], ['time'])
df = df.withColumn("time", to_timestamp("time"))  # cast timestamp
display(df)

# example timestamp results
  time
1 1325-01-01T00:00:00.000-0500
2 1433-01-01T00:00:00.000-0500
3 null

我不确定该怎么做，将其转换为unixtime、date和timestamp都不能很好地与这种类型的字符串数据配合

理想情况下，我希望它返回：

  time  hour  minutes
1 1325   13     25
2 1433   14     33
3 730    7      30

IIUC，您可以尝试的一种方法是使用模式
（？=\d\d$）
拆分字符串，然后从结果数组中提取小时/分钟：

from pyspark.sql import functions as F df.withColumn('hm', F.split(F.lpad('time',4,'0'), '(?=\d\d$)')) \ .selectExpr('time', 'int(hm[0]) as hour', 'int(hm[1]) as minutes') \ .show() +----+----+-------+ |time|hour|minutes| +----+----+-------+ |1325| 13| 25| |1433| 14| 33| | 730| 7| 30| | 2| 0| 2| +----+----+-------+

太棒了，我想知道你是否能处理这样的边缘案例：
df=spark.createDataFrame（[[1325]，[1433]，[730]，[2']，[time']）
其中
2
将是午夜后2分钟。

[pyspark]相关文章推荐

Pyspark:ValueError pyspark

Pyspark 使用RDD list作为数据帧筛选器操作的参数 pyspark

Pyspark 带子字符串的Pypark alter列 pyspark

pyspark:两个日期列之间的小时差 pyspark

Pyspark 获取系列的第一次/最后一次出现的日期 pyspark

pyspark按上下文计算每列和组中NA的数量 pyspark

创建虚拟变量框架pyspark pyspark

Pyspark 我有一张桌子；t'；有两列'；col24'；和'；col23'；我想创建一个数据帧'；r'； pyspark

Pyspark根据另一列的模式替换列中的字符串 pyspark

Pivot table和pyspark中的onehot pyspark

如何使用pyspark在连接条件下使用聚合函数 pyspark

Pyspark 为什么最大的函数会抛出错误 pyspark

PySpark中的联接表条件：如果点位于多边形内 pyspark gis

Pyspark 获取窗口上的总行数 pyspark

Pyspark 按与同一数据帧的其他行相对应的数据选择行 pyspark

PySpark UDF不返回预期结果 pyspark

设置PYSPARK“提交”参数="--名称“&引用；Pypsparkshell“&引用；Pypark shell“&&；jupyter笔记本 pyspark

pyspark中每3个月的平均销售额 pyspark

转换和重命名1000+；有Pyspark的专栏？ pyspark

如何在由2个有序列组成的组上添加行索引，以便针对pyspark数据帧，为每个组重新启动行索引？ pyspark

随机文章推荐

Data binding 数据绑定到DataGridView（枚举+集合） data-binding

Data binding 将WPF菜单项绑定到WPF选项卡控件项集合 data-binding

Data binding 对象重新分配时的数据绑定/属性更改通知（Silverlight 4/C） data-binding silverlight-4.0

Data binding spring mvc绑定到两个具有相同字段的对象中 data-binding spring-mvc

Data binding 将代码中的简单数据绑定到DependencyProperty data-binding silverlight-4.0

Data binding 数据绑定不在Form.Controls集合中的DataGridView控件？ data-binding

Data binding MVVM：当我更改对象本身时，如何通知每个对象属性的更改？ data-binding mvvm

Data binding 如何通过OpenXML在内容控件中插入文本格式 data-binding

Data binding 我有具体的表格数据，我如何用双向结合的聚合物来表示？ data-binding polymer

Data binding 如何创建自定义绑定以在每次-*例程创建/销毁视图时获得回调？ data-binding

Data binding E4应用程序使用xml绑定从xsd生成部件 data-binding

Data binding 数据绑定到重复控件中的docitem（获取并设置！） data-binding xpages

Data binding 当页面上的自定义视图中发生属性更改时，如何调用页面的代码隐藏方法 data-binding xamarin.forms

[python]相关推荐

Windows 7上的Python/Django环境
Python Mysql Django Apache Xampp

如何使用python实现实时股价流
Python

Python 优雅的代码保存方式，无需使用；“如果……其他声明”；
Python Performance Optimization

Python 如何应用scikit learn'；一些十进制数据的逻辑回归？
Python Machine Learning Scikit Learn

Python中具有多种数据类型的3D数组
Python Arrays Python 2.7 Numpy

为什么'；t python3.x有'end='\n"；`为fileIO？
Python Python 3.x

Python 如何在函数中使用多处理？
Python Python 3.x

Python 使用tc延迟传入流量会影响主机和VM
Python Linux

Python：对于列表中的每个元组，检查元组中是否有字符串
Python List

Python 根据时间增量和索引修改列值
Python Numpy Pandas

python中的多列索引匹配
Python Pandas Numpy Dataframe Merge

Python 如何以列表/目录的形式读取文件？
Python List File Dictionary

Python 使用Scipy执行暴力力量优化时，最佳值超出范围
Python Numpy Optimization

Python 在Ubuntu 16.04上使用bazel从源代码构建张量流。错误为--->；规则'的链接//tensorflow/contrib/lite/toco:toco'；失败（退出1）
Python Bazel

Python 如何获取方法'；s"；args"；使用ipdb时参数值是否在？
Python Debugging

Python 防止内存滥用
Python Memory Flask

Python 如何在numpy中执行堆叠/元素矩阵向量乘法？
Python Numpy

python生成器中的一行中的多个for
Python List For Loop

windows python解释器杀死C++；退出时工作线程静默我有一个用C++编写的Python扩展模块。在模块中，有一些工作线程在后台执行一些清理工作。我需要确保在退出应用程序之前确实完成了清理，我在静态变量的析构函数中签入了该应用程序
Python C++ Multithreading

python如何从csv文件更改时间格式
Python Dataframe Time

Python google chrome无法在flask应用程序中使用selenium启动
Python Selenium Google Chrome Ubuntu Selenium Webdriver

Python Juypter笔记本显示空白页
Python Anaconda Jupyter Notebook

Python 如何在服务器上运行selenium脚本
Python Selenium

Python 为什么可以调用超类没有的方法
Python Python 2.7

python中有没有一种方法可以从google工作表中计算一系列行（从第一行有数据到最后一行有数据）？
Python Python 3.x

无法通过Selenium（Python）按类名找到div
Python Selenium Xpath

Python 如何访问调用者库中的变量？
Python

Python 用随机森林预测未来事件
Python

Python 无法安装Psutil Linux Bash
Python Linux Bash

Python 绘制时间序列数据
Python Matplotlib

Tags

Swiftui Multithreading Angular Material Airflow Tags Java Maven Autocomplete Linux Kernel Db2 Activemq Django Models Appium Path Uiview Wix Hash Jdbc Libgdx Firefox Shiny Printing Grails Spring Html Neural Network Iphone Jquery Plugins Internet Explorer Woocommerce Recursion Sphinx Pyspark Stream Visual Studio Code Orchardcms Xquery Google Colaboratory Unix Maven 2 Intellij Idea Linkedin Symfony Gcc Silverlight 4.0 Sass Typo3 Winapi Virtual Machine Caching Sharepoint 2010 Pdf Lua Text Amazon Dynamodb Wcf Monitoring Mule Windows 7 Netbeans Python Xcode Google Compute Engine Struct Browser Omnet++ Nlp Apache Storm Liferay Project Management Flutter Azure Data Factory Symfony1 Ipython Javafx 2 Checkbox Numpy Menu Ocaml Xna Regex Protocol Buffers Navigation Mapreduce Io Jms Arduino Sqlalchemy React Native Cakephp Couchdb Glassfish Paypal Drop Down Menu Markdown Dll List Spring Integration Ldap Safari Influxdb Autohotkey Google Cloud Dataflow Gis Facebook Graph Api Workflow Floating Point Android Common Lisp Dart Sed Jpa Jsf Google Cloud Storage Post Visual Studio 2017 Kibana 3d Cmd Oop Aem Ide Geolocation Automated Tests Redirect Amazon Web Services Mono Parameters Django Rest Framework Arrays Svg Interface Apache Zookeeper Layout Phpstorm Docker Compose Compiler Errors Modelica Sms Ssh Exception Pine Script Exchange Server Ip Terminal Next.js Clearcase Openshift Mongodb If Statement Camera Spotify Tridion Coq Bison Angularjs Perforce Telegram Karate Core Data Active Directory Filter Sockets Pointers Google Calendar Api Google Cloud Platform Data Structures Asterisk C++ Unicode Jquery Jersey Colors Ios7 Ssis Unity3d Doctrine E Commerce Android Studio Seo Msbuild Open Source Ruby Coffeescript Azure Service Servlets Hadoop Passwords Linq Jquery Ui Syntax Ibm Cloud Amazon Ec2 Coldfusion Pip Yii Stm32 Ravendb Youtube Anaconda

Copyright © 2024. All Rights Reserved by - Fatal编程技术网