pyspark:将字符串转换为日期格式,不含分钟、编码和小时

pyspark:将字符串转换为日期格式,不含分钟、编码和小时,pyspark,Pyspark,您好,我想将字符串日期转换为日期格式: 例如从190424年到2019-01-24年 我尝试使用以下代码: tx_wd_df = tx_wd_df.select( 'dateTransmission', from_unixtime(unix_timestamp('dateTransmission', 'yymmdd')).alias('dateTransmissionDATE') ) 但我得到了这个格式:2019-01-24 00:04:00 我只想要2019-01-24 有

您好,我想将字符串日期转换为日期格式: 例如从190424年到2019-01-24年 我尝试使用以下代码:

tx_wd_df = tx_wd_df.select(
    'dateTransmission', 
    from_unixtime(unix_timestamp('dateTransmission', 'yymmdd')).alias('dateTransmissionDATE')
)
但我得到了这个格式:2019-01-24 00:04:00 我只想要2019-01-24 有什么想法吗

谢谢

tx_wd_df.show(truncate=False)
你可以简单地使用。这将丢弃日期的其余部分,只选择与输入日期格式字符串匹配的格式

import pyspark.sql.functions as F

date_column = "dateTransmission"
# MM because mm in Java Simple Date Format is minutes, and MM is months
date_format = "yyMMdd"
df = df.withColumn(date_column, F.to_date(F.col(date_column), date_format))
你可以简单地使用。这将丢弃日期的其余部分,只选择与输入日期格式字符串匹配的格式

import pyspark.sql.functions as F

date_column = "dateTransmission"
# MM because mm in Java Simple Date Format is minutes, and MM is months
date_format = "yyMMdd"
df = df.withColumn(date_column, F.to_date(F.col(date_column), date_format))