如何在pyspark-dataframe中将月份名称更改为其他语言

如何在pyspark-dataframe中将月份名称更改为其他语言,dataframe,pyspark,settings,databricks,Dataframe,Pyspark,Settings,Databricks,我正在尝试使用以下配置为Databrick上的日期创建一个表: 获取日期范围 dateFrom=dbutils.widgets.getdate\u from dateTo=dbutils.widgets.getdate\u to dateDF_TESTE=spark.sqlSELECT sequenceto_date'{0}',to_date'{1}',间隔1天作为date.formatdateFrom,dateTo\ .选择F.explodedate.别名的DSC\U日期 但是,当我添加包含这

我正在尝试使用以下配置为Databrick上的日期创建一个表:

获取日期范围 dateFrom=dbutils.widgets.getdate\u from dateTo=dbutils.widgets.getdate\u to dateDF_TESTE=spark.sqlSELECT sequenceto_date'{0}',to_date'{1}',间隔1天作为date.formatdateFrom,dateTo\ .选择F.explodedate.别名的DSC\U日期 但是,当我添加包含这些数据的列时,我只获得了英文信息,例如月份名称或一周中的几天

我打算将此信息更改为另一种语言葡萄牙语,但没有成功。我尝试过使用locale,但它不起作用

导入区域设置 使用用户的默认设置 locale.setlocalelocale.LC_ALL,“pt_pt.utf8”
由于Spark 3.0,因此可以在单个柱上使用。to_csv接受与标准csv编写器相同的参数,因此可以在此处设置区域设置:

从pyspark.sql导入函数为F dateDF_TESTE.with column格式化的_date, F.to_csvF.struct F.colDSC_日期, {dateFormat:EEEE,d'de'MMMM'de'yyyy,区域设置:pt,引号:}\ .showtruncate=False,n=5 印刷品

+-----+------------------+ |DSC|U日期|格式化|U日期| +-----+------------------+ |2020-01-01 | 2020年里约热内卢1号费拉广场| |2020-01-02 |金塔费拉,2020年里约热内卢2号| |2020-01-03 |塞克斯塔·费拉,2020年里约热内卢3号| |2020-01-04 |萨巴多,2020年里约热内卢4号| |2020-01-05 | 2020年里约热内卢5号多明戈| +-----+------------------+ 仅显示前5行