Pyspark dataframe:从混合类型列中删除decimal

Pyspark dataframe:从混合类型列中删除decimal,pyspark,Pyspark,我正在研究一个pyspark数据帧,它有一列具有混合类型的数据。如下- Id 1234.0 A234 F456 345.0 567 45.0 K231 我想把小数部分从任何地方去掉。下面应该是这样的- Id 1234 A234 F456 345 567 45 K231 无法将其转换为int类型,因为它包含混合数据。我们如何实现它使用regexp\u replace删除尾部的.0-我认为您可以使用类似(?

我正在研究一个pyspark数据帧,它有一列具有混合类型的数据。如下-

Id
1234.0
A234
F456
345.0
567
45.0
K231
我想把小数部分从任何地方去掉。下面应该是这样的-

Id
1234
A234
F456
345
567
45
K231

无法将其转换为int类型,因为它包含混合数据。我们如何实现它

使用
regexp\u replace
删除尾部的
.0
-我认为您可以使用类似
(?