Dataframe PySpark创建带有浮点类型错误的数据帧_Dataframe_Pyspark_Apache Spark Sql_Pyspark Dataframes - Fatal编程技术网

Dataframe PySpark创建带有浮点类型错误的数据帧

dataframe pyspark

Dataframe PySpark创建带有浮点类型错误的数据帧,dataframe,pyspark,apache-spark-sql,pyspark-dataframes,Dataframe,Pyspark,Apache Spark Sql,Pyspark Dataframes,我的数据集如下：我正在使用PySpark解析数据，稍后使用以下代码创建数据帧： from pyspark.sql import SparkSession from pyspark.sql import Row from pyspark.sql import functions as f def parseInput(line): fields = line.split(',') stationID=fields[0] entryType=fields[2]

我的数据集如下：

我正在使用PySpark解析数据，稍后使用以下代码创建数据帧：

from pyspark.sql import SparkSession
from pyspark.sql import Row
from pyspark.sql import functions as f

def parseInput(line):
    fields = line.split(',')
    stationID=fields[0]
    entryType=fields[2]
    temperature= fields[3]*0.3
    return Row(stationID,entryType,temperature)

spark = SparkSession.builder.appName("MinTemperatures").getOrCreate()
lines = spark.sparkContext.textFile("data/1800.csv")
temperatures = lines.map(parseInput)
minTemps=temperatures.filter(lambda x:x[1]=='TMIN')
df = spark.createDataFrame(minTemps)

我得到以下错误：

TypeError: can't multiply sequence by non-int of type 'float'

显然，如果我从

temperature=fields[3]*0.3

中删除0.3，则创建数据帧工作。如何使用浮点数和一些基本的数学运算返回

温度？
尝试温度=浮点数（字段[3]）*0.3
尝试温度=浮点数（字段[3]）*0.3
您可以先读取文件而不进行乘法，然后将其转换为键入Double，最后进行乘法
我假设您的csv文件有头。

以下代码用于铸造：
data=data.withColumn（“COLUMN_NAME”，数据[“COLUMN_NAME]”）。强制转换（“double”））
您可以先读取文件而不进行乘法运算，然后将其转换为键入Double，最后执行乘法运算
我假设您的csv文件有头。

以下代码用于铸造：
data=data.withColumn（“COLUMN_NAME”，数据[“COLUMN_NAME]”）。强制转换（“double”））
谢谢你的回答谢谢你的回答谢谢你的回答谢谢你的回答谢谢你的回答




[pyspark]相关文章推荐



                                                        
如何提交依赖于google dataproc集群的pyspark作业
pyspark 
Pyspark 从spark api中的字符串列（日期时间戳）中提取周天数
pyspark 
Pyspark 为什么不能在spark sql中缓存后调用show方法？
pyspark 
如何使用PySpark将列转换为行
pyspark 
在PySpark中处理特定列数据类型
pyspark 
pyspark随机拆分堆栈溢出错误
pyspark 
Pyspark 如何提高存储稳定性能？
pyspark 
如何获取Pyspark中每行具有前3个最大值的列名
pyspark 
pyspark聚合的不同列的不同操作
pyspark 
聚合四舍五入值为2位小数的Pyspark Groupby
pyspark 
从pyspark读取时，Google云存储需要Storage.objects.create权限
pysparkgoogle-cloud-platformgoogle-cloud-storageairflow 
Pyspark spark dataframe列字符串到日期
pyspark 
使用pyspark展平复杂JSON模式
pyspark 
Pyspark函数对列求反
pyspark 
Pyspark 比较两个不同长度的列
pyspark 
Pyspark 插入缺少的日期行，并在新行中插入旧值
pyspark 
Pyspark ValueError:无法将列转换为布尔值：请使用'&'；对于'；和''|'；对于'；或''~'；对于'；不是'；构建数据帧布尔表达式时
pyspark 
Pyspark 根据string column和其他column 2&；的条件转换两列；3 Pybark UDF
pyspark 
带参数的pyspark-udf
pyspark 
Pyspark:stddev和分位数的窗口函数生成NaN和Null
pyspark 
                                       





随机文章推荐



                                                        
Less 指类'；s的高度小于
less 
Less 代码露营者vs.代码露营者跳跃启动
less 
Less 重新编译更少的文件-modifyVars不编译某些元素
less 
Less是否支持自定义元素？
less 
Less “harp compile”在使用bower时显示字体错误
less 
Less 不带根选择器的更少直接父选择器
less 
Less 减：将变量编译为PHP占位符
less 
Less 组合较少的混音输出
less 
Less 将较少的混合标记为可选
less


                                        

                                        
                                        


                                                
                                                        [dataframe]相关推荐
                                                        
如何使用Pyspark和Dataframes查询Elasticsearch索引
									Dataframe
							 									Pyspark
							 
Dataframe 转换数据帧的快捷方式
									Dataframe
							 									Julia
							 
Dataframe 如何使用pyspark选择数据帧中的值？
									Dataframe
							 									Pyspark
							 
Dataframe 将符号参数传递给@where，以便使用Julia选择数据帧的行
									Dataframe
							 									Julia
							 
Dataframe 如何使用python/scala从Spark中的Amazon Ion文件创建数据帧？
									Dataframe
							 									Apache Spark
							 
Dataframe Julia中数据帧名称的获取
									Dataframe
							 									Julia
							 
Dataframe 如何从文本文件创建数据框
									Dataframe
							 
使用CSV.file和Dataframes读取完整的值表文件时出现问题
									Dataframe
							 									Julia
							 
pyspark dataframe，如何将字符串列数组中的每个元素转换为LowerCase
									Dataframe
							 									Apache Spark
							 									Pyspark
							 
Dataframe 需要从第二行中减去每个ID的基线值
									Dataframe
							 									Julia
							 
如何将Julia DataFrame列中的数值转换为missing？
									Dataframe
							 									Julia
							 
Dataframe 数据帧线性插值返回列表
									Dataframe
							 
Dataframe 如何迭代danfojs数据帧
									Dataframe
							 									Loops
							 
Dataframe 在Java中从Spark数据帧中提取二进制数据
									Dataframe
							 									Apache Spark
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Menu
Sql Server 2008
Exchange Server
D
Jira
Terminal
Magento2
Iis 7
Single Sign On
Jquery Mobile
Flutter
Windows Mobile
Liferay
Map
Sharepoint 2010
Tridion
Webstorm
Asp.net
Keyboard
Ios5
Pycharm
X86
Google Apps Script
Stripe Payments
Entity Framework
Blockchain
Http
Sed
Actions On Google
Uitableview
Parsing
Ruby On Rails 4
Security
Wix
Ms Office
Xamarin.android
Parse Platform
R
Testng
Html5 Canvas
Biztalk
Asterisk
Cloud
Ide
Printing
Virtual Machine
Xpath
Mariadb
Ibm Mobilefirst
Karate
Nativescript
Recursion
Log4net
Vector
Javascript
Sparql
Web Crawler
Android Fragments
Vbscript
Magento
Cypress
Server
Object
Compression
Android Studio
Image Processing
Virtualbox
Cloud Foundry
Xamarin.ios
Deployment
Julia
Rxjs
Microservices
File Upload
Actionscript
Sbt
Jvm
Google Calendar Api
Mongoose
Jpa
Jupyter Notebook
Isabelle
Teradata
Nginx
Localization
Db2
Notepad++
Identityserver4
Iframe
Udp
Libgdx
Asp.net Mvc 4
Azure Service Fabric
Gruntjs
Shopify
Dependencies
Xslt
EmptyTag
Outlook
Wolfram Mathematica
Mapping
Git
Oracle Apex
Coq
Blazor
Processing
Drupal
Asp.net Mvc
Google Maps Api 3
Svg
Centos
Chart.js
Vue.js
Web Services
Wso2
Teamcity
Visual Studio 2008
Memory Management
Smtp
Domain Driven Design
Cobol
Activemq
Ssh
Unix
Push Notification
Content Management System
Documentation
Windbg
Doctrine Orm
Doxygen
Unicode
Pip
Openssl
Permissions
Apache Pig
Nuget
Prolog
Vb.net
Migration
Nhibernate
Sprite Kit
Architecture
Geolocation
Keycloak
Listview
Email
Testing
Acumatica
Jquery Plugins
Java 8
Reflection
Jekyll
Open Source
Selenium Webdriver
Netty
Kdb
Video Streaming
Elm
Vaadin
Google Colaboratory
Jsf 2
Database Design
Raspberry Pi
Intellij Idea
Amazon S3
Fluent Nhibernate
Neo4j
Visual Studio
Clojure
Tags
Three.js
Transactions
Lambda
Zend Framework
Racket
Discord.py
Material Ui
Workflow
Configuration
Frameworks
Ms Access
Caching
Command Line
Windows Phone 8.1
Mqtt
Batch File
Telegram
Logic
Ssl
Sdk
String
Authentication
Antlr
Encoding
Gitlab
Winforms
Akka
Silverlight
Parallel Processing
View
Hadoop


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网