Python Databricks Koalas基于另一列值Lambda函数的列分配_Python_Databricks_Spark Koalas - Fatal编程技术网

Python Databricks Koalas基于另一列值Lambda函数的列分配

python

Python Databricks Koalas基于另一列值Lambda函数的列分配,python,databricks,spark-koalas,Python,Databricks,Spark Koalas,给定考拉数据帧： df = ks.DataFrame({"high_risk": [0, 1, 0, 1, 1], "medium_risk": [1, 0, 0, 0, 0] }) 运行lambda函数以基于现有列值获取新列： df = df.assign(risk=lambda x: "High" if x.high_risk else ("Medium" if x.medium_risk else "Low")

给定考拉数据帧：

df = ks.DataFrame({"high_risk": [0, 1, 0, 1, 1], 
                   "medium_risk": [1, 0, 0, 0, 0]
                   })

运行lambda函数以基于现有列值获取新列：

df = df.assign(risk=lambda x: "High" if x.high_risk else ("Medium" if x.medium_risk else "Low"))
df
Out[72]: 
   high_risk  medium_risk  risk
0          0            1  High
4          1            0  High
1          1            0  High
2          0            0  High
3          1            0  High

预期回报：

       high_risk  medium_risk  risk
    0          0            1  Medium
    4          1            0  High
    1          1            0  High
    2          0            0  Low
    3          1            0  High

为什么这会为每个值指定“高”。其目的是对每一行进行操作，是不是要查看比较中的整个列？

对考拉df使用

assign

对我来说似乎不容易，但对于您的情况，我将

mul

列“high_risk”乘以2，然后

添加列“Middle_risk”，最后映射结果，以“high”替换2（因为之前将列乘以2）1乘以“中等”，0乘以“低”，例如：
df = df.assign(risk= df.high_risk.mul(2).add(df.medium_risk)
                       .map({0:'low', 1:'medium', 2:'high'}))
df
   high_risk  medium_risk    risk
0          0            1  medium
1          1            0    high
2          0            0     low
3          1            0    high
4          1            0    high

注意：如果在“高风险”和“中风险”列中都有1，则此操作将失败。
是否必须使用assign
，因为现在按您想要的方式使用它似乎很复杂？我考虑了一个解决方案，但不确定计算成本是否为非强制性，但是，我的理解是考拉不支持：df[“risk”]=df[]用于列分配。




[migration]相关文章推荐



                                                        
Migration Jira API AddBase64EncodeAttachmentsToIssue不工作状态=已关闭
migrationjira 
Migration Openlaszlo embed.js问题
migration 
Migration 从SVN迁移到GIT时；主干“；已经改变了好几次
migration 
Migration 大型机迁移到USS/Github
migration 
Migration 如何在Symfony 5中为mysql数据库运行特定迁移？
migration 
Migration 如何在TYPO3 v10中访问$GLOBALS['；TSFE'；]
migrationtypo3 
                                       





随机文章推荐



                                                        
Coq 关于构造器匹配的证明_
coq 
利用Coq的简单图论证明
coq 
Coq 将模式传递给战术
coq 
Coq 常数的定义与符号
coq 
由自然数表示的Coq不动点定义。（n+；1）'；s类型的类型取决于（n）'；s类型）
coq 
如何更改Coq IDE中的显示样式以匹配Coqtop？
coq 
Coq中关于共导惰性列表的等式证明
coq 
如何使用Coq GenericMinMax证明有关REAL的事实
coq 
Coq 在用户定义的战术模式中使用`
coq 
Coq 如何在VST工具中使用分离逻辑描述双链路
coq 
Coq 使用ssreflect进行子类型化
coq 
如何获得Coq的原始密钥绑定？
coq 
Coq ssreflect finset理解中的使用条件
coq 
利用Coq场公理
coq 
Coq 版本v勒乌反对称
coq 
如何在coq中扩展语法？
coq 
Coq 将无穷级数的存在性证明转换为给出该无穷级数的函数
coq 
Coq 如何正式撰写声明？
coq 
Coq无法统一——如何改变假设？
coq


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python 无法将自定义字段添加到django注册
									Python
							 									Django
							 
Python Google应用程序引擎BlobProperty返回过时内容
									Python
							 									Google App Engine
							 
定义一个；不动产-就像Python 2.7中的decorator一样
									Python
							 
Python 如何让用户指定一个数字，而不让错误返回给我？
									Python
							 									Python 2.7
							 
python没有'；t使用更新的pip-scipy包
									Python
							 									Numpy
							 									Pip
							 
Python 成长型matplotlib条形图
									Python
							 									Charts
							 									Matplotlib
							 
python配置单元客户端pyhs2无法识别'；其中'；sql语句中的子句
									Python
							 									Sql
							 									Hive
							 
Python 使用最大值筛选数据
									Python
							 									Django
							 									Django Models
							 
Python中使用numpy数组的高效元素乘法
									Python
							 									Arrays
							 									Numpy
							 
Python 如何使用django-ejabberd桥对用户进行身份验证
									Python
							 									Django
							 
Python程序突然结束，我可以'；破译错误
									Python
							 									Mysql
							 
Python（pandas）将多个日期时间快速映射到其系列索引？
									Python
							 									Datetime
							 									Optimization
							 									Pandas
							 
Python TypeError:randint（）正好接受3个参数（给定4个）
									Python
							 									Random
							 
Azure python SDK-从资源组中删除或取消分配VM
									Python
							 									Azure
							 
Python Scipy&x27；带复数的s-leastsq
									Python
							 									Numpy
							 
使用LLDB'；从内存地址读取N个字节；s的Python API
									Python
							 
重新编制python数据框架的索引正在创建NaN值
									Python
							 									Pandas
							 
Python ValueError:无法将字符串转换为浮点：'-0274697\n'；
									Python
							 
如何在python中读取url，然后在网站上打印每个url？
									Python
							 									Shell
							 
Python PTVSD Visual Studio版本不匹配
									Python
							 									Linux
							 									Visual Studio
							 									Visual Studio 2013
							 
Python 使用堆栈按单个列索引多个列
									Python
							 									Pandas
							 
Python 连接或添加数组的元素
									Python
							 									Numpy
							 
即使满足条件，While循环也会继续（使用Python）
									Python
							 									Python 2.7
							 
如何在python中填充pandas dataframe列中的静态数值并将其作为索引？
									Python
							 									Pandas
							 									Dataframe
							 									Indexing
							 
Python 识别输入字符串中的唯一字母和相应计数
									Python
							 									String
							 									List
							 									Dictionary
							 
Python 了解CTC的TF实现是如何工作的
									Python
							 									Python 3.x
							 									Tensorflow
							 
python中的Bash命令
									Python
							 
Python 代码是什么意思？self.plusOne（数字[：-1]）数字。扩展（[0]）
									Python
							 
Python 为什么可以'；不要在pygame中输入任何内容？
									Python
							 
Python 如何迭代和访问字典中的单个值
									Python
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Tsql
Biztalk
Installation
Big O
Dynamic
EmptyTag
Sphinx
Visual Studio
Cygwin
Loopbackjs
Apache Storm
Mule
Wix
Oauth 2.0
Meteor
Sockets
Makefile
Continuous Integration
Synchronization
Clearcase
Tfs
Uml
Clang
Swiftui
Grafana
Serial Port
Ms Access
Windows Phone
Github
Sms
3d
Electron
Domain Driven Design
Button
Deep Learning
Rxjs
Operating System
Primefaces
Plone
Woocommerce
Outlook
Hibernate
Coffeescript
Prestashop
Google Plus
Ruby
Openssl
Cocoa
Firebase
Tree
Join
Functional Programming
Rest
Reference
Text
Usb
Discord.js
Logic
Sitecore
Ionic Framework
Actions On Google
Hbase
Cryptography
Sql Server 2008 R2
Input
Hyperledger Fabric
Google Calendar Api
Imagemagick
Pentaho
For Loop
Animation
Objective C
Visual Studio 2010
Asp.net Core
Google Api
Iis
Visual Studio 2008
Asp Classic
Netlogo
Jetty
Maps
Triggers
Tridion
Utf 8
Drupal
Javascript
Jvm
Sublimetext3
Apache2
Acumatica
Kibana
Time
Checkbox
Graphviz
Fluent Nhibernate
Libgdx
Kubernetes
Cloud
Ios8
Mono
Crystal Reports
Dask
Highcharts
Linux Kernel
Xamarin.android
Zsh
Instagram
Arrays
Install4j
Youtube Api
Xpath
Blackberry
Mod Rewrite
Sublimetext2
Emacs
Keras
Opencart
Python
Ssis
Routes
Xampp
Gps
Ipython
Dom
Webpack
Cocoa Touch
Yaml
Three.js
D
Colors
Pagination
Powershell
Couchbase
Liferay
Tomcat
Docker
Entity Framework
Rust
Ocaml
Graphql
Maven 2
Jsp
Azure Active Directory
Memory
Camera
Documentation
Azure Functions
List
C++
Xamarin
Qt4
Bluetooth
Wso2
Menu
Android Fragments
Pdf
Path
Apache Kafka
Blazor
Image
Tags
Protractor
Batch File
Java 8
Spring Integration
Session
Unicode
Ide
Akka
Replace
Parallel Processing
Charts
Java
Boost
Mysql
Exchange Server
Jupyter Notebook
Db2
Sharepoint
Prometheus
Azure Service Fabric
Programming Languages
Soap
Windbg
Gdb
Sql
Web Scraping
Zurb Foundation
Linux
Jaxb
Playframework 2.0
Excel Formula
Twilio
Collections
Jestjs
Lua
Amazon Cloudformation
Aframe
Sdk
Tcp
Plot


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网