R和dplyr：如何对外部数据帧使用ifelse条件_R_Dataframe_Apache Spark_Dplyr - Fatal编程技术网

R和dplyr：如何对外部数据帧使用ifelse条件

r dataframe apache-spark

R和dplyr：如何对外部数据帧使用ifelse条件,r,dataframe,apache-spark,dplyr,R,Dataframe,Apache Spark,Dplyr,我使用dplyr和spark通过mutate命令创建一个新变量。如果变量my_data_变量的值位于另一个数据帧other_df$one_列的列内，则此新变量new_变量是分类变量，必须是ALFA。因此，如果其值为它不包括在值中属于other_df$one_列我所做的一个例子： my_data %>% mutate(new_variable = ifelse(my_data_variable == other_df$one_column, "ALFA","BETA"))

我使用dplyr和spark通过mutate命令创建一个新变量。如果变量

my_data_变量

的值位于另一个数据帧

other_df$one_列

的列内，则此新变量

new_变量

是分类变量，必须是

ALFA

。因此，如果其值为它不包括在值中属于

other_df$one_列

我所做的一个例子：

my_data %>%
     mutate(new_variable = ifelse(my_data_variable == other_df$one_column, "ALFA","BETA"))

但不幸的是我犯了这个错误。甚至使用

！！其他_-df$one_列

或

本地（其他_-df[['one_列]]]）

而不是

other_df$one_列

不起作用

Error: Cannot embed a data frame in a SQL query.

If you are seeing this error in code that used to work, the most likely cause is a change dbplyr 1.4.0. Previously `df$x` or
`df[[y]]` implied that `df` was a local variable, but now you must make that explict with `!!` or `local()`, e.g., `!!df$x` or
`local(df[["y"]))

有没有替代ifelse函数的方法来获得预期结果？

感谢@Ronaksah的帮助。解决方案如下：

my_data %>% 
     mutate(new_variable = ifelse(my_data_variable %in% !!other_df$one_column, "ALFA","BETA"))

不确定这是否适用于spark，但如果您在

其他_df$one_列中有多个值

您可能应该使用

我的_数据%>%mutate（new_variable=ifelse（my_data_variable%在%other_df$one_列中，“ALFA”，“BETA”）

@RonakShah多亏了您的帮助，我现在找到了解决方案。解决方案是：my_data%>%mutate（new_variable=ifelse（my_data_variable%in%！！其他_df$one_列，“ALFA”，“BETA”））太棒了！您可能应该将其添加为答案。@PabloPicciau，只需将您的解决方案添加到下面的

您的答案区域，然后您就可以验证它；）




[dataframe]相关文章推荐



                                                        
为什么DataFrames.jl实现NA而不是使用NaN？
dataframejulia 
将Pyspark Dataframe列从数组转换为新列
dataframepyspark 
Dataframe 如何将大数据帧拆分为小数据帧？
dataframe 
Dataframe dplyr在一定数量的列上重复变异
dataframe 
Dataframe 使用列表并替换pyspark列
dataframepyspark 
PySpark DataFrame-附加单个列的随机排列
dataframerandompyspark 
Dataframe spark在写入json时截断时间戳
dataframeapache-spark 
Dataframe 过滤数据帧，同时在pyspark上保留中间副本
dataframepyspark 
Dataframe 根据特定条件在数据帧中插入行
dataframe 
Dataframe 复制Pyspark数据帧中的行
dataframeapache-sparkpyspark 
Dataframe PySpark-使用正则表达式取消PIVOT数据帧
dataframepyspark 
Dataframe：获取表A中存在但不在表B中的记录计数。表B有2900万条记录。（派斯帕克）
表A-是一个数据帧，当
distinct应用了14000条记录。
表B是一个数据帧，只有1列，2900万条记录了所有不同的值。
dataframeapache-sparkpyspark 
Dataframe 使用其他列值作为参考替换行中的特定值
dataframejulia 
Dataframe 嵌套json展平spark数据帧
dataframeapache-spark 
Dataframe 数据帧可视化：如何通过局部转置第二个索引（部分轴）进行压缩
dataframe 
根据不同列python dataframe中的空值筛选dataframe列中的值
dataframereplace 
Dataframe 在数据帧中保存跳转优化结果的紧凑方法
dataframedictionaryoptimizationjulia 
Dataframe 从旧df创建的数据帧存在问题
dataframe 
在条件下在spark dataframe中创建新列
dataframeapache-sparkpyspark 
Dataframe 如何将打印输出页（x）合并到数据帧中
dataframe 
                                       





随机文章推荐



                                                        
Apache storm 如何使用Storm将输出写入文件
apache-storm 
Apache storm 风暴用户界面不工作
apache-storm 
Apache storm 在最多一次加工的情况下，使用BaseRichBolt或BaseCBolt
apache-storm 
Apache storm 如何每秒调用nextTuple（）一定次数？
apache-storm 
Apache storm 如何实时打印挂起的元组数
apache-storm 
Apache storm storm-如何检查拓扑是否空闲或正在运行？
apache-storm 
Apache storm Storm Trident在网络分区和/或故障场景中提供一次精确保证
apache-storm 
Apache storm Apache Storm:拓扑提交异常：[x]从不存在的流订阅
apache-storm


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
如何将无空格的数据转换为以R分隔的制表符？
									R
							 									Matrix
							 
R 在A中的所有行上循环并与B中的所有列关联的智能方法
									R
							 									Performance
							 									For Loop
							 									Matrix
							 
R 比较词云查询没有意义
									R
							 
R '；原产地'；必须提供&；明确的格式
									R
							 									Csv
							 
R 使用POSIXct索引更改xts对象的特定小时数
									R
							 									Date
							 
从R中的openstreetmaps获取驾驶距离
									R
							 									Routes
							 
R 如何基于树数从多层次对象中提取？
									R
							 
R透明光栅的传单，带光泽
									R
							 									Shiny
							 									Leaflet
							 
R 将函数放在一个文件中会提高速度吗？
									R
							 									Performance
							 									Function
							 									File
							 
将整数转换为R中的日期并计算其间的天数？
									R
							 
R 使用两个不同的列表重复测量双向方差分析
									R
							 									Statistics
							 
将R中两个不同表中的值相乘
									R
							 									Matrix
							 
R-Delete停止数据帧中的字
									R
							 									Dataframe
							 
如何在R中使用apply族制作简单脚本
									R
							 									Dataframe
							 
按条件打印R中的组
									R
							 									Dataframe
							 
R 在文档术语频率中查找频繁词及其值
									R
							 									Matrix
							 
R 使用计数数据标记表示百分比的堆叠条形图
									R
							 
R组数据，确定重复项，在最早的实例上更新列
									R
							 									Select
							 
R 基于其他列滞后值的条件计算
									R
							 									If Statement
							 
“如何读取NetCDF文件”；NDVI NOAA AVHRR“；作为R中的光栅？
									R
							 
R 平均水平，但保留单身人士
									R
							 
RStudio“；“运行文档”；不生成html文件
									R
							 									Shiny
							 
R 正则表达式匹配一个数字
									R
							 									Regex
							 									Text
							 
如何在KableExtra中拆分表，从而得到两个对齐的表，而不是一个巨大的表
									R
							 
R 根据列值将数据帧从0到1拆分为X组
									R
							 									Dataframe
							 
R 根据外部函数中确定的值执行内部函数
									R
							 
R中的学生T分布
									R
							 									Statistics
							 
tidyverse中集合包含和同时处理数据的测试
									R
							 									Logic
							 
R 删除仅对数据帧的某些列重复的行
									R
							 									Dataframe
							 
在散点图R中绘制年份和月份
									R
							 									Dataframe
							 									Date
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
View
Tcp
Azure Data Factory
Visual Studio 2017
Terminal
Protocol Buffers
Influxdb
Nosql
Ocaml
Apache Zookeeper
Rx Java
Forms
Laravel
Google Maps
Netty
Ssh
Gps
Android Ndk
Button
Zend Framework
Gis
Raspberry Pi
Java 8
Amazon Dynamodb
Search
Nsis
Kotlin
Php
Ms Office
Elm
Jhipster
Linux Kernel
Responsive Design
Command Line
Netsuite
Django Rest Framework
Visual Studio 2008
Documentation
Random
Spotify
Db2
Jms
Geolocation
Openlayers 3
Asp.net Web Api
Visual C++
Loopbackjs
Virtualbox
Spring Batch
Outlook
Hive
Cordova
F#
Asp.net
Heroku
Java Me
Alfresco
Gitlab
Artificial Intelligence
Login
Linkedin
Material Ui
Ruby On Rails 3.1
Jqgrid
Continuous Integration
Parse Platform
Jira
Corda
Drupal 7
Types
Ibm Mq
File
Rally
Coding Style
Angularjs
Xpath
Marklogic
Mdx
Autocomplete
Twitter
Web
Magento
Security
Cron
Joomla
Post
Graphql
Ibm Cloud
Time
Cygwin
Postman
Ssrs 2008
Email
Odata
Windows Mobile
Video
.net Core
Stm32
Jasper Reports
Sapui5
Maven 2
Requirejs
Yocto
Karate
Spring Security
Floating Point
Centos
Multithreading
C++
Rxjs
Encryption
Gcc
Nunit
Ios8
Networking
Intellij Idea
Seo
Azure Functions
Properties
Robotframework
Project Management
Vba
Chef Infra
File Upload
Webstorm
Azure
Ionic Framework
Memory
Jar
Replace
Batch File
Arrays
Enums
Eclipse Plugin
Windows Phone 8
Google Drive Api
Xcode
Aem
Ldap
Twig
Sqlalchemy
Apache Flex
Kubernetes
Doxygen
Pointers
For Loop
Dynamic
Xampp
Functional Programming
Graph
Scripting
Artifactory
Tinymce
Mips
Isabelle
Jquery Ui
Air
Notepad++
Mqtt
Permissions
Assembly
Testng
Layout
Perl
Instagram
Rabbitmq
Phantomjs
Ruby
Animation
Webpack
Arangodb
Hybris
Omnet++
Node.js
Lua
Eclipse Rcp
Amp Html
Arduino
Lisp
Qml
Antlr4
Magento2
Parameters
Struct
Css
Laravel 5
Youtube
Syntax
Ios6
Ibm Midrange
Cocos2d Iphone
Zurb Foundation
Tags
Itext
Iphone
Dialogflow Es
Sencha Touch
Azure Devops
Calendar
Primefaces
Debian


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网