SparkR：如何提取特定列中包含空值的行_R_Dataframe_Sparkr - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/82.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
SparkR：如何提取特定列中包含空值的行_R_Dataframe_Sparkr - Fatal编程技术网

SparkR：如何提取特定列中包含空值的行

r dataframe

SparkR：如何提取特定列中包含空值的行,r,dataframe,sparkr,R,Dataframe,Sparkr,免责声明：我对SparkR几乎没有经验采用以下数据帧： ID Date1 Date2 58844880 04/11/16 NaN 59745846 04/12/16 04/14/16 59743311 04/13/16 NaN 59745848 04/14/16 04/11/16 59598413 NaN NaN 59745921 04/14/16 04/14/16 59561199

免责声明：我对SparkR几乎没有经验

采用以下数据帧：

ID          Date1       Date2
58844880    04/11/16    NaN
59745846    04/12/16    04/14/16
59743311    04/13/16    NaN
59745848    04/14/16    04/11/16
59598413    NaN         NaN
59745921    04/14/16    04/14/16
59561199    04/15/16    04/15/16
NaN         04/16/16    04/16/16
59561198    NaN         04/17/16

我只想获取Date 2列中包含

NaN

的行

在R中，我将使用

new_DF可以使用filter
和条件isNull
类似：
DF2 <- SparkR::filter(DF,  isNull(DF$Date2))

DF2这里有一个选项使用sparklyr

library(sparklyr)
library(dplyr)

con <- spark_connect(master = "local")
DF1 = copy_to(con, DF)


DF1 %>%
   mutate_at(vars(matches("Date")), 
          funs(to_date(from_unixtime(unix_timestamp(., "MM/dd/yy"))))) %>%
   filter(is.na(Date2)) %>%
   collect()
# A tibble: 3 x 3
#        ID Date1      Date2     
#     <dbl> <date>     <date>    
#1 58844880 2016-04-10 NA        
#2 59743311 2016-04-12 NA        
#3 59598413 NA         NA      

spark_disconnect(con)

库（年）
图书馆（dplyr）
con%
在（变量（匹配（“日期”））发生变异，
funs（到日期（从unixtime（unix）时间戳（，“MM/dd/yy”！））%>%
筛选器（is.na（Date2））%>%
收集
#一个tibble:3x3
#ID Date1 Date2
#               
#158844880 2016-04-10北美
#259743311 2016-04-12北美
#359598413 NA NA
火花塞断开（con）

数据
DF
DF <- structure(list(ID = c(58844880, 59745846, 59743311, 59745848, 
 59598413, 59745921, 59561199, NaN, 59561198), Date1 = c("04/11/16", 
 "04/12/16", "04/13/16", "04/14/16", "NaN", "04/14/16", "04/15/16", 
 "04/16/16", "NaN"), Date2 = c("NaN", "04/14/16", "NaN", "04/11/16", 
 "NaN", "04/14/16", "04/15/16", "04/16/16", "04/17/16")), .Names = c("ID", 
 "Date1", "Date2"), class = "data.frame", row.names = c(NA, -9L
 ))




[dataframe]相关文章推荐



                                                        
Dataframe 熊猫从数据帧获取共享
dataframepandas 
Dataframe 如何在Julia中将IndexedTable转换为数据帧？
dataframejulia 
Dataframe 并行化pyspark 2.2.0数据帧分区写入S3
dataframeamazon-s3parallel-processingpyspark 
Dataframe 如何用Julia数据帧中缺少的值替换伪值？
dataframejulia 
Dataframe 熊猫的条件分组与转置
dataframe 
Dataframe 如何在IndexedTable中添加/编辑值？
dataframejulia 
Dataframe Spark shell中的toDF在哪里，如何与Vector、Seq或其他一起使用？
dataframeapache-spark 
Dataframe 对数据帧中的特定行求和
dataframedatatables 
Dataframe Spark SQL：当groupBy（）中的另一列为max value时，获取该列的值。agg（）
dataframeapache-spark 
Dataframe groupByKey能否用于优化和减少计算工作量
dataframeapache-spark 
Dataframe Pypark在循环中重复
dataframeapache-sparkoptimizationpyspark 
Dataframe 以长格式转换宽数据
dataframe 
dataframe所有列上的transform函数
dataframejulia 
Dataframe 如何在R中从包含部分销售额与月份的聚合数据中准备逐月时间序列数据？
dataframe 
Dataframe Pyspark-将具有2种时间格式的列的时间格式转换为通用时间格式
dataframeapache-sparkdatetimepyspark 
Dataframe dask-计数向量器返回“；ValueError（'；无法推断带有'dask.delayed'参数的数据帧元数据'；）”；
dataframedask 
Dataframe 是否可以根据此代码创建热图
dataframematplotlib 
                                       





随机文章推荐



                                                        
在Sitecore 6.4中存储匿名访问者的个性化详细信息
sitecore 
Sitecore 更改给定源时在WFM中呈现单选列表的方式
sitecore 
如何防止sitecore将~添加到映像路径？
sitecore 
Sitecore页面预览在多站点设置中询问无效站点
sitecore 
Sitecore 安装打包6.2错误
sitecore 
Sitecore sc：输出原始字段值的图像
sitecore 
Sitecore WFFM电子邮件验证在发布包含类型为'；的字段的表单时导致InvalidCastException；SimpleType/Email'；
sitecore 
Sitecore 8.0上列表管理器中的收件人计数不正确
sitecore 
Sitecore，用户在更新常规链接字段时没有“插入外部链接、插入媒体链接等”
sitecore 
Sitecore 对于某些用户，EXM电子邮件中的链接已断开
sitecore 
Sitecore 8.0以编程方式向列表中添加联系人
sitecore 
如何以编程方式从Content Delivery Server发布SiteCore 8.0中的项目？
sitecore 
来自'的无效强制转换；System.String'；至'；Sitecore.Analytics.Reporting.Filters.IDataSourceFilterFactory
sitecore 
在Sitecore中筛选Sitecore中的子项
sitecore 
如何在使用Sitecore占位符和SXA列拆分器组件时避免重复divs.row？
sitecore 
需要Sitecore A/B测试结果摘要暴露\以下快照体验效果、速率等中提到的某些参数的计算
sitecore


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Linq
Html5 Canvas
Selenium Webdriver
Azure Ad B2c
Svn
Windows 10
Prestashop
Sharepoint
Webstorm
Rspec
Devexpress
Windows Store Apps
Ravendb
D3.js
Gtk
Openerp
Install4j
Combobox
Uiview
Neo4j
Odata
Coding Style
Doctrine Orm
Wpf
Cmake
Terraform
Android
Postman
Email
Inheritance
Netbeans
C# 4.0
Windows Runtime
Smtp
Tcp
Gulp
Checkbox
Tomcat
Linker
Matplotlib
Computer Science
Orientdb
Matrix
Blackberry
Google Apps Script
Cocos2d X
C#
Operating System
Graphql
Report
Layout
Interface
Angular Material
Google Visualization
Openid
Authentication
Ember.js
Winapi
Mod Rewrite
Razor
Encoding
Bash
Azure Active Directory
Aem
Routing
Maps
Db2
Openlayers
Routes
Windows Mobile
Sprite Kit
Login
Xml
Recursion
Shell
Build
Database
Spring Batch
Browser
Express
Ms Word
Sqlite
Nsis
Cmd
Xmpp
Nest
Macros
Server
Haskell
Arangodb
Asp.net Core
Visual Studio 2010
Performance
Hibernate
Sharepoint 2010
Tinymce
Dictionary
Optimization
Jaxb
Batch File
Fiware
Pyspark
Csv
Amazon Dynamodb
Netlogo
Gradle
Redirect
Loopbackjs
Scrapy
Parsing
Ecmascript 6
Azure Devops
C
Templates
Rx Java
Akka
Openstack
Visual Studio 2013
Unity3d
Pytorch
Active Directory
Docker Compose
Compiler Construction
Notepad++
Binding
Ios8
Jboss
Salesforce
Inno Setup
Indexing
Rust
Cookies
Stanford Nlp
Yaml
Qml
Amazon Web Services
Jar
Opencl
Sapui5
Javascript
Eclipse
Django Models
Ruby On Rails 4
Omnet++
Ajax
Visual Studio Code
Sql
Nlp
Iframe
Project Management
Groovy
Listview
Blockchain
Directory
Vmware
Sencha Touch
C# 3.0
Debugging
Amazon Redshift
Apache Nifi
Rabbitmq
Encryption
Wxpython
Xamarin.forms
Dns
Octave
Phpmyadmin
Neural Network
Asterisk
Karate
Angular6
Playframework 2.0
Timer
Cordova
Python 3.x
Gnuplot
Generics
Leaflet
System Verilog
Redis
Linux Kernel
Time Complexity
Marklogic
Libgdx
Module
Windows 7
Elixir
Mobile
D
Architecture
Collections
Python Sphinx
Testng
Firebase
Swiftui
Firefox
C++
Google Chrome Devtools
Android Studio
Arduino
Sass


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网