构建“；交易”；基于arules和apriori的SparkR关联规则挖掘类_R_Apache Spark_Sparkr_Apriori_Arules - Fatal编程技术网

构建“；交易”；基于arules和apriori的SparkR关联规则挖掘类

r apache-spark

构建“；交易”；基于arules和apriori的SparkR关联规则挖掘类,r,apache-spark,sparkr,apriori,arules,R,Apache Spark,Sparkr,Apriori,Arules,我正在使用SparkR并试图将“SparkDataFrame”转换为“transactions”，以便挖掘项目/产品的关联我在这个链接上找到了一个类似的例子，但这只是在使用R data.frame时。我目前拥有这种格式的数据 CUSTOMER_KEY_h PRODUCT_CODE 1 SAVE 1 CHEQ 1 LOAN 1 LOAN 1 CARD 1 SAVE 2 CHEQ 2 LOAN

我正在使用SparkR并试图将“SparkDataFrame”转换为“transactions”，以便挖掘项目/产品的关联

我在这个链接上找到了一个类似的例子，但这只是在使用R data.frame时。我目前拥有这种格式的数据

CUSTOMER_KEY_h PRODUCT_CODE

    1   SAVE
    1   CHEQ
    1   LOAN
    1   LOAN
    1   CARD
    1   SAVE
    2   CHEQ
    2   LOAN
    2   CTSAV
    2   SAVE
    2   CHEQ
    2   SAVE
    2   CARD
    2   CARD
    3   LOAN
    3   CTSAV
    4   SAVE
    5   CHEQ
    5   SAVE
    5   CARD
    5   LOAN
    5   CARD
    6   CHEQ
    6   CHEQ

希望以这样的方式结束

CUSTOMER_KEY_h  PRODUCT_CODE
    1          {SAVE, CHEQ, LOAN, LOAN , CARD, SAVE}
    2          {CHEQ, LOAN, CTSAV, SAVE, CHEQ, SAVE, CARD, CARD}
    3          {LOAN, CTSAV}
    4          {SAVE}
    5          {CHEQ, SAVE, CARD, LOAN, CARD}
    6          {CHEQ, CHEQ}

或者，如果我可以在SparkR中获得与此R脚本等效的代码

df2arules
软件包与SparkR不兼容。如果您想探索Spark上的关联规则，应该使用它自己的实用程序。首先使用collect\u set
组合记录：
库（magrittr）
df%
agg（别名（收集集合（列（“产品代码”），“项目”））

适合型号（请查看可用选项的完整列表）：
fpgrowth
alias(collect_set(column("PRODUCT_CODE")), "items")

expr("collect_set(PRODUCT_CODE) AS items")




[apache spark]相关文章推荐



                                                        
Apache spark Apache Spark/GraphX限制映射阶段
apache-spark 
Apache spark sc是spark shell（DSE）中的sharkContext
apache-spark 
Apache spark 基于隐式反馈的推荐——Spark Mlib
apache-spark 
Apache spark spark中py4j网关服务器的入口点是什么？
apache-sparkpyspark 
Apache spark 使用套接字触发结构化流，设置模式，在控制台中显示数据帧
apache-sparkpyspark 
Apache spark 通用自定义项'；正在多次调用的已初始化的方法
apache-spark 
Apache spark 带typesafeconfig的Spark 2.1.1
apache-spark 
Apache spark EMR上的pyspark，是否应设置spark.executor.pyspark.memory和executor.memory？
apache-sparkpyspark 
Apache spark 如何为spark submit设置多个extraJavaOptions
apache-spark 
Apache spark Apache Ignite Spark集成将数据保存到Ignite错误
apache-sparkignite 
Apache spark 使用Spark或配置单元控制台从avro表中读取异常-无法从文件架构中获取varchar字段的maxLength值："；“字符串”；
apache-sparkhive 
Apache spark 结构流式演示，程序像批处理作业一样立即退出，不连续
apache-spark 
Apache spark 如何将参数传递给spark.sql（“”）？
apache-sparkpyspark 
Apache spark 在列中查找可变长度字符串
apache-spark 
Apache spark 在spark shell中运行带换行符的scala脚本
apache-spark 
Apache spark Py4JJavaError:作业因阶段失败而中止：阶段460.0中的任务0失败4次
apache-sparkpyspark 
Apache spark 如何将火花拼花地板插入蜂巢桌？
apache-sparkpysparkhive 
Apache spark pyspark joinWithCassandraTable重构（无映射）
apache-sparkpysparkcassandra 
Apache spark Spark会话在调用sc.parallelize后初始化
apache-sparkpyspark 
Apache spark 当多列中的任何一列具有空值时，如何连接该多列
apache-sparkpyspark 
                                       





随机文章推荐



                                                        
Django 用户名未正确显示
django 
Django v1.2多数据库调试应用程序？
django 
Django 显示通过'定义的m2m字段；通过'；管理中
django 
脱机数据库插入期间django内存泄漏
djangomemory-leaks 
如何使用django&；的多数据库设置来分离读写；postgresql？
djangopostgresql 
正在消失的会话cookie-django
djangosessioncookies 
如何在django中将页面重定向到另一个页面以获得基于类的视图？
django 
基于子CT键的Django填充表列
django 
Django密码重置无反向匹配
django 
Django摘要查询
django 
collectstatic上的Heroku/Django错误：OSError:[Errno 2]没有这样的文件或目录
djangoheroku 
Django 基于选定类别筛选/显示元素
django 
基于Django Rest框架的序列化程序构建react表单
djangoreactjsdjango-rest-framework 
Django 德扬戈。REST框架。重命名SerializerMethodField（）
djangodjango-rest-framework 
Django 保存其他表单时，如何更新其他模型字段
djangodjango-models 
Django GraphQL变异以创建外键地址和人员
djangographql 
Django 如何避免自引用多对多关系中的无限递归
djangodjango-models 
Django芹菜：任务从不执行
django 
Django Rest框架中简单JWT的自定义权限
djangodjango-rest-frameworkjwt 
如何在django中设置USerCreationForm的表单错误的样式？
djangodjango-models


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
R图中文本边界的范围
									R
							 
在r中创建所有可能的三元组（一次三个）组合
									R
							 
R 空间数据xyz到矩阵
									R
							 
R 仅选择一些面以在面_包裹、ggplot2中打印
									R
							 
R：计算并在ggplot图上叠加事件系列基于分钟的总计
									R
							 
R 使用网格或晶格图形调整多行表达式（）语句的行高
									R
							 
无截距R中的前向子集选择
									R
							 									Statistics
							 
在R中使用多线程/内核以压缩形式保存对象的方法是什么？
									R
							 									Multithreading
							 									Bash
							 									Compression
							 
R传单-调整簇标记以显示功能结果
									R
							 									Leaflet
							 
R 从周日开始一周的第一天，到周六结束一周的最后一天
									R
							 									Date
							 									Datetime
							 
R 从.zip中提取某些文件
									R
							 
R 使用ggplot的二进制运算符的非数值参数
									R
							 									Shiny
							 									Gis
							 
R：使用第二个条件按因子级别对数据帧进行子集
									R
							 
R 读取JPEG图像并将其附加到数组中
									R
							 
根据R中一列中的值删除几乎重复的行
									R
							 									Dataframe
							 
R 查找值是否在数据帧中快速移动
									R
							 									Dataframe
							 
R 为什么有些代码运行得比其他代码快？
									R
							 									Function
							 
R？中线性模型概述中的有序因子变量？
									R
							 
绘图显示在可渲染中，但不显示在DT:：renderDataTable中
									R
							 									Plot
							 									Shiny
							 
减少plot（）中打印点之间的间距R
									R
							 									Plot
							 
基于R的决策树
									R
							 
错误：对象'-&燃气轮机'；在R中找不到
									R
							 
计算R中矩阵中相邻单元格的外边缘
									R
							 
R LPsolve的表达式
									R
							 
R 重复选择相同选项的闪亮单选按钮
									R
							 									Shiny
							 
R 如何基于列名中的特定字符串分隔数据帧
									R
							 
将多张图纸的多个xlsx文件读入一个R数据框-设置\u名称功能问题
									R
							 
R 仅添加时间
									R
							 
从提供的数据中写入r GET查询
									R
							 									Api
							 									Url
							 
R 月平均值'；xts对象中的s数据（1-12月）
									R
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Spring Integration
Cocoa Touch
Ms Office
Phantomjs
Angular Material
Prestashop
Sqlite
Networking
Activemq
Linux
Pyspark
Iis 7
Vmware
Typo3
C# 3.0
Ms Access
Pentaho
Django Rest Framework
Composer Php
Datetime
Asterisk
Apache Spark
Opencart
Extjs4
Hbase
Directx
Jmeter
Meteor
Web Applications
Dart
Codeigniter
Error Handling
Socket.io
Devexpress
Java Me
Kendo Ui
Workflow
Gnuplot
Google Cloud Firestore
Deployment
Math
Computer Vision
Tinymce
Pip
Actionscript 3
Delphi
Windows Phone 7
Google Cloud Dataflow
Report
Markdown
Apache Kafka
Stm32
Session
Openlayers
Orm
Amp Html
Sphinx
Import
Drools
Snmp
Single Sign On
Windows
Nosql
Vbscript
Elm
Mongoose
Sails.js
Excel Formula
Triggers
Llvm
Instagram
Asp.net
Google Visualization
Enums
Visual Studio
Webrtc
Ecmascript 6
Rust
Sip
Leaflet
Firefox Addon
Dynamics Crm 2011
Outlook
Exception
Virtual Machine
List
Uml
Applescript
Google Chrome Devtools
Intellij Idea
Jar
Layout
Android Layout
Flask
Backbone.js
Xampp
Xmpp
Certificate
Ubuntu
Titanium
Xpath
Plot
Sencha Touch
Json
Sml
Usb
Maps
Highcharts
Protocol Buffers
Ant
Opengl Es
Udp
Permissions
Service
Recursion
Umbraco
Silverstripe
Perforce
Tabs
Artifactory
Youtube Api
Gridview
Google Maps
Sas
Teamcity
Notepad++
Tags
Unix
Ios6
Ms Word
Apache2
Xcode4
Objective C
Laravel 4
Ldap
Twitter
Ibm Midrange
Sublimetext2
Orientdb
Erlang
Vaadin
Sublimetext3
Sql Server
Couchbase
Terminal
Asp.net Core Mvc
Mips
Pointers
Swift2
Jestjs
Asp.net Mvc 2
Scala
Openerp
Wso2
Tridion
Kotlin
Visual Studio 2015
Amazon Web Services
Clang
Batch File
Google App Engine
Sql Server 2008
Io
Scrapy
Gis
Kubernetes
Vagrant
C++ Cli
Mod Rewrite
Database Design
Drop Down Menu
Antlr4
Html5 Canvas
Dojo
Symfony1
Asp.net Mvc 5
Linq To Sql
Hash
Jhipster
Coldfusion
Asp.net Web Api
Stripe Payments
Interface
C#
Amazon Cloudformation
Time
Terraform
Xamarin.android
Phpstorm
Seo
Google Apps Script
Swing
Responsive Design
Sharepoint 2007
Xsd
Autohotkey
Sharepoint 2010
Latex
Drupal
Centos
Collections


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网