Mapreduce 如何自接两个包？_Mapreduce_Apache Pig - Fatal编程技术网

Mapreduce 如何自接两个包？

mapreduce apache-pig

Mapreduce 如何自接两个包？,mapreduce,apache-pig,Mapreduce,Apache Pig,我有一组数字描述了第一组整数和第二组整数之间的连接。例如： 1,2 3,4 5,6 5,7 6,8 然后按如下方式加载数据，并将其分组： data = load 'data.csv' as integer_1, integer_2; grouped = group data by integer_1; grouped_numbers = foreach grouped generate group as node, data.integer_2 as connection; 然后生成一个包

我有一组数字描述了第一组整数和第二组整数之间的连接。例如：

1,2
3,4
5,6
5,7
6,8

然后按如下方式加载数据，并将其分组：

data = load 'data.csv' as integer_1, integer_2;
grouped = group data by integer_1;

grouped_numbers = foreach grouped generate group as node, data.integer_2 as connection;

然后生成一个包，其中包含每个第一个整数及其一阶连接：

(1,{(2)})
(3,{(4)})
(5,{(6),(7)})
(6,{(8)})

然后，我想对分组的_数字包进行一次自连接，以便给出结果的第一个整数及其每个一次和二次连接。在这种情况下，这将是：

(1,{(2)})
(3,{(4)})
(5,{(6),(7),(8)})
(6,{(8)})

因为5连接到6，6连接到8，所以8是6的二次连接。如何在Pig中实现此功能？

第一次加入：

    joined = join data1 by int_2, data2 by int_1

其中，数据1和数据2是相同的集合（本例中为

数据的副本）
然后按第一个字段分组。内袋将具有与“组”的所有连接，可能不止一次。因此，如果你只需要一个独特的元素，那么你可能也需要一个独特的内袋
（通过Pig邮件列表回答）
第一次加入：
    joined = join data1 by int_2, data2 by int_1

其中，数据1和数据2是相同的集合（本例中为数据的副本）
然后按第一个字段分组。内袋将具有与“组”的所有连接，可能不止一次。因此，如果你只需要一个独特的元素，那么你可能也需要一个独特的内袋
（通过猪邮件列表回答）




[apache pig]相关文章推荐



                                                        
Apache pig Pig：对外部方法的多次调用
apache-pig 
Apache pig 存储前转储是否会创建单独的作业？
apache-pig 
Apache pig 用UDF编程Pig
apache-pig 
Apache pig 如何在pig中将元组转换为逗号分隔字符串
apache-pig 
Apache pig 用于处理第n-1条记录的PIG脚本
apache-pig 
Apache pig 猪的工作在同时进行时会受到阻碍
apache-pig 
Apache pig 如何找到pig中排名前两位的收视率？
apache-pig 
Apache pig Pig将数据存储在临时目录而不是实际目录中
apache-pig 
Apache pig ApachePig-将当前行的日期设置为给定id的下一个记录日期减去一天
apache-pig 
Apache pig 在pig中格式化输入文件
apache-pig 
Apache pig 清管器过滤器或操作员
apache-pig 
Apache pig 我想知道相对于下面的脚本，我的数据应该如何在文本文件中？
apache-pig 
Apache pig 使用pig脚本从聚合后的元组中提取单个值
apache-pig 
Apache pig 来自bag的Pig Sum字段不起作用
apache-pig 
Apache pig 将输出存储到Pig中的CSV文件
apache-pig 
Apache pig 计算数据中有多少不同长度的单词，例如，（8,1）（单词，长度）
apache-pig 
                                       





随机文章推荐



                                                        
jqGrid表单编辑卡在初始加载的值中
jqgrid 
jqgrid:排序时不调用unformat
jqgrid 
Jqgrid jqgird。如何更改表单字段名？
jqgrid 
选中行时，在一个单元格中将字体设置为粗体。Jqgrid
jqgrid 
jqGrid排序箭头
jqgrid 
jqgrid+；用空格对数字进行排序
jqgrid 
Jqgrid jquery网格：编辑后禁用重新加载网格
jqgrid 
jqgrid使用超链接获取记录信息
jqgrid 
最后一列应该如何占据jqgrid中的剩余空间
jqgrid 
JqGrid数据未提交到视图
jqgrid 
禁用jQGrid中的行
jqgridjavascript 
如何在可滚动的jqgrid中设置jqgrid列宽并重新调整大小？
jqgrid 
jqgrid文本框值未得到更新
jqgrid 
如何克隆jqgrid对象
jqgrid 
Jqgrid 在标题中隐藏单元格的右边框
jqgrid 
jqgrid在分页或行列表时锁定
jqgrid 
具有大量网格的JqGrid分页
jqgrid 
Free JQGrid：在内联编辑中，冻结列的高度与其他列不匹配
jqgrid 
jqGrid free multiPageSelect MULTIPSELECT clear selarrrow
jqgrid 
Jqgrid 在角度环境中改变拖放图像
jqgrid


                                        

                                        
                                        


                                                
                                                        [mapreduce]相关推荐
                                                        
Mapreduce 如何在CouchBase上实现多租户？它能表演吗？
									Mapreduce
							 									Couchdb
							 									Couchbase
							 
MapReduce相关-我在这里做错了什么？
									Mapreduce
							 
Mapreduce 使用map reduce（Couchbase）编写一个简单的group by
									Mapreduce
							 									Nosql
							 									Couchbase
							 
Mapreduce 映射减少键、值对
									Mapreduce
							 
运行MapReduce作业时获取应用程序ID
									Mapreduce
							 
Mapreduce Hadoop V2：关闭洗牌/排序？
									Mapreduce
							 
Mapreduce 分布式系统中数据包的不均匀分布
									Mapreduce
							 									Java 8
							 
使用AWS Elastic MapReduce EMR的MapReduce作业-为什么648 MB的输入被拆分为27个映射任务？
									Mapreduce
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Ocaml
Windows Installer
Android Layout
Validation
Macos
Swiftui
Directx
Smalltalk
Ruby
Windows
Sharepoint 2010
Dictionary
Eclipse Rcp
Service
Yocto
Wicket
Composer Php
Open Source
Download
Ag Grid
Asp.net Mvc 5
Enums
Kotlin
Pagination
Resharper
Silverstripe
Xcode4
Phantomjs
Plugins
Google Cloud Firestore
Xamarin.ios
Apache Flex
Spring
Asp.net Mvc 4
C++11
.htaccess
Formatting
Ssh
Powershell
Apache Pig
Codenameone
Camera
Prolog
Nativescript
Transactions
Image Processing
Polymer
EmptyTag
Haskell
Opencv
Lambda
Redis
Binary
Jsf
Opencart
Xampp
Reporting Services
Content Management System
Moodle
Spring Mvc
Video
Jestjs
Protocol Buffers
Apache Spark
Gradle
Grid
Visual C++
Zend Framework
Data Binding
Laravel 4
Windows 7
Firefox
Highcharts
Workflow
Mule
Robotframework
Orientdb
Xpath
Odata
Unit Testing
Oracle Apex
Firefox Addon
Nhibernate
Django Rest Framework
Pyspark
Language Agnostic
Csv
Mvvm
Xna
Url Rewriting
Razor
Stanford Nlp
Woocommerce
Solr
Sql Server 2008
Hybris
Uwp
C++
Virtual Machine
Excel
Plsql
Hadoop
Racket
Ms Access
Sharepoint
Botframework
Charts
Visual Studio 2017
D3.js
Speech Recognition
Math
Telerik
Akka
Corda
Ssrs 2008
Puppet
Report
Statistics
Svg
Exception Handling
Serial Port
Active Directory
Asterisk
Docusignapi
Symfony
Google Colaboratory
File Io
Eclipse
Algorithm
Linkedin
Stored Procedures
List
Testing
Google Cloud Storage
Tcl
Design Patterns
Winforms
Jquery Ui
Google Calendar Api
Arduino
Ruby On Rails
Phpmyadmin
Chef Infra
Dialogflow Es
Jsf 2
Llvm
Combobox
Pine Script
Protractor
Knockout.js
Gmail
Ruby On Rails 4
Shiny
Jquery Mobile
Openlayers 3
Animation
Stripe Payments
Twilio
Swing
Amazon Web Services
Extjs4
Jhipster
Architecture
Leaflet
Applescript
Ecmascript 6
Aframe
Twitter Bootstrap 3
Orchardcms
Next.js
Coldfusion
Rally
Meteor
Azure Sql Database
Pytorch
Websocket
Sublimetext3
Passwords
Memory Leaks
Windows Phone
Ignite
Video Streaming
Usb
Amazon Dynamodb
Adobe
Qt
Ftp
Swift2
Heroku
Glsl
Cron
Actionscript 3
Dojo
Types
Breeze
Asp.net Web Api
Class
Signalr
Forms
Perforce
Concurrency


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网