Apache pig 将输出存储到单个CSV？_Apache Pig - Fatal编程技术网

Apache pig 将输出存储到单个CSV？

apache-pig

Apache pig 将输出存储到单个CSV？,apache-pig,Apache Pig,目前，当我存储到HDFS中时，它会创建许多零件文件有没有办法存储到单个CSV文件您可以通过以下几种方式实现：要设置所有清管器操作的减速机数量，您可以使用default\u parallel属性-但这意味着每个步骤将使用一个减速机，从而降低吞吐量：设置默认并行1 在调用STORE之前，如果执行的操作之一是（COGROUP、CROSS、DISTINCT、GROUP、JOIN（内部）、JOIN（外部）和ORDER BY），则可以使用PARALLEL 1关键字表示使用单个减速机来完成该命令：

目前，当我存储到HDFS中时，它会创建许多零件文件

有没有办法存储到单个CSV文件

您可以通过以下几种方式实现：

要设置所有清管器操作的减速机数量，您可以使用
```
default\u parallel
```
属性-但这意味着每个步骤将使用一个减速机，从而降低吞吐量：
```
设置默认并行1
```


在调用STORE之前，如果执行的操作之一是（COGROUP、CROSS、DISTINCT、GROUP、JOIN（内部）、JOIN（外部）和ORDER BY），则可以使用PARALLEL 1
关键字表示使用单个减速机来完成该命令：
第1组为a组


有关更多信息，请参见。您还可以使用Hadoop的getmerge命令合并所有这些part-*文件。
这只有在从Pig shell（而不是Java）运行Pig脚本时才可能实现
与建议的解决方案相比，这是一个优势：因为您仍然可以使用多个减缩器来处理数据，所以您的作业可能会运行得更快，尤其是当每个减缩器输出的数据很少时
grunt> fs -getmerge  <Pig output file> <local file>

grunt>fs-getmerge
我认为这并不理想，因为在大输出数据上使用太少的缩减器可能会导致内存不足错误。




[content management system]相关文章推荐



                                                        
Content management system 内容管理系统建议
content-management-system 
Content management system PTA网站的软件[CMS]？
content-management-system 
Content management system TYPO3所见即所得编辑器don'；t调整插入内容中的图像大小
content-management-systemtypo3 
Content management system ModX getResources显示子资源以及父级资源
content-management-system 
Content management system 果园微数据面包屑
content-management-systemorchardcms 
Content management system 无法从后端删除Umbraco成员类型
content-management-systemumbraco 
Content management system Sitefinity 8中的页面重定向错误
content-management-system 
Content management system 如何在Directus 7中创建页面扩展
content-management-system 
Content management system Hippo自定义基本插件创建
content-management-system 
                                       





随机文章推荐



                                                        
Editor 您如何处理您可以'；你不使用你喜欢的文本编辑器吗？
editor 
Editor text不使用箭头键移动光标
editor 
Editor “如何写作”；“待办事项”；源代码洞察编辑器中的注释？
editor 
Editor 如何在Atom文本编辑器中查找键盘快捷键分配？
editoratom-editor 
Editor 创建有效的SCORM内容
editor 
Editor 将modelsim编辑器重置为默认编辑器
editorvhdl


                                        

                                        
                                        


                                                
                                                        [apache pig]相关推荐
                                                        
Apache pig 我可以在Apache Pig Latin中将命令拆分为多行吗？
									Apache Pig
							 
Apache pig 如何在Apache Pig上强制执行正确的数据类型？
									Apache Pig
							 
Apache pig 筑巢猪
									Apache Pig
							 
Apache pig Pig UDF正在从UDF抛出一个错误捕获错误：GetCounty，越界访问[1]
									Apache Pig
							 
Apache pig 无法将展平（TOBAG（*）投射到chararray
									Apache Pig
							 
Apache pig 具有不同架构的2个数据集之间的并集
									Apache Pig
							 
Apache pig 按其他字段过滤内袋（非常量）
									Apache Pig
							 
Apache pig 在Pig中加载嵌套拼花地板文件？
									Apache Pig
							 
Apache pig 将元组划分为多个元组
									Apache Pig
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Active Directory
Backbone.js
Nhibernate
Xslt
Wso2
Xamarin
Silverlight 4.0
Firefox
Google Bigquery
Couchdb
Extjs4
Extjs
Reactjs
Tree
Kibana
Grafana
Tomcat
Dask
Laravel 5
Protractor
Dependencies
Asp.net Web Api
Sitecore
For Loop
Salesforce
Compilation
Acumatica
Julia
Bison
Haskell
Object
Nuget
Nest
Libgdx
Soap
Css
Oop
Devexpress
Mapreduce
Mfc
Plot
Svg
Ruby
Compiler Errors
Perforce
Jestjs
Joomla
Signalr
Adobe
Frameworks
Git
Xml
Jms
Phpunit
Amazon Dynamodb
Ffmpeg
Sml
Printing
Javafx
Google App Engine
Paypal
Doctrine Orm
3d
Multithreading
Tsql
Dynamics Crm
Symfony
Internet Explorer
Activerecord
Corda
Directory
Razor
Azure Service Fabric
Uitableview
Clearcase
Linker
Cocoa Touch
Jasmine
C# 3.0
Single Sign On
Memory
Vagrant
Awk
Markdown
Gstreamer
C++
Yii2
Testng
Gdb
Apache Camel
Firefox Addon
Yocto
Automated Tests
Qt
Url Rewriting
Mpi
Apache Zookeeper
Oracle Apex
Wcf
Drupal
Curl
Plugins
Blockchain
Scripting
Mapping
Python Sphinx
Mvvm
Jhipster
Windows 10
Stata
Parallel Processing
Office Js
Outlook
Dictionary
Html
Breeze
Facebook
Less
Jsf
Mongoose
Xaml
Compression
Karate
Exchange Server
Cloud Foundry
Zurb Foundation
Amazon S3
Jdbc
Logic
Mediawiki
Firebase
Linq
Z3
Big O
Migration
Replace
Encoding
Material Ui
Selenium Webdriver
Fortran
Discord.py
Dll
Bots
Asp.net Core
Twitter
Pine Script
Kdb
Ionic2
Django Models
Sdk
Antlr4
Drupal 6
Configuration
Ag Grid
Meteor
Arm
Performance
Statistics
Language Agnostic
R
Http
Kotlin
C++ Cli
Content Management System
Algorithm
Validation
Excel Formula
Terraform
Cookies
Dynamic
Serialization
Pentaho
Design Patterns
Sql Server 2008 R2
Netbeans
Security
Math
Drupal 7
Robotframework
Workflow
Xsd
Directx
Optimization
Hash
Text
Azure
Vim
Tabs
Parsing
Influxdb
Qt4
Struct
Compiler Construction
Protocol Buffers
Google Cloud Storage
Routes
Odoo
Lucene
Node.js
Objective C
.net


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网