如何使用ApachePig在hadoop集群上加载文件？_Hadoop_Apache Pig - Fatal编程技术网

如何使用ApachePig在hadoop集群上加载文件？

hadoop apache-pig

如何使用ApachePig在hadoop集群上加载文件？,hadoop,apache-pig,Hadoop,Apache Pig,我有一个pig脚本，需要从本地hadoop集群加载文件。我可以使用hadoop命令列出文件：hadoop fs–ls/repo/mydata，` 但当我尝试用pig脚本加载文件时，失败了。load语句如下所示： in = LOAD '/repo/mydata/2012/02' USING PigStorage() AS (event:chararray, user:chararray) 错误消息是： Message: org.apache.pig.backend.executionengine

我有一个pig脚本，需要从本地hadoop集群加载文件。我可以使用hadoop命令列出文件：hadoop fs–ls/repo/mydata，` 但当我尝试用pig脚本加载文件时，失败了。load语句如下所示：

in = LOAD '/repo/mydata/2012/02' USING PigStorage() AS (event:chararray, user:chararray)

错误消息是：

Message: org.apache.pig.backend.executionengine.ExecException: ERROR 2118: Input path does not exist: file:/repo/mydata/2012/02

有什么想法吗？谢谢

我的建议：

在hdfs中创建文件夹：

hadoop fs-mkdir/pigdata

将文件加载到创建的hdfs文件夹：

hadoop fs-put/opt/pig/tutorial/data/exite-small.log/pigdata

（也可以从grunt shell中执行此操作，如

grunt>copyFromLocal/opt/pig/tutorial/data/excite-small.log/pigdata

）

执行pig拉丁语脚本：

   grunt> set debug on

   grunt> set job.name 'first-p2-job'

   grunt> log = LOAD 'hdfs://hostname:54310/pigdata/excite-small.log' AS 
              (user:chararray, time:long, query:chararray); 
   grunt> grpd = GROUP log BY user; 
   grunt> cntd = FOREACH grpd GENERATE group, COUNT(log); 
   grunt> STORE cntd INTO 'output';

输出文件将存储在

hdfs://hostname:54310/pigdata/output

我也面临同样的问题。。以下是我的建议：

要开始使用清管器，请键入： [root@localhost培训]#pig-x本地

现在键入load语句，就像我在下面的示例中所做的那样： grunt>a=LOAD'/home/training/pig/TempFile.txt'，使用PigStorage（'，'）作为（c1:chararray，c2:chararray，c3:chararray）

去掉“=”两边的空格
in=LOAD'/repo/mydata/2012/02'使用PigStorage（）作为（事件：chararray，用户：chararray）
得到它，应该是这样的：in=LOAD“hdfs:/repo/mydata/2012/02”使用PigStorage（）作为。。。

[apache pig]相关文章推荐

Apache pig 如何将一个元组中的多个字段乘以该元组中的给定字段 apache-pig

Apache pig 如何在pig中创建一个小常量关系（表）？ apache-pig

Apache pig Hadoop Pig-替换映射中与其对应值相关的字符串 apache-pig

Apache pig pig拉丁力唯一约束 apache-pig

Apache pig 使用CONCAT时无法打开alias的迭代器 apache-pig

Apache pig UDF能否访问调用Pig脚本中声明的参数或定义值？ apache-pig

Apache pig 今天就开始'；s日期，以yyyy-mm-dd格式，以Pig格式 apache-pig

Apache pig 用于在Pig中将数字格式化为字符串的自定义项 apache-pig

Apache pig 将xlsx文件加载到Pig中 apache-pig

Apache pig 清管器压扁与嵌套袋上的分组 apache-pig

Apache pig 我在猪身上犯了错误 apache-pig

Apache pig pig联接中多列的最大值 apache-pig

Apache pig 如何在清管器中将一根绳子分成相等的部分？ apache-pig

Apache pig 在PIG中加载CSV文件 apache-pig

Apache pig 带有模式给定错误的清管器加载 apache-pig

随机文章推荐

Install4j 安装4J和控制面板详细信息 install4j

启动exe-install4j时未执行自动更新- install4j

Install4j 如何删除注册表项 install4j

Install4j Mac OS X安装程序底座名称 install4j

Install4J:托盘应用程序：启动时软关闭和恢复窗口 install4j

install4j:Jar未打包 install4j

如何使用Install4j从central repo获取工件以进行安装 install4j

[hadoop]相关推荐

Hadoop HDFS在还原程序运行时，群集的某些数据节点突然断开连接
Hadoop

Hadoop hdfs数据目录“；处于不一致状态：与其他人不兼容；
Hadoop

Hadoop 纱线如何管理像风暴一样的无休止的工作
Hadoop

Hadoop 蜂箱卸载和重新加载
Hadoop Hive

Hadoop 外部客户端如何通过HTTP回调通知Oozie工作流
Hadoop Service Web

二级排序在Hadoop中是如何工作的？
Hadoop Mapreduce

我可以将Hadoop 2.0.0-cdh4.5.0与Cassandra 2.0.5结合使用吗？
Hadoop Cassandra

从shell为Ambari和Hue-Hadoop创建本地用户
Hadoop Cluster Computing

Hadoop mapfile多重索引
Hadoop Io

Hadoop 使用Centos v7安装新群集
Hadoop

Hadoop 应用程序主机无法连接到资源管理器
Hadoop

使用flume将twitter数据流式传输到hadoop的HDFS接收器中
Hadoop Twitter

Hadoop 使用gobblin将表从本地mysql导入hdfs的示例作业
Hadoop

Hadoop上的MapReduce说'；输出文件已存在'；
Hadoop Mapreduce

Hadoop 为什么pig的dump命令要花这么多时间执行？
Hadoop Apache Pig

Hadoop 在Pig UDF参数上使用别名
Hadoop Apache Pig

Hadoop 通过oozie shell操作使用zkcli.sh bash从hdfs向zookeeper发送solr配置
Hadoop Solr Apache Zookeeper

Hadoop 如何从配置单元服务器获取mapreduce作业号
Hadoop Jdbc Hive

Hadoop 配置单元元数据的图表/图形视图
Hadoop Hive

Hadoop Namenode高可用性客户端请求
Hadoop

执行错误，从org.apache.hadoop.hive.ql.exec.mr.MapRedTask返回代码1（state=08S01，code=1）
Hadoop Hive

Hadoop 提高Java MapReduce性能的想法
Hadoop Mapreduce

如何选择Hadoop工具以获得更快的性能
Hadoop Mapreduce Hive Hbase

Hadoop 正在从Oozie工作流检索Spark错误以发送电子邮件操作
Hadoop Apache Spark

Hadoop Tez配置单元：无法从链中的任何提供商加载AWS凭据
Hadoop Amazon S3 Hive

Hadoop Spark数据帧松散分区
Hadoop Apache Spark

Hadoop 为什么在运行Spark应用程序期间，一些工作节点会为系统花费更多的CPU？
Hadoop Apache Spark

Hadoop文件系统大小du命令
Hadoop Filesystems

Hadoop 所有节点都无法启动
Hadoop

Hadoop 提前知道蜂箱排将排到哪个桶中
Hadoop Hive

Tags

Select Pycharm Plot Ruby On Rails 3 Codeigniter Lambda C# Mariadb Symfony Google Plus Internet Explorer 8 Apache Zookeeper Libgdx Usb Reactjs Phpmyadmin Netty Perforce Debian Ibm Mobilefirst Jquery Mobile Nlp Amazon Dynamodb Web Applications Triggers Error Handling Wix Compiler Errors Jersey Entity Framework Core Marklogic Validation Boost Lotus Notes Visual C++ Angular Material Ios6 Titanium Login Http Oracle10g Ibm Mq Less Django Rest Framework Hibernate Ubuntu Sonarqube Adobe Google Visualization Ios5 Linq Grep X86 Windows 7 Amazon Ec2 Youtube Api Qt Image Zurb Foundation Notepad++ Apache Kafka Joomla Terraform Kubernetes Vagrant Import Compiler Construction Graphics Printing Grafana Z3 Apache Flex Wolfram Mathematica Shiny Gatsby Gtk Asp.net Mvc 5 Xamarin.android Github Svn Gradle Maps Sms Pip Project Management Gis Data Structures Yaml Documentation Math Heroku Responsive Design Nuget Dojo Dependencies Django Models Dependency Injection Cassandra Paypal View Sencha Touch Reference Shopify Stanford Nlp Date Embedded Graphql Qt4 Checkbox Vb.net Tfs Windows Store Apps Keycloak Mercurial Visual Studio 2015 Netsuite Openid Jhipster Android Fragments Asynchronous Azure Devops Navigation Php Laravel 5 Facebook Openstack Quickbooks User Interface Git Core Data Sql Server 2005 Selenium Webdriver File Upload Safari Mediawiki Networking Xpages Ag Grid Sphinx Cocos2d X Rx Java Sublimetext3 Input File Magento2 Ada .net Outlook Spring Security Composer Php Asp.net Opencl Oop Operating System Twitter Orchardcms Mvvm Prolog Gwt Webgl Openlayers 3 Formatting Octave Architecture Actions On Google Command Line Silverlight Google Sheets Jboss Aws Lambda Websphere Applescript Camera Windows Runtime Jquery Ui Sharepoint Smtp Amazon Cloudformation Sockets Monitoring Vmware Apache Spark Office Js Azure Functions Forms Variables Redirect Office365 Delphi Electron Visual Studio 2008 Kernel Computer Science Azure Active Directory Air Sas Artificial Intelligence Scikit Learn Codenameone Jquery Sap

Copyright © 2024. All Rights Reserved by - Fatal编程技术网