Hadoop 将数据从txt表加载到orc表配置单元-查询_Hadoop_Mapreduce_Hive - Fatal编程技术网

Hadoop 将数据从txt表加载到orc表配置单元-查询

hadoop mapreduce hive

Hadoop 将数据从txt表加载到orc表配置单元-查询,hadoop,mapreduce,hive,Hadoop,Mapreduce,Hive,我的主要目标是创建一个存储为ORC的表。为此，我跟随我已经创建了一个文件夹/user/hive/external，并在同一位置创建了两个表（table_txt&table_orc）。直到将数据加载到表_txt中，它才正常现在，我发现的是，当我使用 INSERT OVERWRITE TABLE table_orc SELECT * FROM table_txt; 路径*/external中的表被删除（在web UI上查看），现在我有了一个名为“0000000”的文件，单击它，我得到了一些编码

我的主要目标是创建一个存储为ORC的表。为此，我跟随

我已经创建了一个文件夹/user/hive/external，并在同一位置创建了两个表（table_txt&table_orc）。直到将数据加载到表_txt中，它才正常

现在，我发现的是，当我使用

INSERT OVERWRITE TABLE table_orc SELECT * FROM table_txt;

路径*/external中的表被删除（在web UI上查看），现在我有了一个名为“0000000”的文件，单击它，我得到了一些编码的东西

这些问题——

1-这个000000_0文件是什么？为什么表在web UI上不可见

2-当我查询表_txt时，为什么它不提供任何数据？而在查询表_orc时，我得到了结果

创建了两个表。。。在同一位置==>红旗

正是位置定义了哪些数据文件属于哪个表。换句话说，每个表都应该位于私有目录上

因此，

INSERT OVERWRITE

删除了ORC表的私有目录中的所有内容，然后以ORC二进制格式创建了一个新的数据文件。这是预期的行为。糟糕的是，TXT文件也在那里

顺便说一句，“外部”表和“托管”表之间的区别之一是，当您

删除托管表时，整个目录都会被破坏，而删除外部表时，数据会保持原样。
非常感谢！我尝试使用表的单独目录。工作起来像个符咒！：）谢谢




[mapreduce]相关文章推荐



                                                        
HiveQL是否具有与直接在Hadoop上编写自己的MapReduce作业相同的表达能力？
mapreducehive 
在TableReducerJob中添加的HBase行是否只有在MapReduce作业完成后才可用？
mapreducehbase 
Mapreduce 使用RavenDb索引查找完整序列
mapreduceravendb 
Mapreduce CouchDB视图-将重复键值减少/分组到数组
mapreducecouchdb 
Mapreduce 以编程方式访问数据库的查询参数
mapreducenosqlcouchdb 
Mapreduce 是否有一种正确的方法来测量迭代算法的加速比？
mapreduce 
Mapreduce erlang中的Riak映射缩减，尝试列出索引/元数据时出错
mapreduceerlang 
Mapreduce CouchDB链接多个文档
mapreducecouchdb 
Mapreduce 将多个文件读取到map-reduce中的分布式缓存
mapreduce 
Mapreduce 清管器UDF似乎总是在单个减速器中运行-并联不工作
mapreduceapache-pig 
Mapreduce 配置单元聚合查询从缓存中获取错误的值
mapreducehive 
Mapreduce 将一个pcollection用作另一个pcollection的输入
mapreducegoogle-bigquerygoogle-cloud-dataflow 
                                       





随机文章推荐



                                                        
Model view controller 简单MVC模块重写
model-view-controllermod-rewrite 
Model view controller 我将如何在Zend框架中构建它？
model-view-controllerzend-frameworkcodeigniter 
Model view controller MVC相关问题
让我们考虑使用MVC概念构建的Web应用程序。如果我的应用程序根据用户输入和数据库动态生成一些图表图像，我希望知道图像生成过程将属于哪个组件：控制器还是视图
model-view-controller 
Model view controller 网站应在哪里'；s的资产进入MVC网站？
model-view-controller 
Model view controller MVP还是MVC？哪一个允许编写松散耦合的代码？
model-view-controller 
Model view controller 松散耦合开发
model-view-controllerarchitecture 
Model view controller CakePHP保存多个数据
model-view-controllercakephpmodelview 
Model view controller 未在MVC中填写WebMatrix URL数据收集
model-view-controllerasp.net-mvc-3 
Model view controller Ext JS 4.0-MVC Ext.panel.Form&；Ext.ComponentLoader
model-view-controllerextjsextjs4 
Model view controller 在ExtJS 4应用程序之间共享模型、视图和控制器
model-view-controllerextjs4 
Model view controller 是型号胶水'；Coldfusion中的模型与其他MVC框架中的模型相同吗？
model-view-controllercoldfusion 
Model view controller 如何在express.js（node.js）和backbone.js之间混合视图（html+css+js）
model-view-controllerviewbackbone.jsexpresssocket.io 
Model view controller MVC系统是如何工作的？
model-view-controlleroopdesign-patterns 
Model view controller 将Ember.TextField值绑定到另一个控制器'；s属性
model-view-controllerember.js 
Model view controller ZF2：禁用错误页面布局
model-view-controllerexceptionzend-framework2 
Model view controller 主干事件触发次数太多
model-view-controllerbackbone.js 
Model view controller extjs组合框从控制器加载值
model-view-controllerextjscombobox 
Model view controller JavaFx-8（连接到登录屏幕的主屏幕）的事件处理帮助可以'；I don’我不能回家上班
model-view-controller 
Model view controller 如何为列表中的一个元素生成GUID<；T>；在MVC中？
model-view-controller 
Model view controller 我可以使DropDownList for width与TextBoxFor width与Bootstrap类相同吗？
model-view-controllerview


                                        

                                        
                                        


                                                
                                                        [hadoop]相关推荐
                                                        
Hadoop ChainMapper，ChainReducer
									Hadoop
							 									Mapreduce
							 
为Hadoop分布式缓存将小文件合并为大文件？
									Hadoop
							 
Hadoop pig加入时间范围
									Hadoop
							 									Apache Pig
							 
Hadoop map task和reduce task是否可以在同一个节点中？
									Hadoop
							 									Map
							 
Hadoop 有没有办法让配置单元使用Unicode表名和列名？
									Hadoop
							 									Unicode
							 									Hive
							 
Hadoop 手动修复Hbase表重叠（多个区域具有相同的启动键）
									Hadoop
							 									Hbase
							 
Hadoop 如何在PIG脚本中将列本身作为参数传递
									Hadoop
							 									Command Line
							 									Apache Pig
							 
Hadoop Elasticsearch中的分析
									Hadoop
							 
“；你没有'；我无权提取文件夹”；提取hadoop
									Hadoop
							 
Hadoop sqoop将数据从Teradata传输到HDFS
									Hadoop
							 									Hive
							 									Teradata
							 
hadoop 2.4.1版本的eclipse插件
									Hadoop
							 									Eclipse Plugin
							 
Hadoop Hiveserver2服务中面临的问题
									Hadoop
							 									Hive
							 
Hadoop 如何获得第n排Spark RDD？
									Hadoop
							 									Apache Spark
							 
Hadoop agent.sources.tailSrc.command是什么意思？
									Hadoop
							 
org.apache.hadoop.mapred.InvalidInputException:输入路径不存在
									Hadoop
							 
Hadoop中输入行的成对聚合
									Hadoop
							 
Hadoop 从配置单元中拆分阵列的末尾进行评估
									Hadoop
							 									Hive
							 
Hadoop Pig：使用STARTSWITH显示条目
									Hadoop
							 									Apache Pig
							 
hadoop中的distcp在从一个集群传输到另一个集群时是否加密数据
									Hadoop
							 									Encryption
							 
Hadoop 在Spark作业中使用ElasticSearch时，番石榴罐冲突
									Hadoop
							 									Apache Spark
							 
Hadoop 蜂箱罐'；不要创建表格
									Hadoop
							 									Hive
							 
Hadoop HDFS：如何设置主机名：9000而不是本地主机：9000
									Hadoop
							 									Mapreduce
							 
Hadoop 使用mapper将空值写入拼花地板文件
									Hadoop
							 									Mapreduce
							 
Hadoop 从拼花格式的配置单元表查询时如何抑制日志
									Hadoop
							 									Apache Spark
							 									Hive
							 
datanode Hadoop 2.7.3单节点错误（伪分布式模式）
									Hadoop
							 
映射端连接失败，返回代码为org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask中的1
									Hadoop
							 									Join
							 									Hive
							 
Hadoop 指定要在哪个Nodemanager上运行的应用程序
									Hadoop
							 									Apache Spark
							 									Apache Flink
							 
Hadoop hive.tez.container.size和tez.task.resource.memory.mb之间的差异
									Hadoop
							 									Memory
							 									Hive
							 
org.apache.ignite.IgniteException:对于输入字符串："；30s“；在ignite hadoop执行中
									Hadoop
							 									Ignite
							 
Hadoop 当我试图从s3读取文件时，发生了bucket错误，问题是什么？
									Hadoop
							 									Amazon S3
							 									Pyspark
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Maven
Macros
Image Processing
Laravel
Wicket
Crystal Reports
Swing
View
Firefox Addon
Permissions
Laravel 5
Bluetooth
Google Cloud Firestore
Mvvm
Vb6
Nestjs
Sql Server 2008 R2
Amazon Ec2
Playframework
Pytorch
Gtk
Forms
Breeze
Azure
Utf 8
Seo
Vbscript
Encryption
Codenameone
Cuda
Leaflet
Github
Swiftui
Amazon S3
Julia
Apache Flex
Deep Learning
Blockchain
Inno Setup
Nosql
Sails.js
Kendo Ui
Serial Port
Office365
Go
Dependencies
Geometry
Nativescript
Material Ui
Sitecore
Gatsby
Drupal
Dart
Graphics
Websphere
Salesforce
Orm
Login
Magento
Winapi
Winforms
Libgdx
Mariadb
Windows Phone 8
Lambda
Pyspark
Datatables
Youtube Api
Blackberry
Stream
Facebook Graph Api
Fullcalendar
Enums
Tableau Api
Perforce
Applescript
Push Notification
Groovy
Opengl Es
Asp.net Mvc 5
Subsonic
Tcl
Solr
Stored Procedures
Web Scraping
Chef Infra
Microservices
Smalltalk
Jvm
Migration
Bison
Nuget
Math
Google Compute Engine
Abap
Ibm Mq
Jhipster
File
Airflow
Npm
Coldfusion
Email
Ios4
Class
Pip
Webgl
Netty
Time Complexity
Synchronization
Video Streaming
Swift2
Pdf
Dynamic
Sprite Kit
Merge
Timer
Model
Embedded
Doxygen
Navigation
Authentication
Webstorm
Oauth 2.0
Configuration
Redux
Graphviz
Oracle
Sencha Touch
Actions On Google
Youtube
Cocoa Touch
Gruntjs
Socket.io
Antlr4
Cocos2d Iphone
Grid
Hyperledger Fabric
Discord
Google Maps
Moodle
Uml
Xamarin
Kentico
Visual Studio 2013
Syntax
Xquery
Docker Compose
Oracle10g
Autocomplete
Android Layout
Routes
Architecture
Prolog
Javafx 2
Concurrency
Erlang
Xamarin.ios
Centos
Jms
Internet Explorer 8
Server
Kotlin
Ftp
Racket
Gridview
Apache Kafka
Wcf
Azure Devops
Xcode4
Angular
Web Services
Sublimetext2
Cluster Computing
Graph
Backbone.js
Autohotkey
Jquery Plugins
Docusignapi
Serialization
Webpack
Processing
Windows Mobile
Antlr
Ibm Cloud
Mercurial
Flash
Dependency Injection
Tomcat
Usb
Visual C++
Openerp
Scala
Resharper
Linkedin
Eclipse Plugin
Extjs4
Asynchronous
Wxpython
Encoding
Google Drive Api
Grep


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网