Hive 作为select插入配置单元外部表，并确保它在表目录中生成单个文件_Hive - Fatal编程技术网

Hive 作为select插入配置单元外部表，并确保它在表目录中生成单个文件

hive

Hive 作为select插入配置单元外部表，并确保它在表目录中生成单个文件,hive,Hive,我的问题与下面的帖子有些相似。我想使用selectquery从配置单元表下载一些数据。但由于数据很大，我想将其作为一个外部表写入给定路径。这样我就可以创建一个csv文件。使用下面的代码 create external table output(col1 STRING, col2STRING) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE LOCATION '{outdir}/output'

我的问题与下面的帖子有些相似。我想使用

select

query从配置单元表下载一些数据。但由于数据很大，我想将其作为一个外部表写入给定路径。这样我就可以创建一个csv文件。使用下面的代码

create external table output(col1 STRING, col2STRING)
ROW FORMAT DELIMITED
    FIELDS TERMINATED BY ','
    STORED AS TEXTFILE
    LOCATION '{outdir}/output' 

INSERT OVERWRITE TABLE output 
            Select col1, col2 from atable limit 1000

这可以很好地工作，并创建一个

格式的文件，该文件可以复制为csv文件

但我的问题是如何确保

输出总是有一个文件？如果没有定义分区，它总是单个文件吗？它用来分割文件的规则是什么
看到了一些类似的问题如下。但它讨论了hdfs文件访问。

我知道下面的备选方案，但我使用配置单元连接对象从远程节点执行查询
hive-e'selectsql；'|sed的/[\t]/，/g'>outpathwithfilename
在执行覆盖之前，可以设置以下属性
设置mapreduce.job.reduces=1
注意：如果配置单元引擎不允许在运行时修改，则通过在hive-site.xml中设置以下属性将参数列入白名单
hive.security.authorization.sqlstd.confwhitelist.append=| mapreduce.job.| mapreduce.map.| mapreduce.reduce.*
您可以在执行覆盖之前设置以下属性
设置mapreduce.job.reduces=1
注意：如果配置单元引擎不允许在运行时修改，则通过在hive-site.xml中设置以下属性将参数列入白名单
hive.security.authorization.sqlstd.confwhitelist.append=| mapreduce.job.| mapreduce.map.| mapreduce.reduce.*




[ignite]相关文章推荐



                                                        
Apache Ignite缓存已关闭或销毁
ignite 
我们可以将ApacheIgnite集群复制到另一个Ignite集群吗？
ignite 
Apache Ignite SQLClient从集群外部连接
ignite 
Ignite 如何从map/set'；s值是否按自定义顺序排列？
ignite 
选择在ApacheIgnite中以独占方式将表存储在磁盘上
ignite 
使用Ignite对象时Apache Ignite IllegalacessException from GridUnsafe
ignite 
apachespark&x2B；Ignite群集瘦客户端
ignite 
Ignite 已检测到阻塞的系统关键线程
ignite 
                                       





随机文章推荐



                                                        
Plugins 如何开始为苹果的多媒体产品开发插件，如iMovie、iLife等？
plugins 
Plugins 为Google Chrome开发的扩展之间的通信
pluginsgoogle-chromegoogle-chrome-extension 
Plugins 在joomla组件中调用插件
pluginsjoomla 
Plugins 如何为grails安装过滤器插件？
pluginsgrailsfilterinstallation 
Plugins 记事本++；环境更像梦境编织者
pluginsnotepad++ 
Plugins 如何在RCP应用程序中使自定义视图完全占据透视图
pluginseclipse-plugineclipse-rcp 
Plugins 从专用远程url安装zip格式的Griffon插件
plugins 
Plugins 编写屏幕共享插件/驱动程序
plugins 
Plugins 乔姆拉！向所有模块添加额外参数的系统插件
pluginsjoomla 
Plugins Gruntjs：如何使复制任务只复制监视中更改的文件
pluginsgruntjs 
Plugins 如何在Sublimite2中更改输出面板的位置
pluginsidesublimetext2 
Plugins Gradle：首先运行自定义插件中的任务
pluginsgroovygradle 
Plugins &引用；“全部出口”；窗口阻止我的插件脚本UI
pluginsscripting 
Plugins 自定义Munin插件不会报告
plugins 
Plugins Sql超时已过期/Sql Server的操作超时已过期
pluginsdynamics-crm-2011 
Plugins 我怎样才能删除玩家清单？
plugins 
Plugins tinyMCE自定义字段不可编辑
pluginstinymce 
Plugins Corona Admob插件不与其他插件一起工作
plugins 
Plugins 为Jenkins插件转义Jelly中的特殊角色
pluginsjenkins 
Plugins Babel插件在处理完所有文件后回调？
plugins


                                        

                                        
                                        


                                                
                                                        [hive]相关推荐
                                                        
Hive 蜂巢中的嵌套选择
									Hive
							 
Hive 无法重命名具有大量分区的大型配置单元表
									Hive
							 
hiveQL字符串到日期的转换
									Hive
							 
Hive DSE 4.0上的配置单元抛出NoSuchMethodError
									Hive
							 
Hive 配置单元排序依据在子查询中不起作用
									Hive
							 
Hive hadoop与以前的没有udf的比较
									Hive
							 
Hive 配置单元中字母数字字符的数据类型
									Hive
							 
Hive 配置单元以逗号分隔格式输出到文本文件
									Hive
							 
Hive 如何在Amazon EMR中安装sqoop？
									Hive
							 									Amazon Redshift
							 
Hive 检查蜂巢表是否存在的最佳方法是什么？
									Hive
							 
Hive 在配置单元中连接之前对字符串排序
									Hive
							 
Hive 如何在配置单元SQL中为除一个数据库之外的所有数据库授予所有权限
									Hive
							 
Hive 将数据从配置单元/黑斑羚表导出到文件中，条件很少
									Hive
							 
Hive 配置单元UDF:运行时异常内部错误：找不到未知的ObjectInspector
									Hive
							 
Hive 如何在配置单元表中获取最近3个月的数据
									Hive
							 
Hive 从具有嵌套结构的内部配置单元表读取时发生AvroTypeException
									Hive
							 
Hive 配置单元视图查询未使用分区
									Hive
							 
Hive 在配置单元中每周计算列的总和
									Hive
							 
Hive 在齐柏林飞艇中使用SparkSql访问配置单元表时，为什么会出现IO异常？
									Hive
							 
Hive 配置单元-按数据内容对外部表进行分区
									Hive
							 
Hive ApacheDrill-配置单元集成：Drill未列出表
									Hive
							 
Hive 在配置单元上使用UDF时，如何修复此Kryo异常？
									Hive
							 
Hive 配置单元LLAP优化：每个守护进程的内存和堆大小计算
									Hive
							 
Hive 如果查询不基于分区进行过滤，分区在AmazonAthena中是否有用？
									Hive
							 
Hive 如何在HDFS文件（通过cygnus保存）和配置单元表之间匹配列？
									Hive
							 									Fiware
							 
计算hive 1.2.1中已删除分区的静态
									Hive
							 
Hive 当配置单元插入中途失败时会发生什么情况？
									Hive
							 
Hive 为什么时间部分中的冒号在HDFS上表示为%3A
									Hive
							 									Formatting
							 
Hive 安装配置单元类路径包含多个SLF4J绑定
									Hive
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Fortran
Aem
Iframe
Loopbackjs
Parse Platform
Webstorm
Autodesk Forge
Service
Google Maps Api 3
Xcode
Mono
Css
Dynamics Crm 2011
Kernel
Command Line
Sprite Kit
Android Ndk
Eclipse
Asterisk
Jms
Https
Plot
Hyperledger Fabric
Machine Learning
Google Cloud Dataflow
Routes
Visual Studio 2010
Ios8
Tcp
Kdb
Compilation
Xamarin
Vbscript
Karate
Jsf
Youtube Api
Terminal
Ibm Cloud
Jquery
Sdk
Download
Applescript
Laravel 4
Excel Formula
Python 2.7
Cmd
Sails.js
Webview
Internet Explorer
Winforms
Joomla
Sqlite
Sencha Touch 2
Tableau Api
Sencha Touch
Memory Leaks
C++11
Responsive Design
Facebook Graph Api
Mariadb
Odoo
Tinymce
Tensorflow
Drupal 6
Google Plus
Prometheus
Ruby On Rails 3
Mod Rewrite
Embedded
Programming Languages
Entity Framework Core
Jqgrid
Xml
Asp.net Mvc 4
Udp
Ssis
Email
Stata
Dll
Sublimetext3
Clojure
Vmware
Db2
Ruby
Resharper
Sap
Requirejs
Streaming
Blockchain
Actionscript
Linkedin
Cocoa
Amazon Redshift
Youtube
Leaflet
Jquery Plugins
Docusignapi
Artificial Intelligence
Google Api
Android Layout
C++ Cli
Jsf 2
R
Chart.js
Stored Procedures
Ibm Midrange
Linker
Memory
Silverlight 4.0
Scripting
Sql
Sql Server 2005
Jestjs
Ssas
Build
Go
Qml
Listview
Npm
Codenameone
Firebase
Io
Process
Rally
Utf 8
Apache Camel
Vhdl
Stanford Nlp
Methods
Swing
Ignite
Numpy
Log4net
Ssh
Google Apps Script
Windows Runtime
Properties
Class
React Native
Magento
Artifactory
Amazon Dynamodb
Mediawiki
Path
Mobile
Spring Integration
Perl
Google App Engine
Nlp
Pine Script
Gcc
Breeze
Computer Vision
Cygwin
Sequelize.js
Windbg
Visual Studio
Ethereum
Hive
Javafx 2
Jdbc
Python
Robotframework
Hash
Stm32
Gitlab
Google Chrome
Log4j
Login
Shiny
Mercurial
Drupal
Keras
Ms Office
Directory
Twilio
Configuration
Ssl
EmptyTag
Internationalization
Bots
Silverstripe
Editor
Jekyll
Clearcase
Wolfram Mathematica
Moodle
Google Cloud Platform
Vue.js
Cmake
Openlayers
Indexing
Unicode
Checkbox
Vb6
Computer Science
Yii2
Orchardcms
Yii
Ios4
Drupal 7


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网