Athena（Hive/Presto）查询语句中的分区表_Hive_Partitioning_Presto_Amazon Athena - Fatal编程技术网

Athena（Hive/Presto）查询语句中的分区表

hive

Athena（Hive/Presto）查询语句中的分区表,hive,partitioning,presto,amazon-athena,Hive,Partitioning,Presto,Amazon Athena,我在雅典娜（HIVE/Presto）中有以下分区表：创建不存在的外部表mydb.mytable( id字符串，数据串 ) 被分割( 年轮，月弦，日串 ) 行格式分隔以“\t”结尾的字段以“\n”结尾的行位置“s3://mybucket”；数据存储在s3中，以路径结构组织，如s3://mybucket/year=2020/month=01/day=30/ 我想知道以下查询是否会利用分区优化：选择 * 从…起 mydb.mytable 哪里（年份='2020'和月份='08'以

我在雅典娜（HIVE/Presto）中有以下分区表：

创建不存在的外部表mydb.mytable(
id字符串，
数据串
)
被分割(
年轮，
月弦，
日串
)
行格式分隔
以“\t”结尾的字段
以“\n”结尾的行
位置“s3://mybucket”；

数据存储在s3中，以路径结构组织，如

s3://mybucket/year=2020/month=01/day=30/

我想知道以下查询是否会利用分区优化：

选择
*
从…起
mydb.mytable
哪里
（年份='2020'和月份='08'以及日期（'10'，'11'，'12'））或
（年份='2020'和月份='07'以及日期（'29'，'30'，'31'）；

我假设由于中的

运算符将在一系列或
条件中转换，因此这仍然是一个查询，它将通过分区受益。我说的对吗？
是的，我也提到过
当Athena对分区表运行查询时，它会检查查询的WHERE子句中是否使用了任何分区列。如果使用分区列，Athena请求AWS Glue数据目录返回与指定分区列匹配的分区规范。分区规范包括LOCATION属性，它告诉Athena在读取数据时使用哪个AmazonS3前缀。在这种情况下，只扫描存储在此前缀中的数据。如果在WHERE子句中不使用分区列，Athena将扫描属于表分区的所有文件
不幸的是，雅典娜并没有公开能够让人们更容易理解如何优化查询的信息。目前，您唯一能做的就是运行不同的查询变体，并查看GetQueryExecution
API调用中返回的统计信息
确定Athena是否会在查询中使用分区的一种方法是使用分区列的不同值运行查询，并确保扫描的数据量不同。如果数据量不同，雅典娜可以在查询规划期间修剪分区




[xmpp]相关文章推荐



                                                        
试图理解xmpp
xmpp 
如何使用JSJAC XMPP客户端查询花名册
xmpp 
Xmpp 使用Smack将具有有效负载的项目发布到Pubsub节点
xmpp 
Xmpp '；从'；ejabberd脱机消息包中缺少属性
xmpp 
从xmpp中的节点取消订阅所选订阅服务器
xmpp 
Xmpp 在多用户聊天（ejabberd）中向脱机用户发送消息
xmpp 
Xmpp 限制用户相互查看
xmpp 
Xmpp Ejabberd中的管理员与普通用户
xmpp 
统计多个选项卡/窗口中的XMPP会话总数
xmpp 
配置远程mysql数据库时发生Openfire xmpp服务器错误
xmpp 
Xmpp Openfire附加用户'；s场
xmpp 
Xmpp 连接到角度6中的Strophe.js
xmppangular6 
Xmpp 路由到支持ejabberd中单个域的特定XEP-0114实例？
xmpp 
                                       





随机文章推荐



                                                        
Zend framework 使用Apache2.2运行Zend框架
zend-frameworkapache2 
Zend framework Zend Framework：如何使用多个参数进行DB选择？
zend-framework 
Zend framework Zend_Form：：当只使用表单的选定元素时，如何防止代码重复？
zend-framework 
Zend framework Zend Framework：需要帮助设置路由吗
zend-framework 
Zend framework ZF不捕获异常
zend-frameworkexception 
Zend framework zendform未加载
zend-framework 
Zend framework zend日期和夏季
zend-framework 
Zend framework Zend Framework：错误不可见/不显示
zend-framework 
Zend framework 装饰师ul li zend_表格


恩德雷索

名称
zend-framework 
Zend framework Zend Framework URL视图帮助程序未显示完整URL？
zend-framework 
Zend framework 在zend布局中显示用户信息的最佳方式
zend-framework 
Zend framework Zend_Mail不会将密件抄送至发件人地址
zend-frameworkemail 
Zend framework zend 1.11 doctrine2.1.1-未找到EntityNotFoundException实体
zend-frameworkdoctrine-orm 
Zend framework Zend#u paginator不'；当存在'；我们需要一些参数
zend-framework 
Zend framework Zend_Form_Element_复选框多个值
zend-framework 
Zend framework 致命错误：类'；Admin#U Model_DbTable#u Region'；在Zend中找不到
zend-framework 
Zend framework 使用jQuery和Zend_表单动态添加表单元素
zend-framework 
Zend framework Yii中路由的初始化和使用（与Zend比较）
zend-frameworkyii 
Zend framework Zend Framework和DOMPDF不呈现特殊字符
zend-frameworkframeworks 
Zend framework 致命错误：未捕获异常“Zend_Config_exception”，消息为“语法错误，意外”=”
zend-framework


                                        

                                        
                                        


                                                
                                                        [hive]相关推荐
                                                        
Hive 蜂箱中4小时报告
									Hive
							 
Hive 将数据加载到表中
									Hive
							 
Hive 在配置单元查询中使用不相等符号
									Hive
							 
Hive 如何跟踪TSaslTransport的故障（与配置单元相关）
									Hive
							 
Hive 带有MapReduce选项的HBase
									Hive
							 									Hbase
							 
Hive 如何使用配置单元根据计数选择记录数
									Hive
							 
HiveMetaStoreClient认为是Derby，但实际上是Postgres
									Hive
							 
要查看hive.exec.dynamic.partition的值，hive命令是什么
									Hive
							 
Hive 如何在配置单元中将列转换为行
									Hive
							 
Hive sqoop导入到配置单元
									Hive
							 
Hive 蜂巢不'；t使用计算出的分区键拾取分区
									Hive
							 
Hive 用于顶级功能的蜂巢Udf
									Hive
							 
Hive Pig拉丁语中的多重连接
									Hive
							 									Apache Pig
							 
Hive 在presto cli上查询在配置单元中以orc格式创建的表失败，该表的数据驻留在s3中
									Hive
							 
Hive 通过为包含JSON的列定义模式，为配置单元表创建视图
我将原始JSON字符串从Kafka流存储到HDFS作为拼花地板
我已经在配置单元上为HDFS文件夹创建了一个外部表
现在我想为存储在配置单元表中的原始数据创建一个视图，
									Hive
							 
Hive 使用HCatalog访问HAWQ/PXF上的蜂巢数据
									Hive
							 
Hive 在配置单元中使用左外部联接或存在的位置进行子查询
									Hive
							 
Hive 蜂巢多个连接非常慢
									Hive
							 
Hive Hdfs数据损坏问题
									Hive
							 
Hive 如何使用子查询在配置单元中进行连接？
									Hive
							 
Hive 如何通过SparkSql读取配置单元事务表并对其执行删除操作
									Hive
							 									Transactions
							 
Hive 在多个列上独立分组
									Hive
							 									Pyspark
							 
在HiveQL中使用相同别名时，结果不正确
									Hive
							 
Hive 如何使用json元组解析json对象中的所有元素，而您不需要'；我不知道钥匙的名字？（蜂箱）
									Hive
							 
Hive 将配置单元表作为单个文件输出到HDFS
									Hive
							 
使用tHiveRow中的正则表达式执行Talend配置单元查询
									Hive
							 									Talend
							 
Hive 配置单元表返回空值的原因
									Hive
							 
Hive 如何在配置单元表中将HBase行键拆分为2列
									Hive
							 									Hbase
							 
Hive 在配置单元中处理char（1）和varcar（2）的null
									Hive
							 
Hive 正在使bucketId超出范围：配置单元中出现错误：-1（版本3.0）
									Hive
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Puppet
Typescript
Docker Compose
Unix
Symfony
Facebook Graph Api
Browser
Couchdb
Powershell
Process
Playframework
Tinymce
Safari
Date
Graphics
Variables
Libgdx
Nosql
Web Crawler
Internet Explorer 8
Reflection
Rust
Python 3.x
Math
Algorithm
Openerp
Function
Composer Php
Prestashop
Sed
Geometry
Passwords
Directory
Angularjs
Verilog
Swift
Workflow
Chef Infra
Blazor
Ckeditor
Excel
C++11
Laravel 5
Sql Server 2008
Domain Driven Design
Io
Core Data
Linkedin
Animation
Solr
Nginx
Serial Port
Asynchronous
Shell
Cassandra
Jboss
Lisp
Postgresql
Colors
Yaml
Artificial Intelligence
Webrtc
Configuration
Linker
Exception Handling
Docker
Itext
Data Structures
Computer Vision
Mpi
Pentaho
Methods
Cygwin
Firefox Addon
Github
Sas
Hibernate
Maven
Clojure
Visual Studio 2012
Memory Management
Push Notification
Fiware
Content Management System
Angular
Tridion
Log4j
Amazon Ec2
Database Design
Oracle Apex
Windows Mobile
Transactions
Swift2
Rest
Datatables
Mdx
Keyboard
Rdf
Sharepoint
Xampp
Design Patterns
Sapui5
Youtube Api
Documentation
Printing
Project Management
Neo4j
Rally
Cocoa
Javascript
Terminal
Listview
Devexpress
.net Core
Deep Learning
Sphinx
Teradata
Stata
Here Api
User Interface
Instagram
Socket.io
Django Models
Dependency Injection
Windows Phone 8
Spring Security
Intellij Idea
Hash
Breeze
File
Ssh
Unit Testing
Akka
Interface
Extjs4
Perforce
Jpa
Mfc
Dll
Protocol Buffers
Gulp
Julia
Input
Ide
Arrays
Lua
Parse Platform
Atom Editor
Visual Studio 2015
Ms Office
Pycharm
Xamarin.ios
Stream
Nsis
Orientdb
Jetty
Xamarin.android
Autohotkey
Routing
Swift3
Performance
Google Analytics
Ssrs 2008
Webstorm
Iframe
Snmp
Qt
Heroku
Nunit
Android Ndk
Redux
Ravendb
Mongodb
Google Drive Api
Jqgrid
Razor
Antlr4
Liferay
Search
Android
Ipython
Wolfram Mathematica
Windows 7
Exception
Amazon Web Services
Dynamic
Logstash
Xaml
C++
Google Chrome Extension
Frameworks
Iis 7
Routes
Jupyter Notebook
Cordova
Antlr
Datetime
Biztalk
Sublimetext3
Python Sphinx
Hadoop


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网