为什么在Presto中读取dtap://hive表时总是得到0条记录作为输出?
我正试图在CDH 5.14.2上运行带有Hive的Presto(所有版本详细信息如下) 令人惊讶的是,当我在任何表上运行任何select查询时,我得到0条记录作为输出。当我在任何表上选择*时,我只得到所有字段的列表,同样没有数据。 所有表格均为外部蜂巢表格,数据为拼花格式为什么在Presto中读取dtap://hive表时总是得到0条记录作为输出?,hive,presto,cloudera-cdh,Hive,Presto,Cloudera Cdh,我正试图在CDH 5.14.2上运行带有Hive的Presto(所有版本详细信息如下) 令人惊讶的是,当我在任何表上运行任何select查询时,我得到0条记录作为输出。当我在任何表上选择*时,我只得到所有字段的列表,同样没有数据。 所有表格均为外部蜂巢表格,数据为拼花格式 蜂巢1.1.0 普雷斯托0.223,也是0.219 检查Presto安装中的server.log文件,其中没有错误或警告消息 同样的情况下,也尝试了使用Presto 0.219的相同安装 presto:sample_db>
- 蜂巢1.1.0
- 普雷斯托0.223,也是0.219
_col0
-------
0
(1 row)
Query 20190925_125900_00005_8tzp2, FINISHED, 1 node
Splits: 18 total, 18 done (100.00%)
0:01 [0 rows, 0B] [0 rows/s, 0B/s]
描述格式化表名的输出--
这可能是因为Hive和Presto之间的版本不匹配吗?我在Presto发行说明中找不到类似的东西
安装时需要添加的任何其他.jar或配置文件
非常感谢您的帮助您能否尝试一下此处提到的msck修复表名称:?谢谢您的评论,Rupam。我尝试过MSCK修复表db_name.TABLE_name;无法工作。请在配置单元中共享“描述格式化表”的输出?另外,如果在配置单元中执行“从表中选择*”操作,您是否能够看到正确的输出?我已在上面的问题中对此进行了更新。请注意,数据是通过dtap()访问的,不是直接从HDFS访问的。您是否也可以在配置单元中共享“SHOW PARTITIONS tablename”?您可能需要运行“ALTER TABLE Name RECOVER PARTITIONS”检查字段分隔符和行终止符,它们应该在
create table
中指定,我已经选中了SHOW create table
,并且description EXTENDED
它不在任何地方显示field.delim。Am假设在创建表时未指定以结尾的行格式分隔字段(因为它不是由我创建的)
# col_name data_type comment
column1 string
column2 string
column3 string
column4 decimal(6,0)
column5 timestamp
# Partition Information
# col_name data_type comment
active string
# Detailed Table Information
Database: db_name
Owner: cloudera-vivek
CreateTime: Sun Nov 25 03:23:06 GMT 2018
LastAccessTime: UNKNOWN
Protect Mode: None
Retention: 0
Location: dtap://dbname/tablename
Table Type: EXTERNAL_TABLE
Table Parameters:
EXTERNAL TRUE
STATS_GENERATED_VIA_STATS_TASK true
numPartitions 2
numRows 4142
transient_lastDdlTime 1543116186
# Storage Information
SerDe Library: org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe
InputFormat: org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat
OutputFormat: org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat
Compressed: No
Num Buckets: -1
Bucket Columns: []
Sort Columns: []
Storage Desc Params:
serialization.format 1
Time taken: 0.919 seconds, Fetched: 40 row(s)