为什么在Presto中读取dtap://hive表时总是得到0条记录作为输出?

为什么在Presto中读取dtap://hive表时总是得到0条记录作为输出?,hive,presto,cloudera-cdh,Hive,Presto,Cloudera Cdh,我正试图在CDH 5.14.2上运行带有Hive的Presto(所有版本详细信息如下) 令人惊讶的是,当我在任何表上运行任何select查询时,我得到0条记录作为输出。当我在任何表上选择*时,我只得到所有字段的列表,同样没有数据。 所有表格均为外部蜂巢表格,数据为拼花格式 蜂巢1.1.0 普雷斯托0.223,也是0.219 检查Presto安装中的server.log文件,其中没有错误或警告消息 同样的情况下,也尝试了使用Presto 0.219的相同安装 presto:sample_db>

我正试图在CDH 5.14.2上运行带有Hive的Presto(所有版本详细信息如下) 令人惊讶的是,当我在任何表上运行任何select查询时,我得到0条记录作为输出。当我在任何表上选择*时,我只得到所有字段的列表,同样没有数据。 所有表格均为外部蜂巢表格,数据为拼花格式

  • 蜂巢1.1.0

  • 普雷斯托0.223,也是0.219

检查Presto安装中的server.log文件,其中没有错误或警告消息

同样的情况下,也尝试了使用Presto 0.219的相同安装

presto:sample_db>从tableName中选择count(*)

_col0
-------
     0
(1 row)

Query 20190925_125900_00005_8tzp2, FINISHED, 1 node
Splits: 18 total, 18 done (100.00%)
0:01 [0 rows, 0B] [0 rows/s, 0B/s]
描述格式化表名的输出--

这可能是因为Hive和Presto之间的版本不匹配吗?我在Presto发行说明中找不到类似的东西 安装时需要添加的任何其他.jar或配置文件


非常感谢您的帮助

您能否尝试一下此处提到的msck修复表名称:?

谢谢您的评论,Rupam。我尝试过MSCK修复表db_name.TABLE_name;无法工作。请在配置单元中共享“描述格式化表”的输出?另外,如果在配置单元中执行“从表中选择*”操作,您是否能够看到正确的输出?我已在上面的问题中对此进行了更新。请注意,数据是通过dtap()访问的,不是直接从HDFS访问的。您是否也可以在配置单元中共享“SHOW PARTITIONS tablename”?您可能需要运行“ALTER TABLE Name RECOVER PARTITIONS”检查字段分隔符和行终止符,它们应该在
create table
中指定,我已经选中了
SHOW create table
,并且
description EXTENDED
它不在任何地方显示field.delim。Am假设在创建表时未指定以结尾的行格式分隔字段(因为它不是由我创建的)
# col_name              data_type               comment

column1             string
column2             string
column3             string
column4             decimal(6,0)
column5             timestamp

# Partition Information
# col_name              data_type               comment

active                  string

# Detailed Table Information
Database:               db_name
Owner:                  cloudera-vivek
CreateTime:             Sun Nov 25 03:23:06 GMT 2018
LastAccessTime:         UNKNOWN
Protect Mode:           None
Retention:              0
Location:               dtap://dbname/tablename
Table Type:             EXTERNAL_TABLE
Table Parameters:
        EXTERNAL                TRUE
        STATS_GENERATED_VIA_STATS_TASK  true
        numPartitions           2
        numRows                 4142
        transient_lastDdlTime   1543116186

# Storage Information
SerDe Library:          org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe
InputFormat:            org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat
OutputFormat:           org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat
Compressed:             No
Num Buckets:            -1
Bucket Columns:         []
Sort Columns:           []
Storage Desc Params:
        serialization.format    1
Time taken: 0.919 seconds, Fetched: 40 row(s)