Twitter 黑斑羚创建外部表,由蜂巢存储

Twitter 黑斑羚创建外部表,由蜂巢存储,twitter,hbase,flume,impala,flume-ng,Twitter,Hbase,Flume,Impala,Flume Ng,从昨天开始,我一直在试图弄清楚为什么我的表创建无法工作。由于我无法将我的黑斑羚链接到我的Hbase,我无法在我的twitter流上进行查询:/ 我是否需要一个特殊的罐式蜂箱来存放SerDe属性 这是我的命令: 创建外部表HB_IMPALA_TWEETS( id int, id_str字符串, 文本字符串, 在时间戳处创建了_, 地球纬度双倍, 地球经度加倍, 用户\屏幕\名称字符串, 用户位置字符串, 用户\u追随者\u计数字符串, 用户\配置文件\图像\ url字符串 ) 由“org.apac

从昨天开始,我一直在试图弄清楚为什么我的表创建无法工作。由于我无法将我的黑斑羚链接到我的Hbase,我无法在我的twitter流上进行查询:/

我是否需要一个特殊的罐式蜂箱来存放SerDe属性

这是我的命令:

创建外部表HB_IMPALA_TWEETS( id int, id_str字符串, 文本字符串, 在时间戳处创建了_, 地球纬度双倍, 地球经度加倍, 用户\屏幕\名称字符串, 用户位置字符串, 用户\u追随者\u计数字符串, 用户\配置文件\图像\ url字符串 )
由“org.apache.hadoop.hive.hbase.hbasStorage Handler”存储
具有serdeproperty( “hbase.columns.mapping”= “:键,tweet:id\u str,tweet:text,tweet:created\u at,tweet:geo\u latitude,tweet:geo\u longitude,用户:屏幕名称,用户:位置,用户:追随者数量,用户:profile\u image\u url” ) TBLProperty(“hbase.table.name”=“tweets”)

但我有一个错误:strored by:

查询:创建外部表HB_IMPALA_TWEETS(id int,id_str string,text string,created_at timestamp,geo_lation double,geo_longitude double,user_screen_name string,user_location string,user_followers_count string,user_profile_image_url string),由'org.apache.hadoop.hive.hbase.HBaseStorageHandler'和SERDEPROPERTIES()存储“hbase.columns.mapping”=”:键,tweet:id\u str,tweet:text,tweet:created\u at,tweet:geo\u纬度,tweet:geo\u经度,用户:屏幕名称,用户:位置,用户:追随者数量,用户:profile\u图像url”)TBLPROPERTIES(“hbase.table.name”=“tweets”) 错误:AnalysisException:第1行中的语法错误: …图像(url字符串)由org.apache.hadoop.hive.h存储

遭遇:被

预期:作为

原因:异常:语法错误

有关信息,我遵循以下页面:


谢谢你的帮助:)

嗯,看来黑斑羚仍然不支持SerDe(序列化/反序列化)

“使用蜂巢外壳在黑斑羚一侧创建表格, 因为Impala CREATE TABLE语句当前不支持 自定义SERDE和这些表所需的一些其他语法:您 使用存储方式将其指定为HBase表 配置单元上的“org.apache.hadoop.hive.hbase.HBaseStorageHandler”子句 “创建表语句。”

因此,只需在配置单元外壳或色调配置单元上运行命令,然后在impala中键入“invalidatemetadata”,然后您就可以看到带有“showtables”的表

所以这一部分的问题似乎已经解决了