Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/codeigniter/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
配置单元/SQL:查询添加的clickstream数据_Sql_Database_Hive_Clickstream - Fatal编程技术网

配置单元/SQL:查询添加的clickstream数据

配置单元/SQL:查询添加的clickstream数据,sql,database,hive,clickstream,Sql,Database,Hive,Clickstream,在我们产品的列表功能中,我们有数据存储在列表中显示的ID列表。在我们的一小部分数据中(现在已经固定),结果列表中包含的ID以累加方式存储。请参阅下面的屏幕截图,了解更多我想要传达的内容 Datetime User Action Extra 5-20-2015 9:00AM A list ids: 1 5-20-2015 9:00AM A

在我们产品的列表功能中,我们有数据存储在列表中显示的ID列表。在我们的一小部分数据中(现在已经固定),结果列表中包含的ID以累加方式存储。请参阅下面的屏幕截图,了解更多我想要传达的内容

Datetime            User              Action           Extra
5-20-2015 9:00AM     A                 list           ids: 1
5-20-2015 9:00AM     A                 list           ids: 1, 2   
5-20-2015 9:00AM     A                 list           ids: 1, 2, 3
5-20-2015 9:01AM     B                 list           ids: 5
5-20-2015 9:01AM     B                 list           ids: 5, 6
5-20-2015 9:01AM     B                 list           ids: 5, 6, 7
是否可以针对这种类型的数据组织编写配置单元或SQL查询?我尝试在子查询中查询LENGTH(extra),然后拉入MAX(LENGTH(extra))数据,但我们无法让它工作

处理这些数据的最佳方法是什么,这样我们只提取ID的最终列表?

您可能需要的是
row\u number()
窗口函数(我经常使用它来查询按日期排序的附加数据源):


Hive和MySQL一样吗?请不要使用
mysql
标记,除非您实际使用的是该产品。我更正了该标记以引用SQL而不是mysql。谢谢你指出这一点,而且一点也不居高临下,巴尔马。
select * from
(select *, 
 row_number() over (partition by user order by length(extra) desc) rn
 from yourtable
 ) a
 where rn = 1