你能用hadoop做些什么,这在Hive中是不可能或很难做到的?

你能用hadoop做些什么,这在Hive中是不可能或很难做到的?,hadoop,hive,Hadoop,Hive,我对Hadoop和Hive还比较陌生,我想举一个例子,说明可以用Hadoop轻松完成一些事情,但Hive并不适合 不是“关系工作负载”(例如,您也可以使用SQL数据库进行的工作)的所有内容都不太适合Hive。也许总有一种方法可以在Hive中实现这一点(主要是因为UDF是可用的),但这并不“容易” 你在区分“Hadoop”和“Hive”。然而,“Hadoop”是一个相当笼统的术语:它可能意味着“HDFS”(分布式文件系统)、“纱线”(资源管理器)或“Hadoop”,作为Google建议的“Map

我对Hadoop和Hive还比较陌生,我想举一个例子,说明可以用Hadoop轻松完成一些事情,但Hive并不适合

不是“关系工作负载”(例如,您也可以使用SQL数据库进行的工作)的所有内容都不太适合Hive。也许总有一种方法可以在Hive中实现这一点(主要是因为UDF是可用的),但这并不“容易”

你在区分“Hadoop”和“Hive”。然而,“Hadoop”是一个相当笼统的术语:它可能意味着“HDFS”(分布式文件系统)、“纱线”(资源管理器)或“Hadoop”,作为Google建议的“Map Reduce”算法的实现。我假设您在比较Hadoop和Hive时提到了“MapReduce”


我要说的是,计算a可能对蜂巢很烦人。另一个例子是计算。

TF-IDF可以使用带有Hivemall扩展的Apache Hive计算。

要计算TF-IDF,只需要2个视图和1个查询。轻松点