Hive 如何仅在Apache配置单元中运行映射作业的查询

Hive 如何仅在Apache配置单元中运行映射作业的查询,hive,Hive,如果我在ApacheHive中编写一个查询,那么它会在幕后执行mapreduce作业,但我如何只能在hive中运行map作业呢 谢谢某些优化查询实际上只需要映射阶段。您可以在配置单元中提供MAPJOIN提示以实现相同的效果:建议将此提示用于小型辅助表: SELECT /*+ MAPJOIN(...) */ * FROM ... 这是一个在采访中问我的问题,当时我不知道答案,但后来我想出来了 以下查询运行仅映射作业。因此,选择列值将运行仅映射作业。因此,在这种情况下,我们不需要reducer

如果我在ApacheHive中编写一个查询,那么它会在幕后执行mapreduce作业,但我如何只能在hive中运行map作业呢


谢谢

某些优化查询实际上只需要映射阶段。您可以在配置单元中提供MAPJOIN提示以实现相同的效果:建议将此提示用于小型辅助表:

 SELECT /*+ MAPJOIN(...) */ * FROM ...

这是一个在采访中问我的问题,当时我不知道答案,但后来我想出来了

以下查询运行仅映射作业。因此,选择列值将运行仅映射作业。因此,在这种情况下,我们不需要reducer

  select id,salary from tableA;

嗨,朋友,发送更多关于你的需求的详细信息,你想在地图工作中做些什么?通常,一旦我们在蜂巢中编写查询,比如从Location=UK的tweets中选择*;然后运行map并减少这两个作业。我只需要知道通过SQL语句运行映射作业的方法是什么?