前言

本文隶属于专栏《1000个问题搞定大数据技术体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!

本专栏目录结构和参考文献请见1000个问题搞定大数据技术体系

正文

hive 为了执行效率考虑,简单的查询,就是只是 select,不带 count,sum,group by 这样的,都不走 MapReduce,直接读取 hdfs 目录中的文件进行 filter 过滤。

也就是所谓的本地模式

1、直接查询表的数据 不会进行 MapReduce

select * from employee;

2、查询语句中的过滤条件只是分区字段的情况下 不会进行 MapReduce。

select * from order_partition where month='2021-06';

此外,如果设置属性 set hive.exec.mode.local.auto=true; hive 也会尝试使用本地模式。

上一篇 下一篇