Hadoop 用Hive还是HBase

2025-02-01 03:39:00
推荐回答(2个)
回答(1):

这个要根据自己处理数据的方式来选择。
1、Hive是支持SQL语句的,执行会调用mapreduce,所以延迟比较高;
2、HBase是面向列的分布式数据库,使用集群环境的内存做处理,效率会比hive要高,但是不支持sql语句。
Hadoop开发和运行处理大规模数据,需要用hbase做数据库,但由于hbase没有类sql查询方式,所以操作和计算数据非常不方便,于是整合hive,让hive支撑在hbase数据库层面的 hql查询,hive也即做数据仓库。

回答(2):

当我看到“关联”时,我想到join。hive是支持SQL的,执行会调用mapreduce,所以延迟比较高;而hbase是面向列的分布式数据库,使用集群环境的内存做处理,效率会比hive要高,但是不支持sql,而且hbase在做join的时候会比较麻烦,所以坚持用habase的话需要借助mapreduce做一些逻辑处理。所以复杂度考虑我还是建议使用hive。