《HBase实战》章问题集

2020-05-22 00:00:00 数据 专区 场景 在线 离线
1. 什么是HBase?

描述HBase有很多词汇,稀疏的,分布式的,持久化的,基于行键,列键的。。。这些都是从技术角度去描绘它。

如果从使用场景来说,HBase是一个可以随机访问的存储和检索数据的平台。

2. HBase用什么来进行查询?SQL吗?

HBase不使用SQL。

3.HBase和其它键值数据库有什么区别?

和其它键值数据库不同,HBase承诺强一致性。

4. HBase的使用场景?

HBase是基于BigTable的论文实现的,BigTable在Google的架构中的地位:

5. Google的使用场景说明了什么?

不仅仅是爬虫,数据源可以是用户看了什么广告,看了多长时间,或者记录各种参数的时间序列数据。只要是数据量大,源源不断,都可能需要HBase。

比如:

a.OpenTSDB用于指标监控

b.存储用户的交互数据(尤其是交互非常频繁的数据)

c.广告推荐

4.内容服务

5.URL短连接服务

6. 短信服务

6.HBase和Hive在使用场景上有什么不同?

HBase是大数据里的在线系统。而HIVE是大数据里的离线系统。

这两者可以看到是latency-throughout tradeoff的不同场景。前者需要低延迟,后者需要大吞吐。

7. 什么是在线系统和离线系统?

8. 如何访问hbase?

hbase shell

9. 基本操作?

a.创建table

b.插入数据

c.读取数据

d.scan

这个是HBase和其它键值数据库不一样的API。

10. timestamp是什么?


参考资料:

research.fb.com/publica

相关文章