《HBase实战》章问题集
1. 什么是HBase?
描述HBase有很多词汇,稀疏的,分布式的,持久化的,基于行键,列键的。。。这些都是从技术角度去描绘它。
如果从使用场景来说,HBase是一个可以随机访问的存储和检索数据的平台。
2. HBase用什么来进行查询?SQL吗?
HBase不使用SQL。
3.HBase和其它键值数据库有什么区别?
和其它键值数据库不同,HBase承诺强一致性。
4. HBase的使用场景?
HBase是基于BigTable的论文实现的,BigTable在Google的架构中的地位:
5. Google的使用场景说明了什么?
不仅仅是爬虫,数据源可以是用户看了什么广告,看了多长时间,或者记录各种参数的时间序列数据。只要是数据量大,源源不断,都可能需要HBase。
比如:
a.OpenTSDB用于指标监控
c.广告推荐
4.内容服务
5.URL短连接服务
6. 短信服务
6.HBase和Hive在使用场景上有什么不同?
HBase是大数据里的在线系统。而HIVE是大数据里的离线系统。
这两者可以看到是latency-throughout tradeoff的不同场景。前者需要低延迟,后者需要大吞吐。
7. 什么是在线系统和离线系统?
hbase shell
9. 基本操作?
a.创建table
这个是HBase和其它键值数据库不一样的API。
参考资料:
https://research.fb.com/publications/apache-hadoop-goes-realtime-at-facebook/
相关文章