大数据学习篇之Hive
简单的说就是让不会MapReduce编码的人但会SQL语句的人能很好的分析数据而设计出来的嫁接综合体。
实际上有些数据分析的操作并不需要很复杂的操作,比如可能只是查询某个年龄段由多少人,以及对应的浏览网页的次数,其实这种操作更类似于SQL的数据库操作。软件的发展应该是降低门槛,即是不明白里面原理,但是经过训练也能熟练的使用。比如将SQL和MapReduce结合起来组成了Hive,只要懂SQL语句,就可以使用自己熟悉的操作,HIve能自动进行MapReduce编程操作。
下面介绍几个简单的例子,分析SQL和MapReduce操作的过程,例一:
SELECT pageid, age, count(1) FROM pv_users GROUP BY pageid, age;
相关文章