不懂代码?8个技巧教你上手BigQuery
没有程序员背景,没有写过代码的人,也可以学习使用Google BigQuery吗?
答案是肯定的。
同样是代码小白的小编刚开始学习BigQuery时,在许多小问题上走了弯路,所以献上一份针对初学者的Tips list,希望能让你在使用BigQuery时更得心应手。
1 - 保存查询
写完一段查询代码后,可以使用查询窗口下方的“保存查询”按钮进行保存:
当选择保存为“个人”时,该查询只能被自己访问或修改;保存为“项目查询”时,云帐户中的任何人都可以访问或修改它,这种方式非常适合团队合作。
保存查询后,想要再次访问该查询,点击左边菜单栏的“查询历史记录”查找即可:
2 - 保存视图
查询结果可通过“保存结果”以多种形式导出:
或者通过“保存试图”将查询结果存储于数据库中,以便后期频繁使用:
3 - 直接插入表格中的字段名称
在想要查询的表中直接点击“架构”中的字段名称,可自动将所选字段插入我们的查询中。在写代码时,这样做既能使添加多个字段变得简单且快速,也能保证字段名称的准确度。
4 - 导入公共数据集
Google BigQuery中可访问和使用大量公共数据集,我们可以在操作界面菜单左侧“资源”位置选择“浏览公共数据集”,对目标数据集进行添加。
利用外部数据集与自身数据集进行关联分析,不失为新的数据洞察角度。例如,把“covid-19”相关的公共数据集与企业网站的访问量、话题量做关联分析等等。
5 - 一键提高代码的可读性
写代码时一时爽,看代码的人可能就不那么高兴了。
在编写代码时,我们的代码可能是这样的:
点击“展开”里面的“格式”按钮,写好的代码会被安排得明明白白,大大提高了代码可读性:
……
6 - 使用WITH AS语句
进行表格得嵌套时,可使用WITH AS语句创建一个临时表或视图,然后在其中查询。例如:
7 - Group by 1, 2, 3
在GROUP BY子句中,BigQuery将按SELECT语句中的字段名称顺序进行分组,因此可直接用“1,2,3……”调用对应字段,例如:
8 - 使用UNNEST函数
我们知道BigQuery可以和Google Analytics进行数据集成,在BigQuery中可根据需求直接对GA的底层数据进行查询。GA的底层数据以hits级别收集数据,也就是说,在完成了网站的代码部署后,访客每进行一个可被监测到的动作,GA就生成一条数据记录。
因此,BigQuery中表的对象不是采用简单的键值对应,而是包含了简单数据(如字符串,整数和浮点数),和一些复杂数据(如数组,结构甚至结构数组)的。可以理解为以下形式,其中每一个区分开的颜色代表不用的访问,每一个大的分支代表一次hits:
在调用包含复杂数据的字段时,用UNNEST函数可以获取一个数组并将其分解为每个单独的元素。举个简单的例子,如下图所示,GA收取自定义维度相关的数据是以结构数组形式呈现,在调用过程中需要用UNNEST函数进行拍平,拍平前:
使用UNNEST函数:
查询结果:
百闻不如一练,小编刚开始学习BigQuery时对数据结构什么的完全没有概念,通过学习和多多地练习(重点是多多练习),在实践中慢慢积累知识,BigQuery就能变成非常趁手的数据分析工具了。
来源 https://zhuanlan.zhihu.com/p/164967370
相关文章