如何在Databricks笔记本中获取运行参数和运行ID?
问题描述
将Databricks笔记本作为作业运行时,您可以指定可在笔记本代码中使用的作业或运行参数。然而,从文档中并不清楚您实际是如何获取它们的。我希望能够获得所有参数以及作业ID和运行ID。
解决方案
作业/运行参数
当笔记本作为作业运行时,任何job parameters都可以使用Databricks自动提供和导入的dbutils
包作为词典获取。代码如下:
run_parameters = dbutils.notebook.entry_point.getCurrentBindings()
如果作业参数为{"foo": "bar"}
,则上面代码的结果为{'foo': 'bar'}
。请注意,数据库仅允许将作业参数从str
映射到str
,因此键和值始终为字符串。
getCurrentBinding()
方法似乎也适用于获取笔记本的任何活动widget values(交互运行时)。
获取jobID和runID
要获取jobId
和runId
,您可以从dbutils
获取包含该信息的上下文json。(改编自databricks forum):
import json
context_str = dbutils.notebook.entry_point.getDbutils().notebook().getContext().toJson()
context = json.loads(context_str)
run_id_obj = context.get('currentRunId', {})
run_id = run_id_obj.get('id', None) if run_id_obj else None
job_id = context.get('tags', {}).get('jobId', None)
因此在上下文对象中,runId
的按键路径为currentRunId > id
,jobId
的按键路径为tags > jobId
。
相关文章