使用工作区API导入方法导入数据库笔记本(动态内容)

2022-09-04 00:00:00 python azure-databricks

问题描述

我要使用工作区API导入方法导入Databricks笔记本。笔记本的内容应该是动态的。我正在尝试使用以下代码,但出现错误:

错误的请求

请求包含无效的json正文。我已经尝试将content转换为Base64编码的数据,并在有效负载中传递它,但仍给出相同的错误。我主要想实现的是,我想动态生成笔记本的内容。

import requests
import os
import json

ctx = json.loads(dbutils.notebook.entry_point.getDbutils().notebook().getContext().toJson())
host_name = ctx['extraContext']['api_url']
host_token = ctx['extraContext']['api_token']
notebook_path = ctx['extraContext']['notebook_path']
new_path = os.path.join(os.path.dirname(notebook_path), 'New name')

data = {
  "content": "print(hellow world)",
  "path": new_path,
  "language": "PYTHON",
  "overwrite": true,
  "format": "SOURCE"
}

response = requests.post(
    '{host_name}/api/2.0/workspace/import',
    headers={'Authorization': f'Bearer {host_token}'},
    data = data
  ).json()

解决方案

这里有几个问题:

  • 根据documentation,content字段应该是Base64编码的,所以您需要这样做:
import base64
data = {
  "content": base64.b64encode("print(hellow world)".encode()),
  ...
}
  • 有效负载应该是JSON,但您使用的是data参数,该参数将数据作为多部分表单数据发送(请参见docs)。您需要使用json参数:
response = requests.post(
    f'{host_name}/api/2.0/workspace/import',
    headers={'Authorization': f'Bearer {host_token}'},
    json = data
  ).json()
  • 您正在尝试替换主机名,但您只使用了字符串,而不是f字符串,因此您需要将'{host_name}/api/2.0/workspace/import'更改为f'{host_name}/api/2.0/workspace/import'

相关文章