AWS GLue中的AWS区域
问题描述
如何获取执行当前胶水作业的区域?
当粘合作业开始执行时,我看到输出
Detected region eu-central-1
。
在AWS Lambda中,我可以使用以下行来获取当前区域:
import os
region = os.environ['AWS_REGION']
但是,AWS_REGION
环境变量似乎不在Glue中,因此引发了KeyError
:
KeyError: 'AWS_REGION'
我需要该区域的原因是我正在尝试获取所有数据库和表,如this question中所述,并且我不想在创建boto客户端时对该区域进行硬编码。
解决方案
一种选择是将AWS_REGION
作为作业参数传递。例如,如果您从Lambda触发作业:
import os
response = client.start_job_run(
JobName = 'a_job_name',
Arguments = {'--AWS_REGION': os.environ['AWS_REGION'] }
)
或者,如果您使用AWS::Glue::Job云表单资源定义作业:
GlueJob:
Type: AWS::Glue::Job
Properties:
Role: !Ref GlueRole
DefaultArguments:
"--AWS_REGION": !Sub "${AWS::Region}"
Command:
ScriptLocation: !Sub s3://${GlueScriptBucket}/glue-job.py
Name: glueetl
然后您可以使用getResolvedOptions:
提取职务代码中的AWS_REGION
参数
import sys
from awsglue.utils import getResolvedOptions
args = getResolvedOptions(sys.argv, ['AWS_REGION'])
print('region', args['AWS_REGION'])
相关文章