如何使用复制活动中的复制前脚本根据源中的更改跟踪表删除接收器中的记录?

我正在尝试使用更改跟踪以增量方式将数据从SQL Server复制到Azure SQL数据库。我遵循了Microsoft Azure文档中的tutorial,但在为大量表实现此操作时遇到了一些问题。

在复制活动的源部分中,我可以使用一个查询,该查询为我提供了一个更改表,其中包含自上次更改跟踪版本以来更新、插入或删除的所有记录。此表看起来类似

PersonID   Age    Name   SYS_CHANGE_OPERATION
---------------------------------------------
1          12     John   U
2          15     James  U
3          NULL   NULL   D
4          25     Jane   I

PersonId是此表的主键。

问题在于,复制活动只能将数据附加到Azure SQL数据库,因此当记录更新时,它会因为重复的主键而给出错误。我可以通过让复制活动使用将数据合并到Azure SQL数据库上的表中的存储过程来处理此问题,但问题是我有大量的表。

我希望预复制脚本删除Azure SQL数据库上已删除和更新的记录,但我不知道如何做到这一点。是否需要为要复制的每个表创建单独的存储过程和相应的表类型,或者复制前脚本是否可以根据更改跟踪表删除记录?


解决方案

您必须在复制活动之前使用查找活动。通过该查找活动,您可以查询数据库,以便获得删除和更新的PersonID,最好都在一个字段中,用逗号分隔(这样更易于在复制前脚本中使用)。此处提供更多信息:https://docs.microsoft.com/en-us/azure/data-factory/control-flow-lookup-activity

然后您可以在预拷贝脚本中执行以下操作:

delete from TableName where PersonID in (@{activity('MyLookUp').output.firstRow.PersonIDs})

这样,您将在插入新行之前删除所有已删除或更新的行。

希望这能有所帮助!

相关文章