作者:Rajkumar Irudayaraj, Sriram Sethuraman, Avijit Goswami, Michael Chess, Ifetayo Stewart, Ravi Bhattiprolu, Jason Berkowitz, 和 MikePatterson,发表于2024年9月12日,源自 ,,以及 。
在数字化转型和数据驱动决策的时代,企业必须迅速从其数据中获取洞察,从而提供卓越的客户体验并获取竞争优势。Salesforce 与 Amazon的合作,帮助客户通过在 和 之间的双向 数据共享,解锁统一数据的价值并加速洞察的时间。
在本系列的 中,我们讨论了如何在同一 AWS 区域内配置 Salesforce Data Cloud 和客户 AWS账户之间的数据共享。在本文中,我们将讨论 Salesforce Data Cloud 和客户 AWS 账户之间的跨区域数据共享的架构和实施细节。
Salesforce Data Cloud 提供了一种直观的方式来与客户的 AWS 账户共享数据。在 控制台上,您可以接受数据共享、创建资源链接、将 Salesforce Data Cloud 对象挂载为数据目录视图,并授予权限以查询 中的实时统一数据。Salesforce Data Cloud 和客户 AWS 账户之间的跨区域数据共享支持两种部署场景: 和 Redshift预配集群 (RA3)。
下图描绘了在 US-WEST-2
的 Data Cloud 实例与在 US-EAST-1
的 Redshift Serverless之间设置跨区域数据共享的步骤。
删除)
跨区域数据共享的设置包括以下步骤:
US-WEST-2
中创建数据共享。US-WEST-2
的客户 AWS 账户中创建跨账户的 Lake Formation 资源共享。US-WEST-2
的 Lake Formation 控制台中接受数据共享邀请,并向 (IAM)主体授予默认(选择和描述)权限。US-EAST-1
并创建一个指向 US-WEST-2
区域共享数据库的资源链接。US-EAST-1
中的 Amazon Redshift 查询编辑器,并创建一个引用数据共享资源链接的外部架构。可以通过这些外部表查询数据。Salesforce Data Cloud 和 Redshift 预配集群之间的跨区域数据共享除了 Serverless 设置外还需要额外步骤。根据
的相关考量,Redshift 外部表的预配集群和 桶必须位于相同区域。下图描绘了与 Redshift 预配集群共享数据的设计模式与步骤。
删除)
步骤 1-5 在 Redshift Serverless 和预配集群的跨区域共享中相同。必须在 Redshift Serverless和预配集群上启用加密。以下是附加步骤:
CREATE TABLE AS SELECT
从数据共享中创建一个表,在 Redshift Serverless 中创建数据共享,并授予 Redshift 预配集群访问权限。基于此解决方案,新表需要定期刷新以获取共享 Data Cloud 对象的最新数据。
有关数据共享的全面考虑事项和限制,请参见 。一些关于零拷贝数据共享的重要事项包括:
在进行设置之前, 在同区域和跨区域数据共享中保持相同。
创建数据共享、创建数据共享目标、将数据共享目标链接到数据共享并在 Lake Formation中接受数据共享的步骤在同区域和跨区域数据共享中保持相同。请参阅本系列的 以完成设置。
如果您正在使用 Redshift Serverless,请完成以下步骤:
删除)
资源链接将出现在 Lake Formation 控制台的 Databases 页面,如以下截图所示。
删除)
awsdatacatalog
下。要查询数据,请运行以下命令并创建外部架构。将资源链接指定为数据目录数据库、Redshift Serverless 区域和 AWS 账户 ID。sql CREATE external SCHEMA cross_region_data_share --<<SCHEMA_NAME>> FROMDATA CATALOG DATABASE 'cross-region-data-share' --<<RESOURCE_LINK_NAME>> REGION 'us-east-1' --<TARGET_REGION> IAM_ROLE 'SESSION' CATALOG_ID '<<aws_account_id>>'; --<<REDSHIFT AWS ACCOUNT ID>>
dev
数据库中创建的外部架构。删除)
show tables
命令以检查外部数据库下的共享对象:sql SHOW TABLES FROM SCHEMA dev.cross_region_data_share --<<schema name>>
删除)
sql SELECT * FROMdev.cross_region_data_share.churn_modellingcsv_tableaus3_dlm; --<<changeschema name & table name>>
删除)
本节是前一节的延续,当消费者是预配 Redshift 集群时,需要附加步骤使数据共享正常工作。请参阅 和 ,以获取有关概念和实施步骤的深入理解。
sql CREATE SCHEMA customer360_data_share; CREATE TABLEcustomer360_data_share.customer_churn AS SELECT * FROMdev.cross_region_data_share.churn_modellingcsv_tableaus3_dlm;
删除)
sql SELECT current_namespace;
删除)
删除)
sql CREATE DATASHARE customer360_redshift_data_share; ALTER DATASHAREcustomer360_redshift_data_share ADD SCHEMA customer360_data_share; ALTERDATASHARE customer360_redshift_data_share ADD TABLEcustomer360_data_share.customer_churn; GRANT USAGE ON DATASHAREcustomer360_redshift_data_share TO NAMESPACE '5709a006-6ac3-4a0c-a609-d740640d3080'; --<<Data Share Consumer Namespace>>
删除)
删除)
现在数据共享已准备好进行查询。
删除)
您可以根据业务需求定期刷新创建的表,以获取来自数据云的最新数据。
Salesforce Data Cloud 与 Amazon Redshift之间的零拷贝数据共享标志着组织在使用客户360数据方面的一项重大进展。通过消除数据移动的需求,这种方法提供了实时洞察、降低成本和增强安全性。随着企业继续优先考虑数据驱动的决策,零拷贝数据共享将在解锁跨平台客户数据的全部潜力中发挥关键作用。
这种集成使组织能够打破数据孤岛,加快分析速度,并推动更灵活的以客户为中心的战略。要了解更多,请参阅以下资源:
删除)RajkumarIrudayaraj** 是 Salesforce 的高级产品总监,在数据平台和服务领域拥有超过 20 年的经验,热衷于向客户提供数据驱动的体验。
删除)SriramSethuraman 是 Salesforce Data Cloud 产品管理部的高级经理。他在使用大数据技术开发产品方面拥有超过 9 年的经验。在 Salesforce 的当前角色中,Sriram 负责与主要数据湖合作伙伴进行零拷贝集成,并帮助客户通过数据策略产生价值。
删除)JasonBerkowitz** 是 AWS Lake Formation 的高级产品经理,
Leave a Reply