介绍
许多组织都要处理大量数据。 此大数据通常可以是原始的、散乱的,并存储在多个位置,如关系、非关系和其他存储系统。 这些组织面临的一项重大挑战是,为该大数据排序,并将其优化为可操作的业务见解。
Microsoft Azure 数据工厂是一项托管的云服务,可基于散乱数据创建可操作的业务见解。 它有助于你管理复杂的混合提取、转换和加载 (ETL)、提取-加载-转换和数据集成项目。
示例方案
假设你在游戏公司工作,在公司内收集游戏会话过程中生成的数据日志。 如果可以分析此日志数据,则可以深入了解客户的偏好、人口统计信息和使用行为。 销售团队中的人员对向上销售和交叉销售机会感兴趣,并想知道这些数据日志是否可能包含有用的信息。 开发和技术团队有兴趣了解游戏体验的潜在问题,以及如何借助新功能解决这些问题。
问题在于,若要成功分析日志中的数据,还需要引用存储在本地位置的数据。 此数据包括客户信息、游戏信息和市场营销活动信息。 你的公司将游戏日志数据存储在云数据存储中,并且希望你同时使用所有本地数据。
若要继续数据分析,一个关键步骤是将本地数据与游戏日志中的其他数据组合在一起。 计划是使用 Azure Analysis Services 处理合并的数据。 然后,将转换后的数据发布到云数据仓库,并通过使用 Power BI 和其他工具将其可视化。 Azure 数据工厂可帮助你实现此目标。
我们要做什么?
本模块介绍 Azure 数据工厂如何协调大数据。 评估 Azure 数据工厂是否可以帮助你集成数据源。 此外还介绍 Azure 数据工厂如何从本地、多云和软件即服务 (SaaS) 数据源引入数据。
主要目标是什么?
完成本模块后,你就可以详细了解 Azure 数据工厂如何帮助你创建和计划数据驱动工作流,以从不同的数据存储中引入数据。 你可以评估 Azure 数据工厂是否可帮助你生成复杂的 ETL 过程,来使用计算服务或数据流直观地转换此数据。