数据仓库如何提取数据

提取、转换和加载 (ETL) 流程会从多个 OnCommand Insight 数据库中检索数据、转换数据并将其保存到数据集市中。

OnCommand Insight 连接器会调用一系列批处理作业,以从多个 OnCommand Insight mySQL 数据库中提取数据,并将数据发布到各种数据集市中,如下图所示。


数据集市图

ETL 流程包括以下各个过程:

提取
此过程会从多个 OnCommand Insight 数据库中获取数据、转换数据并将其保存到数据集市中。系统会针对每个 OnCommand Insight 实例同时执行此过程。为了确保执行数据清理和重复数据删除,ETL 流程无法拆分为多个计划的 ETL 操作。
转换
此过程会应用业务逻辑规则或功能,以从 OnCommand Insight 数据库中提取数据。
加载
此过程会将转换后的数据加载到公共数据集市中。