【为什么建数据仓库需要使用ETL工具?】数据仓库 。是为企业所有级别的决策制定过程 。提供所有类型数据支持的战略集合 。它是单个数据存储 。出于分析性报告和决策支持目的而创建 。既然要获取全部数据 。必然涉及到多系统 。各类型数据库的对接问题 。还有数据抽取、整理的问题 。

文章插图
这时候ETL工具的作用就集中体现出来了 。数据的抽取、转换、加载直到供人们去分析使用 。ETL就是数据抽取、转换、加载的过程 。

文章插图
有些地方可能选择的是ELT 。先加载在转换 。对数仓来说 。ETL首先要考虑业务需求 。最后数据落地模型 。要体现某种主题 。
然后从数据源考虑哪些字段是可以用的 。在进行ETL 。现在ETL工具很多 。所以编程能力很难在这方面体现出来 。对于公司来说 。更看重的是ETL的思路 。通俗的想 。数据仓库就像大水池 。给水池蓄水需要泵和水管 。那ETL就是承担泵和水管的功能 。

文章插图
其他观点:
二、ETL的组成部分
(一) 数据的抽取(Extract)
(二)数据的清洗转换(Cleaning、Transform)
(三) 数据加载(Load)
三、ETL 实现方式
借助ETL工具:**(如Oracle的OWB、SQL Server 2000的DTS、SQL Server2005的SSIS服务、Informatic等)实现 。
SQL方式实现:**SQL的方法优点是灵活 。提高ETL运行效率 。但是编码复杂 。对技术要求比较高 。
ETL工具和SQL相结合** 。前两种方法各有各的优缺点 。借助工具可以快速的建立起ETL工程 。屏蔽了复杂的编码任务 。提高了速度 。降低了难度 。综合了前面二种的优点 。会极大地提高ETL的开发速度和效率 。
四、数据仓库ODS、DW和DM概念区分

文章插图

文章插图
其他观点:
为什么会出现数据仓库?没有数据仓库时 。我们需要直接从业务数据库中取数据来做分析 。虽然可以用于分析 。但需要做很多额外的调整 。在我看来 。主要有以下几个问题:结构复杂 。数据脏乱 。难以理解 。缺少历史 。大规模查询缓慢 。
然后数据仓库就出现了 。各种数据都有结构、有规模地在一起 。做决策更有一套 。
什么是ETL?简单来说 。如果把数据分析类比成做菜 。ETL相当于备菜 。
数据仓库是单个数据存储 。出于分析性报告和决策支持目的而创建 。既然要获取全部数据 。必然涉及到多系统 。各类型数据库的对接问题 。还有数据抽取、整理的问题 。
这时候ETL工具的作用就集中体现出来了 。数据的抽取、转换、加载直到供人们去分析使用 。
通俗的想 。数据仓库就像大水池 。给水池蓄水需要泵和水管 。那ETL就是承担泵和水管的功能 。

文章插图
- 如何实现快速建站?
- 如何做好网站建设?
- 如何搭建网站服务器?
- 网站后台怎么搭建?
- 如何建设企业网站?
- 系统 如何在公司建一个网站,来把资料上传大家一起看、编辑?
- 捞女、贴家庭主妇标签、没底线!为什么批评李靓蕾的全是女人?
- 广东人为什么喜欢叫人“捞佬”或“捞妹”?
- 阿胶固元糕过期了还能吃吗
- 为什么广东广西人,称外地人都叫捞佬,捞妹呢?是歧视的意思吗?
