数据仓库:回顾 但是我们为什么实际

Exchange insights, tools, and strategies for canada dataset.
Post Reply
Bappy11
Posts: 477
Joined: Sun Dec 22, 2024 9:30 am

数据仓库:回顾 但是我们为什么实际

Post by Bappy11 »

源系统通常有不同的检索数据的方式。
出于性能原因,源系统不能在白天执行大量数据查询。
不同系统的数据无法轻松合并
需要进行清理、丰富和计算。
传统数据仓库定期读取源系统,根据商定的规则清理数据,通过执行经过验证的计算对原始数据进行解释,并在数据集市中准备这些数据。这些数据集市随后成为各种信息产品的基础。

如果我们看一下 Power BI 这样的工具,我们会发现 Power BI 完全能够从源系统检 新西兰电报数据 索数据、进行计算、清理和丰富数据,甚至在同一工具内创建可视化报告和仪表板。这最初似乎消除了对数据仓库的需要。然而,如果我们进一步观察,我们会发现数据仓库还有其他方面:

维护源系统中不再存在的数据。或者已经发生变异,旧值不再存在于源系统中。
如今,数据仓库包含越来越多的非结构化数据。
计算可能非常复杂,无法在自助服务工具中轻松地重新创建。
计算的定义在数据仓库中是固定的,这使其成为真相的来源。
我们看到,数据仓库的技术方面可以通过自助服务工具完美地接管,但并非所有功能属性都能够充分接管,从而导致数据仓库被逐步淘汰。
Post Reply