《数据仓库简明教程.docx》由会员分享,可在线阅读,更多相关《数据仓库简明教程.docx(12页珍藏版)》请在第一文库网上搜索。
1、数据仓库简明教程导读:数据仓库是商业和数据科学中最热门的话题之一。但是,如果你是该领域的新手,你可能想知道:数据仓库是什么?数据仓库有什么作用?数据仓库是怎么运行的?编辑:Mika来源:CDA数据分析师别担心,因为在接下来的4分钟你将知晓这所有问题的答案。点击下方视频,先睹为快,时长03:31好的,首先让我们看到定义。单一数据源是什么意思。在信息系统理论中,单一数据源是在一个地方构造全部最佳质量数据的实践。让我们看到一个简单的例子。你肯定遇到过这种情况,当你在处理文件,并且创建不同的版本,这时你怎么给文件命名?当你完成后,你通常会在结尾加上最终版。这导致一堆带有扩展名的文件,比如,最终.最终
2、最终.最终.最终”,或者是我的最爱一一真正最终版最终版如果你是这样,那你不是一个人。看来即使是公司,也可能永远都不知道最新或最合适的文件在哪里。但是如果你知道有个地方,会始终拥有单一的数据源,这就太有帮助了,不是么?数据仓库就可以满足这种需求。01数据仓库是什么?VGDCVS1WBAWHERE VALUABLE DATAASSETS ARE STORED简而言之,数据仓库是公司事实上的单一数据源。通常创建它是为了将其主要用于数据报告数据仓库有几个定义特征,即:归纳性DEFINING FEATURES OF A DA8 SUBJECT-ORIENTEDINTEGRATED SS TIME-VAR
3、IANTNONVOLATILE S S SUMMARIZED让我们快速地分别看看。面向对象这意味着数据仓库中的信息会围绕某些方面。因此,它永远不会包含所有公司数据,不只会msUWEMllElJTED例如,竞争对手的数据不需要出现在数据仓库中。但是,自己的销售数据肯定会在。集成性对应于开头的例子,在命名方而,每个数据库、每个团队,甚至每个人都有自己的偏好。S INTEGRATEDMASTER DATA GOVERNA这就是为什么要开发通用标准,以确保数据仓库在任何方面都能选择最佳质量的数据。这与时变:与以下事实有关,数据仓库也包含历史数据。OHARIANTREPORT FROM385 V DotaSdence如前所述,我们主要使用数据仓库进行分析和报告。这意味着我们需要知道五到十年前发生永久性匿刖 WOMTIII0 CANT BE CHANGEDX CANT BE DELETED意味着数据仅按原样录入数据仓库。一旦存入,就无法更改或删除。归纳性OUMtfARIZEDAGGREGATED OR SEGMENTEDFOR ANALYSIS AND REPORTING