数据库,数据仓库,数据中台这些关于数据的概念性的东西,对于初学者来讲,非常容易混淆。

在使用计算机的过程中,我们经常会遇见需要进行数据存储的场景,比如,通讯录数据,进销存数据。在数据量不是特别大的时候,我们通常采用excel文件形式、txt文件、word文档等形式来存储数据。当数据量越来越大时,这种个人常用的数据存储方式会变得不太方便更新,不方便查询等,因此,需要一种数据管理工具,对这些零散的数据进行管理。
数据库以一定的方式将数据存储在一起的、能提供给多个用户共享的数据集合。它给用户提供了另外一种数据管理的方式,它能根据用户需求,将数据按照一定的规律进行存储。如果将前面讲到的通讯录比喻成一本书,那么数据库就是电子化的书柜,给用户提供便捷的增删查改等操作。常见的数据库关系型数据库有mysql,sqlserver,db2等;
数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合。相对于数据库来讲,数据仓库存储的数据针对性更强,且一般不太更新,而是对历史数据进行累积,所以,它的另一特性就是可以反应数据的历史变化。
面向主题的(Subject Oriented):在较高层次上将企业信息系统中数据进行综合、归类分析利用。属于一个抽象概念,每一个主题基本对应一个宏观分析领域。主题(Subject)是对应企业中某一宏观分析领域所涉及的分析对象(重点是分析的对象,对象,仔细理解一下对象的含义)。
例如:"销售分析"就是一个分析领域,这个"销售分析"所涉及到的分析对象为商品、供应商、顾客、仓库等,那么数仓主题可以确定为商品主题、供应商主题、顾客主题、仓库主题;联系到下文"销售分析"可以作为一个主题域;如果"产品分析"是一个分析领域,"产品分析"所涉及到的分析对象为商品、地域、时间、类别等,那么数仓的主题确定为商品主题、地域主题、时间主题、类别主题,"产品分析"可以作为一个主题域
集成的(Integrate):数据仓库中存储