目前的互联网环境下,由于关系型数据库中严格的语法约束,健康小屋的的强大的结构化数据检索与分析能力可以达到大规模数据处理的需求,而基于同样的原因在面对非结构化数据与半结构化数据的场景下,关系型数据库己无法满足需求,同时在数据即时性上也无法达到互联网对于数据处理效率的需求,因此,本文中使用分布式关系型数据库与非关系型数据库结合的方式进行系统数据架构的处理与搭建。
健康小屋的的即使关系型数据库在目前的应用需求下存在大量的弊端,但是面对结构化的数据存储、查询与分析操作,其严谨的结构与强大的检索能力还是无法替代的,因此在本文中使用分布式架构化的关系型数据库集群架构作为系统结构化数据的处理核心,而在系统中统计分析功能依然沿用关系型数据库中的数据仓库技术、多维度分析技术与数据挖掘技术进行系统数据的分析运算。
健康小屋的的基于关系型数据库的数据统计分析技术以数据仓库技术为核心,至今已发展了近三十年,在关系型数据库进行数据处理前通过数据仓库技术对数据进行初步的整理与建模,数据仓库技术在上世纪九十年代初由W.H.Inmon提出,通过初步的ETL过程,即数据清洗、传输过程将符合存储规则的数据库进行通过业务需求的冗余式处理,并在处理过程中通过多重计算得到负责决策要求的数据模型,从而进行下一步的数据分析操作,数据仓库技术目前已被应用于数据分析领域的各个方面,是当前关系型数据库数据统计分析工具的重要组成部分。