济南监控数据存储分享什么是数据分层?
3年前 (2021-11-17)行业资讯
济南监控数据存储供应商指出,确定建模思想和模型类型之后,下一步是数据分层。数据分层可以使数据构建系统更加清晰,方便数据用户快速定位数据,还可以简化数据处理过程,降低计算复杂度。
我们常用的数据仓库的数据层次结构通常分为三层:Mart层、中间层和基础数据层。将传统的多层结构简化为上下三层结构的目的是压缩整体数据处理过程的长度,而扁平化的数据处理过程有利于数据质量控制和数据运维。
在上下三层结构的右侧,我们添加了流数据作为数据系统的一部分。这是因为当前的数据应用方向会越来越重视数据的时效性。
济南监控数据存储供应商指出,由于流数据集的各个处理流程成本较高,一般采用需求驱动的方式构建,所以流数据系统的结构更加扁平化,通常没有设计中间层。
让我们看看每一层的具体功能。
数据库层
数据基础层的主要工作包括:
数据收集:在一个平台上收集不同数据源的数据;
数据清理:对不符合质量要求的大数据进行清理;
数据分类:建立数据目录,底层一般按源系统和业务领域进行分类;
结构化数据,结构化用于半结构化和非结构化数据;
数据规范化,包括标准化尺寸标识、统一UOM等标准化操作。
数据中间层
数据中间层最重要的目标是连接来自同一实体的不同数据源的数据。例如,抽象的关系数据,如兴趣、偏好和习惯,是推荐和个性化的基本生产手段。
例如,如果一个事实数据与两个主题相关,但没有成为一个独立的主题,它将被放在两个主题库中;为了提高单个数据表的可重用性,降低计算相关性,事实表中通常存在冗余维度信息。
发表评论
相关文章
掌握西安数据可视化模板应用技巧发掘工具潜能3年前 (2021-09-04)
熟悉南京数字孪生应用技巧满足行业应用多样化需求3年前 (2021-09-10)
武汉数据分析平台怎样提高服务性价比?3年前 (2021-11-20)