读书笔记 | 阿里大数据之路：第2篇数据模型篇

如题所述

举报该问题

第1个回答 2024-04-08

大数据模型探索：从整合到实践

数据建模是大数据旅程的关键，它旨在优化性能、成本和效率，消除冗余，提升数据质量。在《阿里大数据之路：第2篇数据模型篇》中，我们深入探讨了这一领域的核心原理和阿里巴巴的实践经验。

8.1 优化平衡
数据模型的构建要求对性能、成本和效率进行细致权衡，通过减少冗余，确保数据一致性，从而提高整体效率和数据处理质量。

8.2 数据仓库与关系DB

OLTP倾向于使用3NF模型，追求实时性能，而OLAP则关注数据整合与性能提升，采用不同的策略和方法论。

ER模型

维度模型

Data Vault

Anchor模型

阿里巴巴在实践中，从Oracle到MPP架构的转变，表明ER模型在大规模环境中的挑战，最终转向了维度建模和MaxCompute平台。

9.1 数据爆炸应对
面对海量数据，我们构建高效的数据模型体系，预防无序和重复，强化数据管理与一致性，构建统一的ODS、DWD和DWS层次结构。

9.2 数据规范构建

基于维度建模，定义了清晰的数据域、业务流程、维度属性和指标，强调命名一致性，如"用户"的业务抽象和"时间周期"的数据统计范围。通过命名约定和简写，确保算法明确，区分事务、存量和复合派生指标。
9.3 指标设计与模型构建

9.4 模型实施策略

数据仓库建设遵循螺旋式实施流程，通过OneData工具，确保模型的准确性和效率。
10. 数据模型的复杂性与处理
从维度设计到归档策略，处理快速变化和多值维度，如维表更新、存储优化、行为维度的精细划分，确保模型的稳定性和易用性。

11. 事实表设计的艺术

事实表是数据模型的灵魂，围绕业务流程设计，注重事实类型、粒度选择和维度确定，强调一致性与易用性，如事务、快照和累积快照事实表的差异与选择。
总结
阿里巴巴的大数据模型实践，不仅关注理论的精进，更注重在实际场景中的灵活应用和优化。从整合到实践，每一环节都为数据的高效利用和一致性保驾护航。

相似回答

《DAMA-DMBOK2》读书笔记-第3章数据治理答：数据治理目标: 1 提升管理数据资产的能力;2 定义、批准、沟通和实施数据管理的原则、政策、程序、指标、工具和责任;3 监控和指导政策合规性、数据使用和管理活动。P44 有效的数据治理应具有以下特征: 1 可持续发展;2 嵌入式的,而不是附加的管理流程;3 可度量。P46 数据治理基础原则: (1)领导力和战略;成功的...

读书笔记(摘抄+赏析)答：们。星辰告诉我们什么是静美,什么幻想,什么是浪漫... 我是第一个醒来为辰送别的人吗?但愿是而又但愿不是,因为我渴望和星辰悄悄对话,说一些动人的藏在心底的话,但同时我们谁又不渴望那令人欣喜的知音呢,和他们一起送别辰,,不是更好吗? 辰即将远去了,走到那离我们很远的彼岸,我和一起为他送行,在天际的飘渺...

《计算机与人脑》--读书笔记答：当计算机在解决一个问题时,输入进来的数据一个个保存在寄存器中,然后每用到一个数据再去读取(或者说是寄存器“复述”这个数据),存入时间和存取时间在运算过程中就会增加整个运算所用的时间,这种结构在硬件上实现似乎是相当没有经济性,哪怕是现在纳米级的真空管元件构成的计算机处理器,性能的提升也是避免不了这种瓶颈。

彼得·德鲁克《创新与企业家精神》读书笔记答：2,不协调的事件。 3,基于程序需要的创新。 4,产业和市场结构上的改变;5,人口统计数据; 6,认知,情绪以及意义上的改变; 7,新知识,包括科学的和非科学的。如果一个产业的运营方式正在发生迅速改变,那么这意味着,该产业的基本结构上的变化时机也已经成熟。以认知为基础的创新必须从较小且非常具体的地方做起。

《时代广场的蟋蟀》读书笔记答：《时代广场的蟋蟀》读书笔记2 这本书大概是讲述了有关蟋蟀、老鼠和猫的之间友谊的故事。但其实又不仅仅是如此,还有关于各种生命之间爱和关怀以及发自大自然、涤荡心弦的音乐之声的故事。一切的安排都源自一场意外,正如我们在平淡中渴望着意外,又在意外中经历着不安与恐惧,然而,经历过后我们又会相信这一切就是最好...

《人间食粮》读书笔记答：想必许多人都在为如何写好读书笔记而烦恼吧,下面是我帮大家整理的《人间食粮》读书笔记,希望能够帮助到大家。《人间食粮》读书笔记1 纳塔纳埃尔,切莫在未来中寻找过去。要抓住每一瞬间的新奇,不要事先准备你的快乐,要知道,在你有备的地方,会猝然出现另一种快乐。难道你还不明白,任何幸福都可遇不可求,就像...

时代广场的蟋蟀读书笔记答：2、于是,一切又安静下来,空气里弥漫着一种空虚,仿佛整个车站始终都在等待着那些成群的人潮投向它的怀抱。时代广场的蟋蟀读书笔记3 今天,我看了一本书名叫《时代广场的蟋蟀》的书。这本书讲述了一只乡村的蟋蟀,在康涅狄格州自由的生活着,却被人带去了纽约的时代广场。蟋蟀柴斯特在乡村呆久了,不熟悉城市的繁华...

海底两万里每章读书笔记答：经过一夜一天的追逐周旋,到第二天晚上,双方形成对峙。当林肯号向独角鲸发起进攻时,独角鲸却突然熄灭电光,向林肯号喷射大水。林肯号遭遇了灭顶之灾。七、不知其种属的鲸鱼:我被抛入海里,与孔塞伊在海中相依为命。正当筋疲力尽就要沉入海底时,被躲在独角鲸背上的内德.兰德拉出水面。内德说,这怪物不是鲸,是...

骆驼祥子每一章读书笔记50字答：骆驼祥子每一章读书笔记50字第一章:祥子生长在乡间,失去了父母和几亩薄田,十八岁时进城来拉车。经过不懈的艰苦努力,他买到了自己的一辆新车,成了北平城一流的洋车夫。第二章:祥子买上新车才半年,北平街上就流传爆发战争的消息,一天祥子怀着侥幸心理贪图高车费往清华拉客人,结果被军阀队伍抓去当差,车也被抢走。

大家正在搜

阿里大数据之路这本书买不到阿里的大数据之路阿里巴巴大数据之路阿里巴巴大数据之路实践大数据之路阿里巴巴pdf 大数据之路在哪里买阿里巴巴大数据哪里看大数据之路电子书化学之路读书笔记