🗄️ 数据架构
掌握数据架构设计的核心理念与实践方法
3NF
范式设计
ACID
事务特性
NoSQL
非关系数据库
Lambda
大数据架构
🔴 考试重点
数据建模、数据库范式、ACID特性、NoSQL数据库类型是考试的重点内容!
数据架构概述
数据架构定义
数据架构是组织数据资产的蓝图,定义了数据的结构、存储、集成、安全和治理策略,确保数据能够有效支持业务目标。
核心组件
- • 数据模型:数据结构和关系的抽象表示
- • 数据存储:数据的物理存储方式和位置
- • 数据集成:不同数据源的整合策略
- • 数据流:数据在系统中的流动路径
数据架构层次
概念层
业务概念和实体关系
逻辑层
数据结构和约束定义
物理层
存储实现和性能优化
应用层
数据访问和应用接口
数据建模
概念数据建模
ER模型
实体 (Entity)
现实世界中可区分的对象
属性 (Attribute)
实体的特征或性质
关系 (Relationship)
实体之间的联系
关系类型
一对一 (1:1)
每个实体最多与另一个实体关联
一对多 (1:N)
一个实体可与多个实体关联
多对多 (M:N)
多个实体可与多个实体关联
逻辑数据建模
关系模型
基本概念
- • 关系 (Relation)
- • 元组 (Tuple)
- • 属性 (Attribute)
- • 域 (Domain)
完整性约束
- • 实体完整性
- • 参照完整性
- • 用户定义完整性
规范化理论
1NF:属性不可再分
2NF:消除部分函数依赖
3NF:消除传递函数依赖
BCNF:消除主属性对候选键的部分和传递依赖
物理数据建模
存储结构设计
- • 表空间设计
- • 分区策略
- • 索引设计
- • 数据类型选择
- • 存储参数
- • 压缩策略
性能优化
- • 查询优化
- • 索引优化
- • 分区优化
- • 缓存策略
数据建模工具
商业工具
ERwin
企业级数据建模工具
PowerDesigner
综合建模解决方案
IBM InfoSphere
数据架构和治理平台
开源工具
MySQL Workbench
MySQL数据库设计工具
pgModeler
PostgreSQL建模工具
Draw.io
在线图表绘制工具