🗄️ 数据架构

掌握数据架构设计的核心理念与实践方法

3NF
范式设计
ACID
事务特性
NoSQL
非关系数据库
Lambda
大数据架构

🔴 考试重点

数据建模、数据库范式、ACID特性、NoSQL数据库类型是考试的重点内容!

数据架构概述

数据架构定义

数据架构是组织数据资产的蓝图,定义了数据的结构、存储、集成、安全和治理策略,确保数据能够有效支持业务目标。

核心组件

  • 数据模型:数据结构和关系的抽象表示
  • 数据存储:数据的物理存储方式和位置
  • 数据集成:不同数据源的整合策略
  • 数据流:数据在系统中的流动路径

数据架构层次

概念层

业务概念和实体关系

逻辑层

数据结构和约束定义

物理层

存储实现和性能优化

应用层

数据访问和应用接口

数据建模

概念数据建模

ER模型

实体 (Entity)

现实世界中可区分的对象

属性 (Attribute)

实体的特征或性质

关系 (Relationship)

实体之间的联系

关系类型

一对一 (1:1)

每个实体最多与另一个实体关联

一对多 (1:N)

一个实体可与多个实体关联

多对多 (M:N)

多个实体可与多个实体关联

逻辑数据建模

关系模型

基本概念
  • • 关系 (Relation)
  • • 元组 (Tuple)
  • • 属性 (Attribute)
  • • 域 (Domain)
完整性约束
  • • 实体完整性
  • • 参照完整性
  • • 用户定义完整性

规范化理论

1NF:属性不可再分
2NF:消除部分函数依赖
3NF:消除传递函数依赖
BCNF:消除主属性对候选键的部分和传递依赖

物理数据建模

存储结构设计

  • • 表空间设计
  • • 分区策略
  • • 索引设计
  • • 数据类型选择
  • • 存储参数
  • • 压缩策略

性能优化

  • • 查询优化
  • • 索引优化
  • • 分区优化
  • • 缓存策略

数据建模工具

商业工具

ERwin

企业级数据建模工具

PowerDesigner

综合建模解决方案

IBM InfoSphere

数据架构和治理平台

开源工具

MySQL Workbench

MySQL数据库设计工具

pgModeler

PostgreSQL建模工具

Draw.io

在线图表绘制工具