Advertisement

计算机三级 - 数据库技术 - 第十三章 大规模数据库架构 笔记

阅读量:

第十三章 大规模数据库架构

内容提要:

  1. 了解分布式数据库技术
  2. 了解并行数据库技术
  3. 了解云数据库技术
  4. 了解XML数据库技术

13.1****分布式数据库

分布式数据库的目标:【12个目标】

  • 本地自治、非集中式管理、高可用性。(最基本特征)
  • 位置独立性、数据分片独立性、数据复制独立性。(分布透明性)
  • 分布式查询处理、分布式事务管理。(复杂性)
  • 硬件独立性、操作系统独立性、网络独立性。
  • 数据库管理系统独立。(总体体现)

数据分布策略:

复制代码
1. 数据分片:【对分片结果的操作】【考虑的是怎样从概念模型到逻辑模型的存储策略】 
   * 水平分片----每个分片是原始关系所有数据行的子集合
   * 垂直分片----每个分片是原始关系所有数据列的子集合
   * 导出分片----导出水平分片
   * 混合分片----以上三种的混合
2. 数据分配:【考虑的是怎样从逻辑模型到物理模型的映射】 
   * 解决数据分配的方法: 
 * 集中式----所有数据片断安排在一个场地上。
 * 分割式----所有全局数据有且只有一份,分割成若干被分配在特定场地上的片断。
 * 全复制式----全局数据有多个副本,每个场地上有一个完整的数据副本。
 * 混合式----介于分割与全复制式之间。

分布式数据库的参考模式结构:

分布透明性:

复制代码
1. 分片透明性
2. 位置透明性
3. 局部数据模型透明性

分布式数据库管理系统:

分布式数据库的相关技术:

复制代码
1. 
分布式查询:用户与分布式数库系统的接口。
复制代码
   * 分布式查询优化需考虑: 
 1. 操作执行的顺序。
 2. 操作的执行算法(连接操作和并操作)
 3. 不同场地间的数据流动的顺序。
2. 
分布式事务管理
复制代码
   * 主要包括: 
 1. 恢复控制 
    * 基于两阶段的提交协议。
 2. 并发控制 
    * 基于封锁协议。

13. 2****并行数据库

并行数据库系统结构

实现并行DBMS的三种硬件结构:

共享内存系统
共享磁盘系统
无共享资源系统
层次结构

二. 数据划分与并行算法

  1. 一维数据划分:将大数据集水平划分到多个磁盘上,可以通过并行读写有效地利用多磁盘的I/O带宽。
    1. 轮转法
    2. 散列法----使用特定的哈希函数,作用于选定的属性,将记录划分到不同的处理机。
    3. 范围划分法

  2. 多维数据划分
    1. CMD多维划分法
    2. BERD多维划分法
    3. MAGIC多维划分法

  3. 并行算法:
    1. 并行排序
    2. 并行连接
    划分连接
    分片--复制连接
    3. 其他的关系操作:
    选择
    消除重复
    投影
    聚集

13. 3****云计算数据库架构

云计算的服务类型:

将基础设施作为服务 将平台作为服务 将基础设施作为服务
  • 云:即云计算提供商的数据中心的软硬件设施
  • 云分为:
    1. 公共云:以即用即付的方式提供给公众。
    2. 私有云:不对公众开放的云。
    3. 混合云
  • 云数据库与传统数据库比较:

云数据库的缺点:

  1. 数据安全问题
  2. 对云的管理问题
  3. 对因特网的依赖

13. 4 XML****数据库

  1. XML数据库概述:
    • XML ----可扩展标识语言。
    • XML数据库----支持对XML文档格进行存储和查询等操作的数据库管理系统
  • 三种类型的XML数据库:

    1. XEDB----能处理XML的数据
    2. NXD----纯XML数据库
    3. HXD----混合XML数据库
  • 与传统数据库比较,XML数据库的优势:

    1. 能够对半结构化数据进行处理。
    2. 提供对标签和路径的操作。
    3. 能清晰地表达数据的层次特征。

其余章节进我主页进行查看

全部评论 (0)

还没有任何评论哟~