阅读更多

1 文件系统实例-FAT

1.1 Windows-FAT6文件系统

簇大小：1、2、4、8、16、32或64扇区
文件系统的数据记录在“引导扇区”中
文件分配表FAT的作用：描述簇的分配状态、标注下一簇的簇号等
FAT表项：2字节
目录项：32字节
根目录大小固定

1.1.1 主引导区-MBR

主引导区MBR是Main Boot Record的缩写，记录0号扇区，格式见下表

1.1.2 FAT文件系统-DBR

分区引导扇区DBR是Domaines Barons de Rothschild的缩写，格式见下表

1.1.3 引导扇区-BIOS参数块

1.1.4 引导扇区-扩展BIOS参数块（EBPB）

1.1.5 文件分配表FAT

文件分配表FAT是File Allocation Table的缩写

可以把文件分配表看成是一个整数数组，每个整数代表磁盘分区的一个簇号
状态：未使用、坏簇、系统保留、被文件占用（下一簇簇号）、最后一簇（0xFFFF）
簇号从0开始编号，簇0和簇1是保留的

1.1.6 FAT16目录项

1.2 FAT32文件系统

FAT32文件系统与FAT16文件系统的差异如下

FAT32的根目录区（ROOT区）不是固定区域、固定大小，而是数据区的一部分，采用与子目录文件相同的管理方式
目录项仍占32字节，但分为各种类型（包括：“.”目录项、“…”目录项、短文件名目录项、长文件名目录项、卷标项（根目录）、已删除目录项（第一字节为0xE5）等）
支持长文件名格式
支持Unicode
不支持高级容错特性，不具有内部安全特性

1.2.1 FAT32目录项

1.2.2 一般长文件名的实现方式

方式1

文件长度
文件属性
长文件名

每个文件占用的空间非固定，因此必须在开头指明长度，详见左图

方式2

文件名指针
文件属性

每个文件占用的空间固定，文件名用一块额外的区域来维护，以一个特殊字符作为文件名之间的间隔，详见右图

1.2.3 FAT32长文件名目录项格式

例子：文件名为The quick brown.fox，采用Unicode编码

2 文件操作的实现

2.1 创建文件

创建文件：建立系统与文件的联系，实质是建立文件的FCB

在目录中为新文件建立一个目录项，根据提供的参数及需要填写相关内容
分配必要的存储空间

create（文件名，访问权限）

检查参数的合法性
- 例如：文件名是否符合命名规则
- 有无重名文件
- 合法→步骤2，否则→报错、返回
申请空闲目录项，并填写相关内容
为文件申请磁盘块
返回

2.2 打开文件

打开文件：根据文件名在文件目录中检索，并将该文件的目录项读入内存，建立相应的数据结构（文件描述符/文件句柄），为后续的文件操作做好准备

为文件读写做准备，给出文件路径名，获得文件句柄(file handle)或文件描述符(file descriptor)，需将该文件的目录项读到内存

fd=open（文件路径名，打开方式）

根据文件路径名查目录，找到目录项（或I节点号）
根据文件号查系统打开文件表，看文件是否已被打开
- 是 → 共享计数加1
- 否则 → 将目录项 (或I节点)等信息填入系统打开文件表空表项，共享计数置为1
根据打开方式、共享说明和用户身份检查访问合法性
在用户打开文件表中获取一空表项，填写打开方式等，并指向系统打开文件表对应表项

返回信息：fd：文件描述符，是一个非负整数，用于以后读写文件

2.3 指针定位

系统为每个进程打开的每个文件维护一个读写指针，即相对于文件开头的偏移地址（读写指针指向每次文件读写的开始位置，在每次读写完成后，读写指针按照读写的数据量自动后移相应数值）

seek（fd, 新指针的位置）

由fd查用户打开文件表，找到对应的表项
将用户打开文件表中文件读写指针位置设为新指针的位置，供后继读写命令存取该指针处文件内容

2.4 读文件

read（文件描述符，读指针，要读的长度，内存目的地址）

根据打开文件时得到的文件描述符，找到相应的文件控制块（目录项）
- 确定读操作的合法性
- 读操作合法→②，否则→出错处理
将文件的逻辑块号转换为物理块号
- 根据参数中的读指针、长度与文件控制块中的信息，确定块号、块数、块内位移
申请缓冲区
启动磁盘I/O操作，把磁盘块中的信息读入缓冲区，再传送到指定的内存区（多次读盘）
反复执行③、④直至读出所需数量的数据或读至文件尾

3 文件系统的管理

3.1 文件系统的可靠性

文件系统的可靠性是指：抵御和预防各种物理性破坏和人为性破坏的能力

坏块问题

备份：通过转储操作，形成文件或文件系统的多个副本

名词解释

全量/增量转储
- 全量转储：定期将所有文件拷贝到后援存储器
- 增量转储：只转储修改过的文件，即两次备份之间的修改，减少系统开销
物理/逻辑转储
- 物理转储：从磁盘第0块开始，将所有磁盘块按序输出到磁带
- 逻辑转储：从一个或几个指定目录开始，递归地转储自给定日期后所有更改的文件和目录

3.2 文件系统的一致性

问题的产生：

磁盘块 → 内存 → 写回磁盘块
若在写回之前，系统崩溃，则文件系统出现不一致

解决方案：设计一个实用程序，当系统再次启动时，运行该程序，检查磁盘块和目录系统

3.2.1 磁盘块一致性检查

UNIX一致性检查工作过程：

两张表，每块对应一个表中的计数器，初值为0
表一：记录了每块在文件中出现的次数
表二：记录了每块在空闲块表中出现的次数

3.3 文件系统的写入策略

通写（write-through）

内存中的修改立即写到磁盘
缺点：速度性能差
例： FAT文件系统

延迟写（lazy-write）

利用回写（write back）缓存的方法得到高速
可恢复性差

可恢复写（transaction log）

采用事务日志来实现文件系统的写入
既考虑安全性，又考虑速度性能
例：NTFS

4 文件系统的安全性

4.1 文件保护机制

文件保护机制有如下作用：

用于提供安全性、特定的操作系统机制
对拥有权限的用户，应该让其进行相应操作，否则，应禁止
防止其他用户冒充对文件进行操作

4.2 文件的访问控制

主动控制：访问控制表

每个文件一个
记录用户ID和访问权限
用户可以是一组用户
文件可以是一组文件

能力表(权限表)

每个用户一个
记录文件名及访问权限
用户可以是一组用户
文件可以是一组文件

4.2.1 UNIX的文件访问控制

采用文件的二级存取控制，审查用户的身份、审查操作的合法性

第一级：对访问者的识别，对用户分类：
- 文件主（owner）
- 文件主的同组用户（group）
- 其他用户（other）
第二级：对操作权限的识别，对操作分类：
- 读操作（r）
- 写操作（w）
- 执行操作（x）
- 不能执行任何操作（-）

5 文件系统的性能

磁盘服务→速度成为系统性能的主要瓶颈之一。因此，设计文件系统应尽可能减少磁盘访问次数

提高文件系统性能的方法：

目录项(FCB)分解、当前目录、磁盘碎片整理
块高速缓存、磁盘调度、提前读取、合理分配磁盘空间、信息的优化分布、RAID技术…

5.1 块高速缓存

块高速缓存又称为文件缓存、磁盘高速缓存、缓冲区高速缓存，是指：在内存中为磁盘块设置的一个缓冲区，保存了磁盘中某些块的副本

检查所有的读请求，看所需块是否在块高速缓存中
如果在，则可直接进行读操作；否则，先将数据块读入块高速缓存，再拷贝到所需的地方
由于访问的局部性原理，当一数据块被读入块高速缓存以满足一个I/O请求时，很可能将来还会再次访问到这一数据块

块高速缓存的实现

块高速缓存的组织
块高速缓存的置换（修改LRU）
块高速缓存写入策略

5.2 提前读取

提前读取是指：每次访问磁盘，多读入一些磁盘块

依据：程序执行的空间局部性原理
开销：较小(只有数据传输时间)
具有针对性

5.3 WINDOWS的文件访问方式

Windows有如下三种文件访问方式

不使用文件缓存
- 普通方式
- 通过Windows提供的FlushFileBuffer函数实现
使用文件缓存
- 预读取。每次读取的块大小、缓冲区大小、置换方式
- 写回。写回时机选择、一致性问题
异步模式
- 不再等待磁盘操作的完成
- 使处理器和I/O并发工作

用户对磁盘的访问通过访问文件缓存来实现

由Windows的Cache Manager实现对缓存的控制
- 读取数据的时候预取
- 在Cache满时，根据LRU原则清除缓存的内容
- 定期更新磁盘内容使其与Cache一致（1秒）
Write-back机制
- 在用户要对磁盘写数据时，只更改Cache中的内容，由Cache Manager决定何时将更新反映到磁盘

阴影部分为需要访问的数据，数据在磁盘、系统缓存和进程地址空间有3份拷贝，通常下用户对数据的修改并不直接反映到磁盘上，而是通过write-back机制由lazy writer定期地更新到磁盘

5.4 合理分配磁盘空间

分配磁盘块时，把有可能顺序存取的块放在一起：尽量分配在同一柱面上，从而减少磁盘臂的移动次数和距离

5.5 磁盘调度

当有多个访盘请求等待时，采用一定的策略，对这些请求的服务顺序调整安排 → 降低平均磁盘服务时间，达到公平、高效

公平：一个I/O请求在有限时间内满足
高效：减少设备机械运动带来的时间开销

一次访盘时间 = 寻道时间+旋转延迟时间+传输时间

减少寻道时间
减少延迟时间

下面以一个例子来说明不同磁盘调度算法之间的差异

：假设磁盘访问序列：98，183，37，122，14，124，65，67
读写头起始位置：53
要求计算：
- 磁头服务序列
- 磁头移动总距离（道数）

5.5.1 先来先服务（FCFS）

先来先服务（FCFS）：按访问请求到达的先后次序服务

优点：简单，公平
缺点：效率不高，相临两次请求可能会造成最内到最外的柱面寻道，使磁头反复移动，增加了服务时间，对机械也不利

磁盘访问序列：98，183，37，122，14，124，65，67
读写头起始位置：53
磁头移动总距离（道数）：640磁道。(平均80)

5.5.2 最短寻道时间优先（Shortest Seek Time First）

最短寻道时间优先（Shortest Seek Time First）：优先选择距当前磁头最近的访问请求进行服务，主要考虑寻道优先

优点：改善了磁盘平均服务时间
缺点：造成某些访问请求长期等待得不到服务

磁盘访问序列：98，183，37，122，14，124，65，67
读写头起始位置：53
磁头移动总距离（道数）：236磁道(平均29.5)

5.5.3 扫描算法SCAN（电梯算法）

扫描算法SCAN（电梯算法）：

当设备无访问请求时，磁头不动
当有访问请求时，磁头按一个方向移动，在移动过程中对遇到的访问请求进行服务，然后判断该方向上是否还有访问请求
- 如果有则继续扫描
- 否则改变移动方向，并为经过的访问请求服务，如此反复

磁盘访问序列：98，183，37，122，14，124，65，67
读写头起始位置：53
磁头移动总距离（道数）：218磁道。(平均27.25)

5.5.4 单向扫描调度算法C-SCAN

单向扫描调度算法C-SCAN，减少了新请求的最大延迟

总是从0号柱面开始向里扫描
按柱面(磁道)位置选择访问者
移动臂到达最后一个柱面后，立即带动读写磁头快速返回到0号柱面
返回时不为任何的等待访问者服务
返回后可再次进行扫描

5.5.5 N-step-SCAN策略

N-step-SCAN策略，克服“磁头臂的粘性”

把磁盘请求队列分成长度为N的子队列，每一次用SCAN处理一个子队列
在处理某一个队列时，新请求添加到其他子队列中
如果最后剩下的请求数小于N，则它们全都将在下一次扫描时处理
N值比较大时，其性能接近SCAN；当N＝1时，即FIFO

###FSCAN策略

FSCAN策略，克服“磁头臂的粘性”

使用两个子队列
扫描开始时，所有请求都在一个队列中，而另一个队列为空
扫描过程中，所有新到的请求都放入另一个队列中
对新请求的服务延迟到处理完所有老请求之后

5.5.6 旋转调度算法

旋转调度：根据延迟时间来决定执行次序的调度

三种情况：
- 若干等待访问者请求访问同一磁头上的不同扇区
- 若干等待访问者请求访问不同磁头上的不同编号的扇区
- 若干等待访问者请求访问不同磁头上具有相同的扇区
解决方案：
- 对于前两种情况：总是让首先到达读写磁头位置下的扇区先进行传送操作
- 对于第三种情况：这些扇区同时到达读写磁头位置下，可任意选择一个读写磁头进行传送操作

5.6 信息的优化分布

记录在磁道上的排列方式也会影响输入输出操作的时间

例子：处理程序要求顺序处理8个记录；磁盘旋转一周为20毫秒/周；花5毫秒对记录进行处理

对于图左

信息连续存放
当读取信息1之后，经过5毫秒处理，此时磁头已经旋转至信息4位置处，若要读取信息2，还得空等15毫秒，让磁头旋转至信息2处，造成了时间的浪费

对于图右

信息交替存放
当读取信息1之后，经过5毫秒处理，此时磁头已经旋转至信息2处，此时恰好可以直接读取信息2，无须等待
当读取信息2之后，经过5毫秒处理，此时磁头已经旋转至信息3处，此时恰好可以直接读取信息3，无须等待
直至读完所有信息

5.6.1 记录的组成与分解

记录的成组：把若干个逻辑记录合成一组存放一块的工作

进行成组操作时必须使用内存缓冲区，缓冲区的长度等于逻辑记录长度乘以成组的块因子
成组目的：提高了存储空间的利用率；减少了启动外设的次数，提高系统的工作效率

记录的分解

从一组逻辑记录中把一个逻辑记录分离出来
典型例子—目录文件

5.7 RAID技术

RAID（独立磁盘冗余阵列）(Redundant Arrays of Independent Disks)：多块磁盘按照一定要求构成一个独立的存储设备

目标：提高可靠性和性能
考虑：磁盘存储系统的速度、容量、容错、数据灾难发生后的数据恢复

数据是如何组织的？

通过把多个磁盘组织在一起，作为一个逻辑卷提供磁盘跨越功能
通过把数据分成多个数据块，并行写入/读出多个磁盘，以提高数据传输率（数据分条stripe）
通过镜像或校验操作，提供容错能力（冗余）

最简单的RAID组织方式：镜像
最复杂的RAID组织方式：块交错校验

5.7.1 RAID0-条带化

数据分布在阵列的所有磁盘上
有数据请求时，同时多个磁盘并行操作
充分利用总线带宽，数据吞吐率提高，驱动器负载均衡

5.7.2 RAID1-镜像

最大限度保证数据安全及可恢复性
所有数据同时存在于两块磁盘的相同位置
磁盘利用率50%

5.7.3 RAID4-交错块奇偶校验

带奇偶校验
以数据块为单位

6 参考

《MOOC-操作系统原理-陈向群》