Linux 文件系统相关的基本概念

日期：2020-05-29 栏目：程序人生浏览：次

盘片
硬盘其实是由单个或多个圆形的盘片组成的，按照盘片能够容纳的数据量，分为单盘(一个硬盘里面只有一个盘片)或多盘(一个硬盘里面有多个盘片)的硬盘。下面是一张盘片的示意图(此图来自互联网)：

Linux 文件系统相关的基本概念

磁道和柱面
硬盘中有磁头在盘片上读写数据，磁头固定在机械臂上，机械臂上有多个磁头(每个盘片的两侧各一个)。当磁头固定不动时(假设机械手臂不动)，盘片转一圈所画出来的圆就是磁道(track)。所有盘片上相同半径的那个磁道就组成了柱面(cylinder)。柱面是磁盘分区是的最小单位。

扇区
由圆心向外画直线，可以将磁道再划分为扇区，扇区就是盘片上最小的读写单位。通常情况下，一个扇区的大小为 512 个字节。因此可以使用下面的公式计算磁盘的容量：
柱面数 * 磁头数 * 扇区数 * 512 字节

磁盘分区

为什么要对硬盘进行分区呢？
因为我们必须要告诉操作系统：这块硬盘可以访问的区域是从 A 柱面到 B 柱面。如此一来，操作系统才能控制硬盘磁头去 A-B 范围内的柱面上访问数据。如果没有告诉操作系统这些信息，它就无法在磁盘上存取数据。所以对磁盘分区的要点是：记录每一个分区的起始与结束柱面。
实际上，分区时指定的开始和结束位置是柱面上的扇区(sector)：

Linux 文件系统相关的基本概念

下图是通过 fdisk 命令查看到的磁盘分区信息：

Linux 文件系统相关的基本概念

那么，这些分区的信息(起始柱面与结束柱面)被存放在了哪里呢？答案是磁盘的主引导区(Master Boot Recorder, MBR)。MBR 在一块硬盘的第 0 轨上，这也是计算机启动之后要去使用硬盘时必须读取的第一个区域。这个区域内记录了硬盘里所有分区的信息即磁盘分区表，以及启动时可以写入引导程序的位置。因此 MBR 对于硬盘来说至关重要，如果它坏掉了，这块磁盘也就寿终正寝了。下面是磁盘分区表的示意图(此图来自互联网)：

Linux 文件系统相关的基本概念

文件系统

在告知系统分区所在的起始与结束柱面后，需要将分区格式化为操作系统能够识别的文件系统。每个操作系统能够识别的文件系统并不相同，比如 Windows 系统在默认的情况下就无法识别 Linux 的文件系统，所以要针对操作系统来格式化分区。可以简单的认为每个分区就是一个文件系统。

逻辑块
不论哪种文件系统，目的都是为了存储数据。前面提到，硬盘的最小读写单位是扇区，而现实中数据的读写单位并不是扇区的大小，原因是使用扇区的大小为单位来读写数据的效率实在是太低了。因为一个扇区只有 512 个字节，而磁头是一个扇区一个扇区的读取数据，也就是说，如果文件有 10M，那么读取这个文件磁头就要进行 20480 次读取操作(I/O)。
为了提升效率，就有了逻辑块(Block)的概念。逻辑块是在分区进行文件系统的格式化时所指定的"最小存储单位"，这个最小存储单位以扇区的大小为基础(因为扇区为硬盘的最小物理存储单位)，大小为扇区大小的 2ⁿ 倍。此时，磁头一次可以读取一个逻辑块。指定逻辑块的大小为 4KB(即由连续的 8 个扇区构成的一个块)，那么，同样读取一个 10M 的文件，磁头要读取的次数则大幅下降为 2560 次，这样就大大提高了文件的读取效率。
需要注意的是，逻辑块也并不是越大越好。因为一个逻辑块最多仅能容纳一个文件(这里指 Linux 的 ext2 文件系统)。这有什么问题呢？举例来说，假如逻辑块的大小为 4KB，有一个文件大小为 0.1KB，这个小文件将占用掉一个块的空间。也就是说，该块虽然可以容纳 4KB 的容量，然而由于文件只占用了 0.1KB，实际上剩下的 3.9KB 空间就不能再被使用了(完全浪费掉了)。所以好的方式是根据实际的使用场景来设置逻辑块的大小。

在分区上创建文件系统时，可以指定文件系统的逻辑块大小：

Linux 文件系统相关的基本概念

上面命令中我们指定的逻辑块大小为 1024 B，也就是两个扇区的大小。我们还可以通过 tune2fs 查看现有文件系统逻辑块的大小：

转载注明出处：https://www.heiqu.com/11876.html

Linux 文件系统相关的基本概念

相关推荐