文件系统

磁盘的格式化与挂载

简化的Linux文件系统磁盘布局结构图如下：

虚拟机操作实验

首先我们通过添加一个磁盘文件

选择添加硬盘

选择SCSI(S)类型的磁盘

选择创建新的虚拟磁盘

设定磁盘大小为4MB，并且将虚拟磁盘存储为单个文件

点击完成
我们打开虚拟机终端，切换到管理员模式
1
su
查看系统有哪些磁盘
1
fdisk -l
我们可以看到我们添加的新磁盘为 /dev/sdb，接下来我们开始格式化添加的磁盘，我们将磁盘格式化为minix格式
1
mkfs.minix /dev/sdb
根据上图我们可以看出格式化之后文件系统创建了
- 创建了 1376 个 inode（索引节点）
  - 创建了 1376 个 inode（索引节点）。
  - inode数量 ≈ 磁盘大小 / 预期平均文件大小
    此处 4MB / 1376 ≈ 3KB/文件，适合存储大量小文件。
- 文件系统被划分为 4096 个数据块
  - 块大小：根据后续参数计算为 1024 字节（1KB）（见下方推导）。
  - 总磁盘空间：4096 块 × 1024 字节/块 = 4,194,304 字节 = 4MB，符合设定。
- 文件系统的块大小（block size） 为 1024 字节（1KB）
  - 读写操作的最小单位是 1KB。
  - 小块大小适合存储大量小文件，减少空间浪费（外部碎片）。
- 最大尺寸=268966912
  - 文件系统支持的最大理论容量（单位：字节）。
  - 当前磁盘仅为 4MB，表明该文件系统设计支持扩容至 256MB。

我们现在将格式化后的文件内容导出来，进行进一步的分析

1	hexdump -C /dev/sdb > minix_origin.data

可以看到minix_origin.data文件中的内容为：

0000000  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
00000400  60 05 00 10 01 00 01 00  2f 00 00 00 00 1c 08 10  |`......./.......|
00000410  8f 13 01 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00000420  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
00000800  03 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00000810  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
000008a0  00 00 00 00 00 00 00 00  00 00 00 00 fe ff ff ff  |................|
000008b0  ff ff ff ff ff ff ff ff  ff ff ff ff ff ff ff ff  |................|
*
00000c00  03 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00000c10  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
00000df0  00 00 00 00 00 00 00 00  00 00 fc ff ff ff ff ff  |................|
00000e00  ff ff ff ff ff ff ff ff  ff ff ff ff ff ff ff ff  |................|
*
00001000  ed 41 00 00 40 00 00 00  a6 1a 7f 68 00 02 2f 00  |.A..@......h../.|
00001010  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
0000bc00  01 00 2e 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc10  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc20  01 00 2e 2e 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc30  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
00400000

接下来我们开始创建文件，并逐步分析

mount /dev/sdb /mnt #挂载文件
cd /mnt
touch test.c
echo "hello world" > test.c
mkdir head
cd head
touch head.h
echo "headheadhead" > head.h

这之后文件的结构树应该是：

root@xnj-virtual-machine:/mnt# tree
.
├── head
│   └── head.h
└── test.c

1 directory, 2 files

我们再次将磁盘的内容拷贝出来

1 2	umount /mnt #取消挂载文件 hexdump -C /dev/sdb > minix_make.data

进行查看：

00000000  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
00000400  60 05 00 10 01 00 01 00  2f 00 00 00 00 1c 08 10  |`......./.......|
00000410  8f 13 01 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00000420  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
00000800  1f 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00000810  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
000008a0  00 00 00 00 00 00 00 00  00 00 00 00 fe ff ff ff  |................|
000008b0  ff ff ff ff ff ff ff ff  ff ff ff ff ff ff ff ff  |................|
*
00000c00  1f 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00000c10  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
00000df0  00 00 00 00 00 00 00 00  00 00 fc ff ff ff ff ff  |................|
00000e00  ff ff ff ff ff ff ff ff  ff ff ff ff ff ff ff ff  |................|
*
00001000  ed 41 00 00 80 00 00 00  a1 7f 7f 68 00 03 2f 00  |.A.........h../.|
00001010  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00001020  a4 81 00 00 0c 00 00 00  8c 7f 7f 68 00 01 30 00  |...........h..0.|
00001030  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00001040  ed 41 00 00 60 00 00 00  b0 7f 7f 68 00 02 31 00  |.A..`......h..1.|
00001050  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00001060  a4 81 00 00 0d 00 00 00  c4 7f 7f 68 00 01 32 00  |...........h..2.|
00001070  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
0000bc00  01 00 2e 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc10  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc20  01 00 2e 2e 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc30  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc40  02 00 74 65 73 74 2e 63  00 00 00 00 00 00 00 00  |..test.c........|
0000bc50  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc60  03 00 68 65 61 64 00 00  00 00 00 00 00 00 00 00  |..head..........|
0000bc70  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
0000c000  68 65 6c 6c 6f 20 77 6f  72 6c 64 0a 00 00 00 00  |hello world.....|
0000c010  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
0000c400  03 00 2e 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000c410  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000c420  01 00 2e 2e 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000c430  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000c440  04 00 68 65 61 64 2e 68  00 00 00 00 00 00 00 00  |..head.h........|
0000c450  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
0000c800  68 65 61 64 68 65 61 64  68 65 61 64 0a 00 00 00  |headheadhead....|
0000c810  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
00400000

super_block

Super (Superblock - 超级块):

作用： 文件系统的“总控信息中心”。存储描述整个文件系统的全局信息，如：
- 文件系统类型 (e.g., ext4, XFS)
- 总大小、总块数
- 空闲块数、空闲inode数
- inode表的位置和大小
- 块大小 (图中底部暗示为4KB)
- 文件系统状态 (是否干净卸载)
特点： 极其关键，损坏通常导致文件系统无法挂载。常有备份副本。

我们打开linux5.15版本的minix_fs.h文件minix_fs.h - include/uapi/linux/minix_fs.h - Linux source code v5.15 - Bootlin Elixir Cross Referencer，可以查看到minix_super_block结构体的内容如下：

/*
 * minix super-block data on disk
 */
struct minix_super_block {
	__u16 s_ninodes;
	__u16 s_nzones;
	__u16 s_imap_blocks;
	__u16 s_zmap_blocks;
	__u16 s_firstdatazone;
	__u16 s_log_zone_size;
	__u32 s_max_size;
	__u16 s_magic;
	__u16 s_state;
	__u32 s_zones;
};

因为超级块在格式化生成后就不会进行更改，我们可以通过实验的数据可以查看到超级块的内容为：

超级块为小端存储，小端存储的解释可以参考文章最后一章节

根据结构体我们将图中的变量大小依次解读，注释后结构体变量的内容如下所示：

struct minix_super_block {
	__u16 s_ninodes;//0x0560,十进制1376，一共1376个inode节点+
	__u16 s_nzones;//0x1000,十进制4096，一共4096个data blocks
	__u16 s_imap_blocks;//0x0001,十进制1，inode位图占据1个block:
	__u16 s_zmap_blocks;//0x0001,十进制1，data block位图占据1个block
	__u16 s_firstdatazone;//0x002f,十进制47.第一个datablock的编号为47
	__u16 s_log_zone_size;//0x0000 一个datablock大小2^0.即1kB
	__u32 s_max_size;//0x10081c00,文件最大长度为268966912字节
	__u16 s_magic;//0x138f,minix文件系统的魔幻数：
	__u16 s_state;//0x0001,文件当前状态
	__u32 s_zones;//0x0000
};

对比我们格式化之后系统返回的信息可以知道超级块存储了磁盘的全局信息

i-bmap

i-bmap (Inode Bitmap - Inode位图):

作用： 一个简单的位数组（bit array），每个比特(bit)对应inode表中的一个inode条目。
- 比特值 0 表示对应的inode是空闲的。
- 比特值 1 表示对应的inode已被使用（分配给某个文件/目录）。
特点： 文件系统创建新文件/目录时，快速扫描此位图寻找空闲inode号。高效管理inode分配状态。

先看inode bitmap数据，磁盘刚刚格式化后的数据如下：

00000800  1f 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00000810  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
000008a0  00 00 00 00 00 00 00 00  00 00 00 00 fe ff ff ff  |................|
000008b0  ff ff ff ff ff ff ff ff  ff ff ff ff ff ff ff ff  |................|

磁盘格式化之后一共1376个inode。所以在inode bitmap要用1376个bit位来表示这些inode

从地址0x800到0x8ab，一共有172个字节，表示172*8=1376个inode.inode bitmap地址的开头第一个字节0x03→0b00000011,第一个位图不使用，但是置为1，因此算上0x8ac地址上的0xFE上的最后一个bit位，正好是1376个bit位。

inode

The Inode Table (Closeup) - Inode 表

作用： 这是文件系统的核心数据结构之一。==每个文件或目录在inode表中都有一个唯一的inode条目==。这个条目存储了文件的元数据（metadata），例如：
- 文件大小
- 文件所有者（UID）和所属组（GID）
- 文件权限（读、写、执行）
- 文件创建、修改、访问时间戳
- 最关键的是：指向存储文件实际数据的数据块（data blocks）的指针。
图中的表示 (iblock 0 - iblock 4)：
- 这里显示了文件系统保留的前5个磁盘块专门用于存储inode表 (iblock 即 “inode block”)。
- 每个iblock可以容纳一定数量的inode结构体。图中没有展示单个inode内部的细节（如直接指针、间接指针等），而是强调了inode表本身占据的物理位置（块0-4）。
特点：
- 固定位置/大小： 通常在文件系统创建时确定大小和位置（常在超级块之后）。
- 索引作用： 文件名存储在目录的数据块中，目录条目将文件名映射到其对应的inode号。通过inode号即可在inode表中找到该文件的元数据和数据块指针。
- 不存储文件名。

我们打开linux5.15版本的minix_fs.h文件minix_fs.h - include/uapi/linux/minix_fs.h - Linux source code v5.15 - Bootlin Elixir Cross Referencer，可以查看到minix_inode结构体的内容如下：

struct minix_inode {
	__u16 i_mode;//权限
	__u16 i_uid;//文件所属用户
	__u32 i_size;//文件大小
	__u32 i_time;//文件时间戳
	__u8  i_gid;//文件所属组
	__u8  i_nlinks;//文件的引用计数
	__u16 i_zone[9];//文件数据存储在data block上的位置
};

当用户使用shell命令touch或者open系统调用创建一个文件时，文件系统中会使用唯一的一个inode来标识这个文件的相关信息。

所有文件的inode都保存在磁盘上的inode table上，文件系统使用inode bitmap来记录inode table中inode的使用情况。

磁盘格式化后的inode table内容如下：

结构体变量如下：

struct minix_inode {
	__u16 i_mode;//权限 0x41ed,040755,目录文件rwxr-xr-X
    			//小端值：0x41ed（41为高位，ed为低位）
    			//二进制：0100 0001 1110 1101
    			//解析：
    			//文件类型（高 4 位）：0100 → 目录（0x4000）
    			//权限位（低 12 位）：0001 1110 1101 = 0755（八进制）
    			//用户： rwx (111)
    			//组：   r-x (101)
    			//其他： r-x (101)
    			//结论：目录文件，权限 rwxr-xr-x
	__u16 i_uid;//文件所属用户 0x0000,用户为root
	__u32 i_size;//文件大小 0x00000040,文件大小，64字节：
	__u32 i_time;//文件时间戳 0x687f1aa6
	__u8  i_gid;//文件所属组 0x00,属于用户组：root
	__u8  i_nlinks;//文件的引用计数 0x02 父目录和当前目录都指向根目录     硬链接数=2（.和..）
	__u16 i_zone[9];//文件数据存储在data block上的位置 0x002f,47,数据在第47个data block数据块
};

我们找到第47个数据块为：

0000bc00  01 00 2e 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc10  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc20  01 00 2e 2e 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc30  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|

分析内容：

地址 0000bc00 处的数据：

1 2	0000bc00 01 00 2e 00 00 00 00 00 → inode=1, name="." 0000bc20 01 00 2e 2e 00 00 00 00 → inode=1, name=".."

按 struct minix_dir_entry 解析：

条目1：
- inode=0x0001（==根目录自身==）
- name="."（当前目录）
条目2：
- inode=0x0001（==根目录的父目录仍是自身==）
- name=".."（父目录）

目录项结构：

struct minix_dir_entry {
    __u16 inode;          // 文件/目录对应的 inode 号
    char name[0];         // 文件名（变长数组，实际存储在后方）
};

验证：

每个目录项占 16 字节（2+14）。
总大小=64字节（与 inode 的 i_size=64 一致）。

当我们在磁盘中生成文件之后文件的inode_table块内容如下：

00001000  ed 41 00 00 80 00 00 00  a1 7f 7f 68 00 03 2f 00  |.A.........h../.|
00001010  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00001020  a4 81 00 00 0c 00 00 00  8c 7f 7f 68 00 01 30 00  |...........h..0.|
00001030  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00001040  ed 41 00 00 60 00 00 00  b0 7f 7f 68 00 02 31 00  |.A..`......h..1.|
00001050  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00001060  a4 81 00 00 0d 00 00 00  c4 7f 7f 68 00 01 32 00  |...........h..2.|
00001070  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|

我们进行了三个操作，生成的文件结构如下：

root@xnj-virtual-machine:/mnt# tree
.
├── head
│   └── head.h
└── test.c

1 directory, 2 files

现在进行逐个分析：

第一个：

1	00001000 ed 41 00 00 80 00 00 00 a1 7f 7f 68 00 03 2f 00 \|.A.........h../.\|

变量	内存字节	十六进制值	含义
`i_mode`	`41 ed`	`0x41ed`	权限`rw-r-xr-x`（目录文件）
`i_uid`	`00 00`	`0x0000`	所属用户`root`
`i_size`	`80 00 00 00`	`0x00000080`	文件大小`128 字节`
`i_time`	`a1 7f 7f 68`	`0x687f7fa1`	时间戳
`i_gid`	`00`	`0x00`	所属用户组`root`
`i_nlinks`	`03`	`0x03`	引用计数
`i_zone[9]`	`2f 00`	`0x002f`	数据块位置`47`

我们查看第47块数据块，内容如下：

第一行：2e：点号 .
第三行：两个点号..
第五行：

字节值 ASCII字符含义

74 t 字母t

65 e 字母e

73 s 字母s

74 t 字母t

2e . 字母.

63 c 字母c
第七行：

字节值 ASCII字符含义

68 h 字母h

65 e 字母e

61 a 字母a

64 d 字母d

字节值	ASCII字符	含义
`74`	`t`	字母`t`
`65`	`e`	字母`e`
`73`	`s`	字母`s`
`74`	`t`	字母`t`
`2e`	`.`	字母`.`
`63`	`c`	字母`c`

第二个：

1	00001020 a4 81 00 00 0c 00 00 00 8c 7f 7f 68 00 01 30 00 \|...........h..0.\|

变量	内存字节	十六进制值	含义
`i_mode`	`81 a4`	`0x81a4`	权限`rw-rw-r--`（普通文件）
`i_uid`	`00 00`	`0x0000`	所属用户`root`
`i_size`	`0c 00 00 00`	`0x0000000c`	文件大小`12 字节`
`i_time`	`8c 7f 7f 68`	`0x687f7f8c`	时间戳（需转换为可读时间）
`i_gid`	`00`	`0x00`	所属用户组`root`
`i_nlinks`	`01`	`0x01`	引用计数
`i_zone[9]`	`30 00`	`0x0030`	数据块位置`48`

我们查看第48块数据块，内容如下：

根据内容我们可以知道

字节值	ASCII字符	含义
`68`	`h`	字母`h`
`65`	`e`	字母`e`
`6c`	`l`	字母`l`
`6c`	`l`	字母`l`
`6f`	`o`	字母`o`
`20`	``	空格
`77`	`w`	字母`w`
`6f`	`o`	字母`o`
`72`	`r`	字母`r`
`6c`	`l`	字母`l`
`64`	`d`	字母`d`
`0a`	`\n`	换行符（Line Feed）
`00`	`\0`	空字符（Null Terminator）
`00`	`\0`	空字符
`00`	`\0`	空字符
`00`	`\0`	空字符

d-bitmap

d-bmap (Data Block Bitmap - 数据块位图):

作用： 一个简单的位数组（bit array），每个比特(bit)对应文件系统中的一个数据块。
- 比特值 0 表示对应的数据块是空闲的。
- 比特值 1 表示对应的数据块已被使用（存储了文件/目录数据或间接块指针）。
特点： 文件系统需要为文件分配存储空间时，快速扫描此位图寻找连续或分散的空闲数据块。高效管理磁盘空间分配状态。
磁盘格式化后的d-bmap内容如下：

实验的4MB大小的磁盘格式化后，一共4096个block，每个block大小为1KB。

格式化之后显示首个数据区为47，因为前面的引导块、超级块、inode_table、i-bmap、d-bmap占据了0~46总共47个block,所以还剩下的data block数量为4049个。

bitmap中需要4049个bit位来表示这些block的使用情况。我们从d-bmap内容可以知道从0xc00到0xdf9一共有506个字节，加上0xdfa上的数据0xfc的2个bit位，再减去起始位置的一个bit位，一共是4049位。

通过计算知道第一个数据块的起始地址为0xbc00，我们找到第一个数据块，内容如下：

第一个数据块的数据，其实是根目录的数据区，格式化后的文件系统里面什么都没有，但是会有一个根目录。目录项在文件系统中也是一个文件，也会用唯一的inode来标识

目录文件

文件目录的本质是一个文件，有自己的inode，在inode中将该文件类型标记为”目录“，和普通文件不同的是，普通文件的块里面保存的是文件数据，而目录文件的块里面保存的是目录里面一项一项的文件信息。

在目录文件的块中，最简单的保存格式就是列表，就是一项一项地将目录下的文件信息（如文件名、文件inode、文件类型等)列在表里。列表中每一项就代表该目录下的文件的文件名和对应的inode,通过这个inode,就可以找到真正的文件。

通常，第一项是.，表示当前目录，第二项是..，表示上一级目录，接下来就是一项一项的文件名和inode.

如果一个目录有超级多的文件，我们要想在这个目录下找文件，按照列表一项一项的找，效率就不高了。于是，保存目录的格式改成哈希表，对文件名进行哈希计算，把哈希值保存起来，如果我们要查找一个目录下面的文件名，可以通过名称取哈希。

如果哈希能够匹配上，就说明这个文件的信息在相应的块里面。Linux系统的ext2文件系统就是采用了哈希表，来保存目录的内容，这种方法的优点是查找非常速，插入和删除也较简单。目录查询是通过在磁盘上反复搜索完成，需要不断地进行I/O操作，开销较大。所以，为了减少I/O操作，把当前使用的文件目录缓存在内存，以后要使用该文件时只要在内存中操作，从而降低了磁盘操作次数，提高了文件系统的访问速度。

文件目录项entry数据结构

minix文件系统

struct minix_dir_entry {
    __u16 inode;          // 文件/目录对应的 inode 号
    char name[0];         // 文件名（变长数组，实际存储在后方）
};

结构体变量：

固定部分（2字节）：inode 字段
可变部分：name 字段存储在 inode 之后的内存空间
无长度字段：依赖特殊规则确定文件名长度（如遇空字符终止）

ext2/ext3文件系统

struct ext2_dir_entry_2 {
    __u32 inode;          // 文件/目录的 inode 号
    __u16 rec_len;        // 当前目录项的总长度（含填充）
    __u8 name_len;        // 文件名的实际长度
    __u8 file_type;       // 文件类型标识
    char name[];          // 文件名（变长数组）
};

各字段详解：

__u32 inode
- 作用：存储该目录项对应的 inode 编号
- 意义：通过此编号可在 inode 表中找到文件元数据和数据块位置
- 特点：32 位支持更多文件（Minix 仅 16 位）
__u16 rec_len
- 作用：记录 整个目录项占用的字节数（包括填充字节）
- 意义：
  - 用于遍历目录：下一个条目地址 = 当前地址 + rec_len
  - 删除文件时：扩展前一项的 rec_len 覆盖被删项（避免碎片）
- 特点：长度按 4 字节对齐（提高访问效率）
__u8 name_len
- 作用：存储 文件名的实际长度（单位：字节）
- 意义：动态确定文件名边界（支持最长 255 字符）
- 示例：文件名 a.txt → name_len = 6

__u8 file_type

作用：标识 文件类型，避免查询 inode

常见值：

#define EXT2_FT_UNKNOWN   0  // 未知类型
#define EXT2_FT_REG_FILE  1  // 普通文件
#define EXT2_FT_DIR       2  // 目录
#define EXT2_FT_CHRDEV    3  // 字符设备
#define EXT2_FT_BLKDEV    4  // 块设备
#define EXT2_FT_FIFO      5  // 管道
#define EXT2_FT_SOCK      6  // 套接字
#define EXT2_FT_SYMLINK   7  // 符号链接

char name[]
- 作用：存储 文件名（变长数组，不以 \0 结尾）
- 特点：
  - 实际占用空间 = name_len 字节
  - 与后续字段间可能有填充字节（满足 4 字节对齐）

文件查找流程

我们实验使用minix文件系统，我们查找文件/head/head.h，流程如下：

00000000  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
00000400  60 05 00 10 01 00 01 00  2f 00 00 00 00 1c 08 10  |`......./.......|
00000410  8f 13 01 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00000420  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
00000800  1f 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00000810  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
000008a0  00 00 00 00 00 00 00 00  00 00 00 00 fe ff ff ff  |................|
000008b0  ff ff ff ff ff ff ff ff  ff ff ff ff ff ff ff ff  |................|
*
00000c00  1f 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00000c10  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
00000df0  00 00 00 00 00 00 00 00  00 00 fc ff ff ff ff ff  |................|
00000e00  ff ff ff ff ff ff ff ff  ff ff ff ff ff ff ff ff  |................|
*
00001000  ed 41 00 00 80 00 00 00  a1 7f 7f 68 00 03 2f 00  |.A.........h../.|
00001010  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00001020  a4 81 00 00 0c 00 00 00  8c 7f 7f 68 00 01 30 00  |...........h..0.|
00001030  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00001040  ed 41 00 00 60 00 00 00  b0 7f 7f 68 00 02 31 00  |.A..`......h..1.|
00001050  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00001060  a4 81 00 00 0d 00 00 00  c4 7f 7f 68 00 01 32 00  |...........h..2.|
00001070  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
0000bc00  01 00 2e 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc10  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc20  01 00 2e 2e 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc30  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc40  02 00 74 65 73 74 2e 63  00 00 00 00 00 00 00 00  |..test.c........|
0000bc50  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc60  03 00 68 65 61 64 00 00  00 00 00 00 00 00 00 00  |..head..........|
0000bc70  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
0000c000  68 65 6c 6c 6f 20 77 6f  72 6c 64 0a 00 00 00 00  |hello world.....|
0000c010  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
0000c400  03 00 2e 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000c410  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000c420  01 00 2e 2e 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000c430  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000c440  04 00 68 65 61 64 2e 68  00 00 00 00 00 00 00 00  |..head.h........|
0000c450  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
0000c800  68 65 61 64 68 65 61 64  68 65 61 64 0a 00 00 00  |headheadhead....|
0000c810  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
00400000

首先解析/根目录，我们在inode table中找到根目录的内容：

1	00001000 ed 41 00 00 80 00 00 00 a1 7f 7f 68 00 03 2f 00 \|.A.........h../.\|

我们对内容进行分析可以得知

字段	原始字节	小端值	含义
i_mode	`ed 41`	`0x41ed`	目录文件，权限 `rwxr-xr-x`
i_uid	`00 00`	`0x0000`	所属用户：root (UID=0)
i_size	`80 00 00 00`	`0x00000080`	大小：128 字节
i_time	`a1 7f 7f 68`	`0x687f7fa1`	时间戳：2025-09-28 08:30:41
i_gid	`00`	`0x00`	所属组：root (GID=0)
i_nlinks	`03`	`0x03`	硬链接数：3
i_zone[9]	`2f 00`	`0x002f`	数据块位置：47

可以知道根目录的纯数据存放在47的数据块中，我们找到47*1024=0xbc00，数据块中的内容为：

0000bc00  01 00 2e 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc10  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc20  01 00 2e 2e 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc30  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc40  02 00 74 65 73 74 2e 63  00 00 00 00 00 00 00 00  |..test.c........|
0000bc50  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000bc60  03 00 68 65 61 64 00 00  00 00 00 00 00 00 00 00  |..head..........|
0000bc70  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|

这个数据块保存的是目录文件的内容，根据结构体struct minix_dir_entry可以得知每行的内容结构为inode+name，当我们找到了/之后，进一步查找内容head，我们根据内容可以知道head存储在如下的地址：

1	0000bc60 03 00 68 65 61 64 00 00 00 00 00 00 00 00 00 00 \|..head..........\|

可以知道head的inode为3，因此我们可以知道head在inode table中条目的顺序为3，我们返回inode table的内容中，看到内容为：

00001000  ed 41 00 00 80 00 00 00  a1 7f 7f 68 00 03 2f 00  |.A.........h../.|
00001010  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00001020  a4 81 00 00 0c 00 00 00  8c 7f 7f 68 00 01 30 00  |...........h..0.|
00001030  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00001040  ed 41 00 00 60 00 00 00  b0 7f 7f 68 00 02 31 00  |.A..`......h..1.|
00001050  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
00001060  a4 81 00 00 0d 00 00 00  c4 7f 7f 68 00 01 32 00  |...........h..2.|
00001070  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|

inode为1的时候地址为0x00001000，因此我们可以通过计算得知head的inode信息存放在0x00001000+sizeof(struct minix_inode)*(3-1)=0x00001040，于是我们在地址0x00001040中可以找到head的inode信息为：

1	00001040 ed 41 00 00 60 00 00 00 b0 7f 7f 68 00 02 31 00 \|.A..`......h..1.\|

我们对内容进行分析可以得知

字段	原始字节	小端值	解析结果
i_mode	`ed 41`	`0x41ed`	目录文件，权限 `rwxr-xr-x`
i_uid	`00 00`	`0x0000`	root 用户 (UID=0)
i_size	`60 00 00 00`	`0x00000060`	文件大小：96 字节
i_time	`b0 7f 7f 68`	`0x687f7fb0`	时间戳：2025-09-28 08:30:40
i_gid	`00`	`0x00`	root 组 (GID=0)
i_nlinks	`02`	`0x02`	硬链接数：2
i_zone[0]	`31 00`	`0x0031`	数据块位置：49

我们找到49的数据块位置，内容为下：

0000c400  03 00 2e 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000c410  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000c420  01 00 2e 2e 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000c430  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
0000c440  04 00 68 65 61 64 2e 68  00 00 00 00 00 00 00 00  |..head.h........|
0000c450  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|

同理我们知道head.h在inode table中条目的顺序为4，内容如下：

1	00001060 a4 81 00 00 0d 00 00 00 c4 7f 7f 68 00 01 32 00 \|...........h..2.\|

分析内容：

字段	原始字节	小端值	解析结果
i_mode	`a4 81`	`0x81a4`	普通文件，权限 `rw-r--r--`
i_uid	`00 00`	`0x0000`	root 用户 (UID=0)
i_size	`0d 00 00 00`	`0x0000000d`	文件大小：13 字节
i_time	`c4 7f 7f 68`	`0x687f7fc4`	时间戳：2025-09-28 08:30:44
i_gid	`00`	`0x00`	root 组 (GID=0)
i_nlinks	`01`	`0x01`	硬链接数：1
i_zone[0]	`32 00`	`0x0032`	数据块位置：50

因此我们就可以找到/head/head.h文件的纯数据就保存在50的数据块中，内容如下：

1 2	0000c800 68 65 61 64 68 65 61 64 68 65 61 64 0a 00 00 00 \|headheadhead....\| 0000c810 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 \|................\|

硬链接与软链接

特性	硬链接（Hard Link）	软链接（Symbolic Link）
本质	多个目录项指向同一个 inode	特殊文件，内容存储目标文件的路径
inode 关系	共享相同 inode	拥有独立 inode
跨文件系统	❌ 不支持	✅ 支持
原始文件删除	不影响硬链接访问（inode 引用计数减1）只有删除文件的所有硬链接以及源文件时，系统才会彻底删除该文件。	导致链接失效（”断链”）
文件类型	与原文件相同	固定为符号链接类型（`l`）
命令示例	`ln source.txt hardlink.txt`	`ln -s source.txt softlink.txt`

硬链接是 inode 的别名，软链接是路径的快捷方式。

我们在实验中使用的Minix系统，minix_inode结构体中的__u8 i_nlinks，这个变量就表示这个文件的硬链接

目录文件的硬链接有以下部分组成：

自身引用：目录自身的 . 条目。
子目录引用：至少有一个子目录的 .. 指向它。

硬链接

软链接

例子：

我们实验中磁盘的树结构为：

root@xnj-virtual-machine:/mnt# tree
.
├── head
│   └── head.h
└── test.c

1 directory, 2 files

按照理论来讲/根目录的硬链接数为3，因为本身的条目.与..都指向自己，其下还有一个子目录head中的..也指向它。那么我们来查看实际是否是这样的呢？我们在inode章节的分析可以验证理论是正确的！

大小端存储

大小端存储（Endianness） 是指多字节数据类型（如整数、浮点数等）在内存中的存储方式。它决定了数据的高字节（Most Significant Byte, MSB）和低字节（Least Significant Byte, LSB）在内存中的排列顺序。这一概念对数据的跨平台兼容性、网络通信以及编程实践至关重要。

大小端的定义

大端序（Big-Endian）

高字节（MSB）存储在内存的低地址，低字节（LSB）存储在高地址。

示例：

一个 32 位整数 0x12345678 在大端序中的内存布局为：
1
2
3
4
地址 0: 0x12（MSB）
地址 1: 0x34
地址 2: 0x56
地址 3: 0x78（LSB）
小端序（Little-Endian）

低字节（LSB）存储在内存的低地址，高字节（MSB）存储在高地址。

示例：

同一整数 0x12345678 在小端序中的内存布局为：
1
2
3
4
地址 0: 0x78（LSB）
地址 1: 0x56
地址 2: 0x34
地址 3: 0x12（MSB）

如何检测系统的字节序？

可以通过一段简单的代码判断系统是大端还是小端：

#include <stdio.h>

int main() {
    unsigned int num = 0x12345678; // 32位整数
    char *byte = (char *)&num;

    if (*byte == 0x78) {
        printf("Little-Endian\n");
    } else if (*byte == 0x12) {
        printf("Big-Endian\n");
    } else {
        printf("Unknown Endianness\n");
    }
    return 0;
}

输出：

在 x86（小端）系统上会输出 Little-Endian。
在 ARM（可配置）或网络协议（强制大端）上可能输出 Big-Endian。