32位环境下,虚拟地址(ucore下等同于线性地址,因为所有段基址为0)可分为三部分:
1.一级页表(也就是页目录表)index:10位
2.二级页表index:10位
3.页内偏移:12位
因此每张页表可容纳 2<<10=1024个项,一级页表项和二级页表项每项均占4B空间,即每张表占用1024*4B=4KB。而全体1024张二级页表共占用1024*4KB=4MB。
每张二级页表的1024项各对应一个页的物理地址,每页占4KB,因此每张二级页表管理1024*4KB=4MB空间。
若所有1024个二级页表分布于连续的4MB虚拟地址空间上,则这个4MB区块也必然由某张特殊的页表所管理。若将每张二级页表看作占用4KB空间的普通页,则上述特殊页表为二级页表,而事实是这个特殊的二级页表所管理的是所有1024个二级页表的信息,从这个角度看,这个特殊的二级页表实际上是一张一级页表。
如此一来,一级页表就蕴含在二级页表中,首先就能起到节省4KB空间的作用,事实上自映射真正的作用在于方便地访问页表信息,但这个是效果,我的重点是原理理解因此不展开。
实现的重点在于要将“二级页表分布于连续的4MB虚拟地址空间上”,注意虚拟二字。
ucore中的实现如下:
VPT=0xFAC00000=1111101011 0000000000 0000 0000 0000(以10位 10位 12位格式展示)
pte_t * const vpt = (pte_t *)VPT;
pde_t * const vpd = (pde_t *)PGADDR(PDX(VPT), PDX(VPT), 0);
boot_pgdir[PDX(VPT)] = PADDR(boot_pgdir) | PTE_P | PTE_W;
实验指导书上的解读是:当执行了上述语句,就确保了vpd变量的值就是页目录表的起始虚地址,且vpt是页目录表中第一个目录表项指向的页表的起始虚地址。
简单验证一下:
当虚拟地址为vpd,即1111101011 1111101011 000000000000
先通过查询一级页表得到对应的二级页表,取前十位作为一级页表的index,即PDX(VPT),可得boot_pgdir[PDX(VPT)],因此对应的二级页表就是一级页表本身。
再查询对应二级页表得到对应页地址,取中间十位作为10index,即PDX(VPT),也得到boot_pgdir[PDX(VPT)],因此对应的页就是一级页表本身,因此虚拟地址vpd指向一级页表。
同理可得 vpt就是页目录表中第一个目录表项指向的页表的起始虚地址,而所有一级页表中记录的二级页表的前十位都是1111101011,也就保证了所有二级页表在一个连续4MB空间内。
注意:从表面上好像并不知道何时我们把所有二级页表的虚拟地址都放在一个连续4MB空间里,也不知道页目录表什么时候被放在vpd上,而事实上虚拟地址是体现在查页表的过程中的,因此所谓的放操作也就蕴含在修改页表的内容上,也就是boot_pgdir[PDX(VPT)] = PADDR(boot_pgdir) | PTE_P | PTE_W这句话,可谓奇技淫巧了。