Page Frame Allocation

来自osdev
跳到导航 跳到搜索

(译者注:页面帧分配器(Allocators)算法主要负责将完整连续内存拆分为大小合适的帧(Frame)供不同任务使用。这里不仅要考虑速度还要考虑内存利用率等多方面问题,但是这里写的很简略,只是一个索引,还是得读其它资料才能自制一套出来。)

物理内存分配器

这部分的算法用于在你需要时为你提供一个新的页面帧(Frame)。 此算法的客户端通常不在意具体返回的是哪个帧,尤其是,对多个帧的请求不需要返回连续帧 (除非你正在进行DMA等操作,例如为网络数据包缓冲区分配内存)。

以下文中N字母将代表以页面为单位的内存大小。(译者注:以下介绍了几种简单的内存拆分算法)

使用位图映射 Bitmap

使用N/8字节的大数组用作内存使用的位映射 (即,字节#n中的位#i定义了页#n*8+i的状态)。 这样设置给定页面的状态是很快的,时间复杂度为(O(1)),分配页面可能需要时间复杂度 (O(N))。(译者注:要扫描每个位找到空闲的可被分配页)

  • uint32_t比较运算可以一次测试多达32位,从而加快分配速度
  • 保留指向最后分配位的指针可能会提高下一次搜索的性能 (保留有关所有先前字节未能成功搜索的信息)

使用针对页面的Stack/List

每个可用的物理帧的地址都存储在类似 的动态结构中。 分配页面的速度很快,时间复杂度 (O(1)),也可以释放页面,但是想要检查页面的状态有点不切实际的,除非存储了按物理地址排序的其他元数据。(译者注:此处应该指的是链表方式,遍历链表速度较慢)

Sized Portion 方案

你将每个区域 (例如16kb) 分成(例如)1个8kb和2个4kb的块。 然后你按需分发每一块。 通过这样做,你可以找到更精确的大小。 这意味着更少的浪费。 比如说你有32kb的区域

Sized Portion Scheme.png

甚至可以为每个部分提供1、2、甚至3或4中(或更多!)大小(sized)类型的分配(portion)。 这样你就有更多的尺寸可供选择。

Buddy分配系统

这是Linux内核的物理内存分配器。(译者注:Buddy算法译者也不了解,这里是字面尽量翻译,请参考其它资料!!) 可以注意到,linux分配有几个Buddy,具体取决于内存是适合ISA DMA,或者当前是 “内存占用较高” 还是 “普通”情况。 每个Buddy包含k个位图,每个位图指示可用的2^i大小和2^i对齐的自由页面块。 通常,linux使用从4k到512K块大小。

                 0   4   8   12  16  20  24  28  32  36
                 ###.#....#........#...###...########.... 真实内存构成模式

   buddy[0]--->  ###.#.xx.#xxxxxxxx#.xx###.xx########xxxx 5  free 4K , 5-byte bitmap(40-bits 映射,每位代表4K大小页面)
   buddy[1]--->  # # # . # . x x . # . # # . # # # # x x  5  free 8K , 20-bits map(每位代表8K页面)
   buddy[2]--->  #   #   #   .   #   #   #   #   #   .    2  free 16K, 10-bits map(每位代表16K页面)
   buddy[3]--->  #       #       #       #       #        0  free 32K, 5-bits map(每位代表32K页面)

包含N个页面的一个Buddy大小大约是表示同一区域的Bitmap大小的两倍,但是它可以更快地定位页面集合。(译者注:如上表如果仅Bitmap只需要5字节-40位,而增加几个Buddy后,一共有40+20+10+5=75位) 上图显示了一个4-buddy,其空闲页面/块表示为符号.(点号),已用页面/块表示为符号#。 当一个块包含至少一个已用子块时,它本身被标记为#已用(译者注:表示此块作为整体已不可再使用),而属于较大块的子块在图中也被标记为x。(译者注:x应该是表示是残存的部分,也是未使用的,但是标记x应该是用于以后期的内存合并拆分处理) 假设我们要在这个Buddy上分配一个12k的region,我们将查找可用的16K块的位图 (也就是#12页,和#36页。译者注:因为只有在16K的大小能才能放入12K,所以只需要看buddy[2]的位映射情况)。 然后将buddy[2]->bit[4]设置为‘已使用’。(译者注:buddy[2]的第4位映射了#12页开头的16k内存,) 现在我们只想要4个页面中的3个,所以剩余的页面返回到适当的Buddy位映射中 (也就是#12开始只还剩了一个页的映射)。 由此产生的整体Buddy是(译者注:注意12往下的几层Buddy的状态变化):

                 0   4   8   12  16  20  24  28  32  36
                 ###.#....#..###...#...###...########.... real memory pattern

   buddy[0]--->  ###.#.xx.#xx###.xx#.xx###.xx########xxxx 6  free 4K , 5-byte bitmap
   buddy[1]--->  # # # . # . # # . # . # # . # # # # x x  5  free 8K , 20-bits map
   buddy[2]--->  #   #   #   #   #   #   #   #   #   .    1  free 16K, 10-bits map
   buddy[3]--->  #       #       #       #       #        0  free 32K, 5-bits map

请注意,最初应该尽量用最大的region,因此如果Buddy[0]显示为空(empty),我们需要检查Buddy[1],然后检查Buddy[2],以获得要拆分的空闲块。

混合方案

多种分配器可以被链接使用,以便 (例如) 仅覆盖最后的操作,并且堆栈的 “底部” 被提交到映射位图 (用于紧凑存储)。 如果栈缺少页面,它可以扫描位图以找到一些可用页 (也许在后台任务中进行)。

混合方案 #2

也可以不是只跟踪代表页的位,或者只跟踪 上的页码,而是使用一个大的结构数组来表示内存。 在这些页面框架结构中,存储指向下一页的单个链接 (指针大小) 和指示其状态的8-16位信息块。 还包括虚拟页指针和页码所属的TCB(译者注:应该是Thread Control Block-线程控制块)。 保留指向每种类型页面的指针,指向列表的开始和结尾。 通过这种方式,你可以轻松地显示有关其内容的信息,每种类型的可用页数,混合类型,允许动态清理线程,相当容易地进行写复制(copy-on-write),并保持页面的清晰简洁一览。 它也用作列出页面类型的反向页面映射表。

有关示例实现,请参见AtlantisOS 0.0.2或更高版本。

虚拟地址分配器

Flat List

管理地址空间一大片区域的一种直接方法是链表 (如下所示)。 每个 “可用” region都与给出其大小和基址的描述符相关联。 当需要分配某些空间时,使用 “first fit” 或 “best fit” (或其他) 算法扫描列表以寻找足够大的region。 这是例如ms-dos管理内存的方式。 分配内存时,适当的条目要么被删除 (整个region被分配),要么被调整大小 (仅分配region的一部分)。

请注意,对于flat linked-list,“在地址XXX的内存是否空闲” 或 “在哪里可以得到一个大小为YYY的块” 的查询请求可能需要对列表进行完整遍历才能得到答案。 如果虚拟内存变得支离破碎,列表变长,这可能会成为一个问题。 查询“地址XXX处的内存是可用的吗?” 主要用于在释放块时将两个空闲区域合并为一个新的 (更大的) 区域,并且如果列表由不断增长的地址保持顺序,则更容易处理。

Flat list.png

基于树的方法

由于经常在列表中搜索给定地址或给定大小,因此使用更有效的数据结构可能会很有趣。 各种算法中仍然保持遍历整个列表能力的一种做法是AVL树。 AVL树中的每个 “节点” 将描述一个内存region,并具有指向较低节点的子树和较高节点的子树的指针。

Tree based.png

虽然在这样的平衡树中插入/删除需要比链表操作更复杂的操作,但通常搜索链表的时间复杂度为O(log2(N)) ,而不是链表的O(N) -- 也就是说,本来如果你有1000个条目,则需要1000次迭代来扫描列表,而用树算法只需要10次迭代来查找树中的给定间隔。

Linux使用AVL树进行虚拟地址管理已有相当一段时间了。 但是请注意,它将其用于regions(例如在/proc/xxxx/maps中找到的内容),而不是用于类似malloc的接口。

另见

文章

论坛主题

外部链接

de:Physische Speicherverwaltung