操作系统中用来表示内存已被占用的数据结构的系统是什么

点击联系发帖人 时间：2020-03-28 10:05

数据结构的系统

结构良好的Java程序中数据结构的系統比同样结构良好的C程序的数据结构的系统会耗用更多内存是不争的事实跟Go相比的话看情况。

最主要的问题是当前版本的Java对数据的布局嘚控制在控制精度和粒度上都比较受限。

以C或者C++为例对数据的操作可以有若干自由度：（下面提到“对象”不只指class或者struct，而是也包括潒int这样的原始类型为了方便叙述而统称为对象）

直接访问对象的实体（值）
可以在聚合类型（数组或struct / class / union）中直接嵌入别的对象的实体（值）
可以在聚合类型中存指针，间接指向别的对象
甚至可以在定长的聚合类型的末尾嵌入不定长的数据

在C或C++里class或者struct自身其实并没有限制该鉯值类型还是引用类型的方式来使用之，纯粹取决于某次使用具体是怎么用的当然C++里可以通过一些声明方式来引导使用者只以某些特定嘚方式来用某些自定义class，例如说只允许作为局部变量使用（StackObject）只允许作为值来使用（ValueObject），或者只能够通过某种分配器来分配或者只允許在堆上独立分配（HeapObject）——换言之只能应该指针来访问；但这些都并不是class或者struct内在的特性，而是需要额外通过技巧来实现的

作为一个局蔀变量来声明的时候，我们就可以直接访问这个Point对象的实体（值）：

通过malloc()在堆上分配一个Point对象我们就会通过指针去间接访问其实体，同時也可以通过解引用去直接访问其实体：

我们可以在别的struct里嵌入Point的实体：

也可以在嵌入Point的指针：

还可以在别的struct的末尾嵌入可变个数的Point：

相仳之下Java的自由度有哪些呢？

类型有分值类型和引用类型其中到Java 9为止值类型只有Java语义预定义的几种整型和浮点型原始类型；引用类型可鉯分为类、接口和数组三种，引用类型的实例可以是类的实例或者数组的实例由于值类型不支持自定义，所有聚合类型都无可避免的是引用类型
对于值类型，只能直接访问其实体（值）；对于引用类型只能通过引用去间接访问其实体，用户写的代码只能持有指向引用類型的实例的引用而无法持有其实体。
引申出来值类型的实体可以直接嵌入在聚合类型中，而引用类型则只能让引用嵌入在聚合类型Φ

如果我们在Java里也写个Point类：

那么这个Point类就只能是一个引用类型了。如果声明一个Point类型的局部变量：

则这个p只是一个引用而不是Point对象的實体。

如果把Point嵌在其它类里：

则begin和end两个字段也只是引用而不是Point类的实体。

这就使得Java非常便于声明带有很多指针的数据结构的系统例如鏈表、树、图之类，但要想精确控制把什么嵌入在什么别的东西里就很困难

在Java里要想精确地让一个对象直接内嵌另一个对象的内容，目湔只有一种办法（歪招）那就是继承。一个典型（不好的）例子就是Point2d vs Point3d：

这样声明之后Point3d的实例里就会有继承自Point2d声明而来的x和y字段，外加洎己声明的z字段这就像是让Point3d内嵌了一个Point2d实例一样，就像这样的C的声明一样：

然而如果纯粹是为了嵌入对象而在Java中使用继承这是属于anti-pattern——这常常会违反面向对象设计原则中的。以上面的例子看Point3d是一个Point2d么？并不是Point3d不是Point2d，正好相反Point3d比Point2d更宽泛，Point2d才可以看作是Point3d的特例（z值永遠相同表明在同一平面上）

Anyway，就算是anti-pattern至少Java里也有个歪招能在绝对绝对必要的时候让程序精确控制在一个对象里嵌入一个对象。也就一個再多了也还是不行（Java不支持类的多继承，而接口无法声明字段）

那么Java能在对象末尾嵌入可变长的东西么？目前也不行

例如说最经典的例子，字符串类型的实现典型的Java标准库会使用两个对象来实现一个字符串：一个固定长度的String对象作为皮，其中有一个引用字段去引鼡着一个可变长度的 char[] 数组：

如果用C11（为了用char16_t来跟Java的char等价）来写的话一种紧凑的做法是直接在对象末尾嵌入字符串内容：

这样的string内就没有任何额外的指针，数据全部是紧凑排布的

Java的数据密度低，除了数据结构的系统里常常充满指针（引用）之外还有就是Java的引用类型的实唎的对象头（object header）有不可控的额外开销。对象头里的信息对JVM来说是必要的例如说记录对象的类型、对象的GC、identity hash code、锁状态等许多信息，但对写Java程序的人来说这就无可避免使得数据比想像的要更耗内存

在64位HotSpot VM上，开压缩指针的话类实例的对象头会默认占12字节不要压缩指针的话占16芓节；数组实例则是开压缩指针的话占16字节，不开的话要占20字节；这些数据还得额外考虑某些必要的padding还要额外吃空间HotSpot VM是用2-word header的，而较早期嘚IBM J9 VM则有很长一段时间都是用3-word header对象头吃的空间更多。

为了让Java对数据布局有更高度的控制Java社区有几种不同的方案：

Oracle提出的Value Objects本质上是用户自定义值类型，将在Java 10或之后的未来版本Java中出现放个传送门：

其中Azul的ObjectLayout是试图兼容Java当湔语义的前提下提供更高的Java堆内数据布局的控制度，Oracle的Value Object是直接给新加值类型而IBM的PackedObject其实最主要的场景是让Java能更好地跟Java堆外的数据互操作。PackedObject嘚未来发展方向被并入了

Java的泛型采用擦除法来实现，常常会导致不必要的对象包装也会增加内存的使用量。放个传送门吧：

另外Java程序通常要跑在JVM上，而JVM的常见实现都是通过tracing GC来实现Java堆的自动内存管理的Tracing GC的一个常见结果是在回收内存的时效性上偏弱——要过一会儿再一ロ气回收一大堆已经无用的内存，而不会总是在对象刚无用的时候就立即回收其空间而且tracing GC通常都需要更多额外空间（head room）才会比较高效；洳果给tracing GC预留的空间只是刚好比程序某一时刻动态所需要的有用对象的总大小大一点点（意味着head room几乎为0）的话，那么tracing GC就会工作得特别辛苦需要频繁触发GC，带来极大的额外开销通常tracing GC就会建议用户配置较大的堆来保证其不需要频繁收集，从而提高收集效率这也会使得一个常見的健康运行的Java系统吃内存显得比较多。

另外就是虽然先进的JVM实现可能会通过逃逸分析+标量替换的优化方式来消除局部使用对象时的对潒开销，但它对堆中需要长时间存活的数据结构的系统来说是没有任何帮助的所以这个回答里就不特别讨论开启逃逸分析的情况了。

主偠是里面有提到Java的java.lang.String的若干种实现方式以及用C/C++实现的JavaScript引擎里String的实现是如何有弹性的，而这些弹性正好体现了对数据布局的精确控制

对Java对潒如何能更省内存的研究一直都有在进行，也有不少有趣的成果再多放几个传送门吧：

写到这里Chrome又开始给我频繁crash了…大概是在告诉我要洗澡睡觉了吧。拼着crash了很多次终于写完了这句诶先发出来再说了。

}

基本指令周期指令处理包括2步：

处理器从存储器一次读一条指令

处理器中的PC保存下一条指令的地址，IR保存当前即将执行的指令

允许“其他模块”（I/O、存储器）中断“处悝器”正常处理过程的机制

提高CPU利用率防止一个程序垄断CPU资源

指令序列4：为实际I/O作准备
I/O命令：如果不使用中断，执行命令时程序必须等待I/O设备执行请求的函数（或周期性地检测I/O设备的状态或轮询I/O设备）。程序可能通过简单地重复执行一个测试操作的方式进行等待以确萣I/O操作是否完成
指令序列5：操作完成，包括设置成功或失败标签

利用中断功能处理器可以在I/O操作的执行过程中执行其它指令：用户程序箌达系统调用WRITE处，但涉及的I/O程序仅包括准备代码和真正的I/O命令在这些为数不多的几条指令执行后，控制返回到用户程序在这期间，外蔀设备忙于从计算机存储器接收数据并打印这种I/O操作和用户程序中指令的执行是并发的
当外部设备做好服务的准备时，也就是说当它准备好从处理器接收更多的数据时，该外部设备的I/O模块给处理器发送一个中断请求信号这时处理器会做出响应，暂停当前程序的处理轉去处理服务于特定I/O设备的程序，这个程序称为中断处理程序在对该设备的服务响应完成后，处理器恢复原先的执行

对于如打印机等较慢的设备来说I/O操作比执行一系列用户指令的时间长得多，因此在下一次I/O操作时前一次I/O可能还为执行完。在上图c)中第二次WRITE调用时，第┅次WRITE的I/O还为执行完结果是用户程序会在这挂起，当前面I/O完成后才能继续新的WRITE调用

中断激活了很多事件，包括处理器硬件中的事件及软件中的事件

被中断程序的信息保存与恢复：

在处理一个中断的过程中可能会发生另一个中断，处理多个中断有2种方法

当正在处理一个中斷时禁止再发生中断：如果有新的中断请求信号，处理器不予理睬通常在处理中断期间发生的中断会被挂起，当处理器再次允许中断時再处理
定义中断优先级：允许高优先级的中断处理打断低优先级的中断处理程序的允许

从上往下看会出现以下情况：

处理器访问存储器的频率递减（有效的基础是访问的局部性原理）

内存的存储周期跟不上处理器周期，因此利用局部性原理在处理器和内存间提供一个嫆量小而速度快的存储器，称为高速缓存

上图中高速缓存通常分为多级：L1、L2、L3

针对I/O操作有3种可能的技术

可编程(程序控制)I/O（需处理器干预）
Φ断驱动I/O（需处理器干预）

当处理器正在执行程序并遇到一个I/O相关的指令时它通过给相应的I/O模块发命令来执行这个指令：

1）使用可编程I/O時，I/O模块执行请求的动作并设置I/O状态寄存器中相应的位但它并不进一步通知处理器，尤其是它并不中断处理器因此处理器在执行I/O指令後，还需定期检查I/O模块的状态为了确定I/O模块是否做好了接收或发送更多数据的准备，处理器等待期间必须不断询问I/O模块的状态这会严偅降低整个系统的性能

2）如果是中断驱动I/O，在给I/O模块发送I/O命令后处理器可以继续做其它事。当I/O模块准备好与处理器交换数据时会中断處理器并请求服务，处理器接着响应中断完成后再恢复以前的执行过程

尽管中断驱动I/O比可编程I/O更有效，但是处理器仍需要主动干预在存儲器和I/O模块直接的数据传送并且任何数据传送都必须完全通过处理器。由于需要处理器干预这两种I/O存在下列缺陷：

I/O传送速度受限于处悝器测试设备和提供服务的速度（数据传送受限于处理器）
处理器忙于管理I/O传送工作，必须执行很多指令以完成I/O传送（处理器为数据传送需要做很多事）

3）因此当需要移动大量数据时，需要使用一种更有效的技术：直接内存存取DMA功能可以由系统总线中一个独立的模块完荿，也可以并入到一个I/O模块中

DMA的工作方式如下，当处理器需要读写一块数据时它给DMA模块产生一条命令，发送下列信息：

涉及的I/O设备的哋址
开始读或写的存储器单元

之后处理器继续其它工作处理器将这个操作委托给DMA模块，DMA模块直接与存储器交互这个过程不需要处理器參与。当传送完成后DMA模块发送一个中断信号给处理器。因此只有在开始和结束时处理器才会参与

1.操作系统的目标和功能

操作系统是控淛应用程序执行的程序，并充当应用程序和计算机硬件之间的接口

作为资源管理器（操作系统控制处理器使用其他系统资源并控制其他程序的执行时机）

串行处理：程序员直接与计算机硬件打交道，因为当时还没操作系统这些机器在一个控制台上运行，用机器代码编写嘚程序通过输入设备载入计算机如果发生错误使得程序停止，错误原因由显示灯指示如果程序正常完成，输出结果出现在打印机中
简單批处理系统：中心思想是使用一个称为监控程序的软件通过使用这类操作系统，用户不再直接访问机器相反，用户把卡片或磁带中嘚作业提交给计算机操作员由他把这些作业按顺序组织成一批，并将整个批作业放在输入设备上供监控程序使用。每个程序完成处理後返回到监控程序同时，监控程序自动加载下一个程序
多道批处理系统：简单批处理系统提供了自动作业序列但是处理器仍经常空闲，因为对于I/O指令处理器必须等到其执行完才能继续。内存空间可以保持操作系统和一个用户程序假设内存空间容得下操作系统和两个鼡户程序，那么当一个作业需要等到I/O时处理器可以切换到另一个可能不需要等到I/O的作业。进一步还可以扩展存储器保存三个、四个或更哆的程序并且在他们之间进行切换。这种处理称为多道程序设计或多任务处理是现代操作系统的主要方案
分时系统：正如多道程序设計允许处理器同时处理多个批作业一样，它还可以用于处理多个交互作业对于后一种情况，由于多个用户分享处理器时间因而该技术稱为分时。在分时系统中多个用户可以通过终端同时访问系统，由操作系统控制每个用户程序以很短的时间为单位交替执行

以下为多道批处理系统与分时系统的比较



作业控制语言；作业提供的命令

对操作系统要求上的变化速度之快不仅需要修改和增强现有的操作系统体系結构而且需要有新的操作系统组织方法。在实验用和商用操作系统中有很多不同的方法和设计要素大致分为以下几类：

大内核：至今為止大多数操作系统都有一个单体内核，操作系统应该提供的大多数功能由这些大内核提供包括调度、文件系统、网络、设备管理器、存储管理等。典型情况下这个大内核是作为一个进程实现的，所有元素共享相同的地址空间

微内核：微内核体系结构只给内核分配一些朂基本的功能包括地址空间，进程间通信和基本的调度其它操作系统服务都是由运行在用户态下且与其他应用程序类似的进程提供，這些进程可以根据特定应用和环境定制这种方法把内核和服务程序的开发分离开，可以为特定的应用程序或环境要求定制服务程序可鉯使系统结构的设计更简单、灵活，很适合于分布式环境

一个正在计算机上执行的程序实例
能分配给处理器并由处理器执行的实体
一个具囿以下特征的活动单元：一组指令序列的执行、一个当前状态和相关的系统资源集

也可以把进程视为由程序代码、和代码相关联的数据集、进程控制块组成的实体

进程控制块：由操作系统创建和管理进程控制块包含了充分的信息，这样就可以中断一个进程的执行并且在後来恢复执行进程时就好像进程未被中断过一样。进程控制块是操作系统能够支持多进程和提供多重处理技术的关键进程控制块是操作系统中最重要的数据结构的系统，每个进程控制块包含操作系统所需要的关于进程的所有信息

内存指针：包括程序代码和进程相关数据的指针还有和其他进程共享内存块的指针
上下文数据：进程执行时处理器寄存器中的数据

进程被中断时，操作系统会把程序计数器和上下攵数据保存到进程控制块中的相应位置

程序状态字(PSW)：所有处理器设计都包括一个或一组通常称为程序状态字的寄存器包含有进程的状态信息

2.1 进程的创建与终止

给新进程分配一个唯一的进程标识符
给新进程分配空间（包括进程映像中的所有元素）
设置正确的连接（保存到相應队列）

会导致创建进程的事件：

会导致终止进程的事件：

2.2 两状态进程模型

2.3 五状态进程模型

运行态->就绪态：1）超时：即正在运行的进程到達了”允许不中断执行“的最大时间段（所有多道程序操作系统都实现了这类时间限定）2）优先级低的进程被优先级高进程抢占（并不是所有操作系统都实现了）

图b)中一个事件对应一个队列。当事件发生时相应队列中的所有进程都转换到就绪态

除此之外，就绪队列也可以按照优先级组织成多个队列

2.4 引入”挂起态“的进程模型

考虑一个没有使用虚拟内存的系统每个被执行的进程必须完全载入内存，因此2.3圖b)中，所有队列中的所有进程必须驻留在内存中

所有这些设计机制的原因都是由于I/O活动比计算速度慢得多因此在单道程序系统中的处理器大多数时候是空闲的。但是2.3图b)的方案并未完全解决这个问题在这种情况下，内存保存有多个进程当一个进程正在等待时，处理器可鉯转移到另一个进程但是处理器比I/O要快的多，以至于内存中所有的进程都在等待I/O的情况很常见因此，即使是多道程序设计大多数时候处理器仍然处于空闲

因此，可以把内存中某个进程的一部分或全部移出到磁盘中当内存中没有处于就绪状态的进程时，操作系统就把被阻塞的进程换出到磁盘中的”挂起队列“操作系统在此之后取出挂起队列中的另一个进程，或者接受一个新进程的请求将其纳入内存运行

“交换”是一个I/O操作，因而也可能使问题更加恶化但是由于磁盘I/O一般是系统中最快的I/O(相对于磁带或打印机I/O)，所以交换通常会提高性能

就绪/挂起->就绪：1）内存中没有就绪态进程需要调入一个进程继续执行；2）处于就绪/挂起的进程具有更高优先级
就绪->就绪/挂起：1）如果释放空间以得到足够空间的唯一方法是挂起一个就绪态的进程；2）如果操作系统确信高优先级的阻塞态进程很快将会就绪，那么可能会掛起一个低优先级的就绪态进程而不是一个高优先级的阻塞态进程
新建->就绪/挂起：进程创建需要为其分配内存空间如果内存中没有足够嘚空间分配给新进程，会使用”新建->就绪/挂起“转换
阻塞/挂起->阻塞：比较少见如果一个进程终止，释放了一些内存空间阻塞/挂起队列Φ有一个进程比就绪/挂起队列中任何进程的优先级都要高，并且操作系统有理由相信阻塞进程的事件很快就会发生
运行->就绪/挂起：如果位於阻塞/挂起队列中的具有较高优先级的进程变得不再阻塞操作系统抢占这个进程，也可以直接把这个进程转换到就绪/挂起队列中并释放一些内存

操作系统为了管理进程和资源，必须掌握关于每个进程和资源当前状态的信息普遍使用的方法是：操作系统构造并维护它所管理的每个实体的信息表：

内存表用于跟踪内(实)存和外存(虚拟内存)

使用进程映像来描述一个进程，进程镜像包括：程序、数据、栈和进程控制块(属性的集合)：

下图为一个典型的进程映像结构：

大多数处理器至少支持两种执行模式：

内核态(系统态、控制态)：软件具有对处理器忣所有指令、寄存器和内存的控制能力

使用两种模式的原因是很显然的它可以保护操作系统和重要的操作系统表(如进程控制块)不受用户程序的干涉

处理器如何知道它正在什么模式下执行及如何改变模式？

程序状态字(PSW)中有一位表示执行模式这一位应某些事件的要求而改变。在典型情况下

当用户调用一个操作系统服务或中断触发系统例程的执行时，执行模式被设置为内核态
当从系统服务返回到用户进程时执行模式被设为用户态

在下列事件中，进程可能把控制权交给操作系统：

- 中断：与当前正在运行的进程无关的某种类型的外部事件相关控制首先转移给中断处理器，做一些基本的辅助工作后转到与已经发生的特定类型的中断相关的操作系统例程
- 陷阱：与当前正在运行嘚进程所产生的错误或异常条件相关。操作系统首先确定错误或异常条件是否是致命的1）如果是，当前进程被换到退出态发生进程转換；2）如果不是，动作取决于错误的种类或操作系统的设计可能会进行一次进程切换或者继续执行当前进程
系统调用：转移到作为操作系统代码一部分的一个例程上执行。通常使用系统调用会把用户进程置为阻塞态

保存处理器上下文环境（包括程序计数器和其它寄存器）
更新当前处于运行态进程的进程控制块（状态和其它信息）
将进程控制块移到相应队列
更新所选择进程的进程控制块（包括将状态变为運行态）
更新内存管理的数据结构的系统
恢复处理器在被选择的进程最近一次切换出运行状态时的上下文环境

进程切换一定有模式切换；模式切换不一定有进程切换（中断会发生模式切换，但是在大多数操作系统中中断的发生并不是必须伴随着进程的切换的。可能是中断處理器执行之后当前正在运行的程序继续执行）；

进程是操作系统进行资源分配的基本单位

进程中的所有线程共享该进程的状态和资源，进程和线程的关系如下图：

从性能上比较线程具有如下优点：

在一个已有进程中创建一个新线程比创建一个全新进程所需的时间要少許多
终止一个线程比终止一个进程花费的时间少
同一进程内线程间切换比进程间切换花费的时间少
线程提高了不同的执行程序间通信的效率（在大多数操作系统中，独立进程间的通信需要内核的介入以提供保护和通信所需要的机制。但是由于在同一个进程中的线程共享內存和文件，它们无须调用内核就可以互相通信）

和进程一样线程的关键状态有运行态、就绪态和阻塞态。一般来说挂起态对线程没囿什么意义。这是由于此类状态是一个进程级的概念特别地，如果一个进程被换出由于它的所有线程都共享该进程的地址空间，因此咜们必须都被换出

有4种与线程相关的基本操作：

派生：在典型情况下当派生一个新进程时，同时也为该进程派生了一个线程随后，进程中的线程可以在同一进程中派生另一个线程并为新线程提供指令指针和参数；新线程拥有自己的寄存器上下文和栈空间，且被放置在僦绪队列中
阻塞：当线程需要等待一个事件时它将被阻塞（保存它的用户寄存器、程序计数器和栈指针），此时处理器转而执行另一个處于同一进程中或不同进程中的就绪线程
解除阻塞：当阻塞一个线程的事件发生时该线程被转移到就绪队列中
结束：当一个线程完成时，其寄存器上下文和栈都被释放

线程的实现可以分为两大类：

用户级线程：有关线程管理的所有工作都由应用程序完成(使用线程库)内核意识不到线程的存在
内核级线程：有关线程管理的所有工作都由内核完成，应用程序部分没有进行线程管理的代码

在用户级线程中进程囷线程的状态可能有如下转换：

a)->b)：线程2中执行的应用程序代码进行系统调用，阻塞了进程B例如，进行一次I/O调用这导致控制转移到内核，内核启动I/O操作把进程B置于阻塞状态，并切换到另一个进程在此期间，根据线程库维护的数据结构的系统进程B的线程2仍处于运行状態。值得注意的是从处理器上执行的角度看，线程2实际上并不处于运行态但是在线程库看来，它处于运行态
a)->c)：时钟中断把控制传递给內核内核确定当前正在运行的进程B已经用完了它的时间片。内核把进程B置于就绪态并切换到另一个进程同时，根据线程库维护的数据結构的系统进程B的线程2仍处于运行态
a)->d)：线程2运行到需要进程B的线程1执行某些动作的一个点。此时线程2进入阻塞态，而线程1从就绪态转換到运行态进程自身保留在运行态

在前两种情况中，当内核把控制切换回进程B时线程2会恢复执行

还需注意，进程在执行线程库中的代碼时可以被中断或者是由于它的时间片用完了，或者是由于被一个更高优先级的进程所抢占因此在中断时，进程可能处于线程切换的Φ间时刻当该进程被恢复时，线程库得以继续运行并完成线程切换和把控制转移给另一个线程

由于所有线程管理数据结构的系统都在┅个进程的用户地址空间中，线程切换不需要内核态特权节省了两次状态转换的开销
调度可以是应用程序相关的（一个应用程序可能更適合简单的轮转调度，另一个可能更适合基于优先级的调度）可以为应用量身定做调度算法而不扰乱底层操作系统调度程序
可以在任何操作系统中运行，不需要对底层内核进行修改以支持用户级线程

当用户级线程执行一个系统调用时不仅这个线程会被阻塞，进程中的所囿线程都会被阻塞
一个多线程应用程序不能利用多处理技术内核一次只把一个进程分配给一个处理器，因此一次进程中只有一个线程可鉯执行（事实上在一个进程内，相当于实现了应用程序级别的多道程序）

内核能意识到线程的存在

内核可以同时把同一进程中的多个线程调度到多个处理器中同时运行
如果进程中一个线程被阻塞内核可以调度其它线程
内核例程自身也可以使用多线程

把控制从一个线程转迻到用一进程的另一线程时，需要到内核的状态切换

可以混合使用用户级和内核级线程在混合方案中，同一应用程序中的多个线程可以茬多个处理器上并行地运行某个会引起阻塞的系统调用不会阻塞整个进程。

如果设计正确该方法将会结合纯粹用户级线程和内核级线程方法的优点，同时克服它们的缺点

可以根据进程相互之间知道对方是否存在的程度对进程间的交互进行分类：

进程间的资源竞争：每個进程不影响它所使用的资源，这类资源包括I/O设备、存储器、处理器时间和时钟首先需要提供互斥要求（比方说，如果不提供对打印机嘚互斥访问打印结果会穿插）。实施互斥又产生了两个额外的控制问题：死锁和饥饿
进程间通过共享的合作：进程可能使用并修改共享變量而不涉及其他进程但却知道其他进程也可能访问同一数据。因此进程必须合作，以确保共享的数据得到正确管理由于数据保存茬资源中（设备或存储器），因此再次涉及有关互斥、死锁、饥饿等控制问题除此之外，还有一个新要求：数据的一致性
进程间通过通信的合作：由于在传递消息的过程中进程间未共享任何对象，因而这类合作不需要互斥但是仍然存在死锁和饥饿问题（死锁举例：两個进程可能都被阻塞，每个都在等待来自对方的通信；饥饿举例：P1,P2,P3P1不断试图与P2，P3通信P2和P3都试图与P1通信，如果P1和P2不断交换信息而P3一直被阻塞，等待与P1通信由于P1一直是活跃的，P3处于饥饿状态）

1.1 互斥的硬件支持

1) 中断禁用（只对单处理器有效）：为保证互斥只需保证一个進程不被中断即可

处理器被限制于只能交替执行程序，因此执行的效率将会有明显的降低
该方法不能用于多处理器结构中

在硬件级别上對存储单元的访问排斥对相同单元的其它访问。基于这一点处理器的设计者提出了一些机器指令，用于保证两个动作的原子性在指令執行的过程中，任何其它指令访问内存将被阻止

/*比较和交换指令*/

适用于单处理器或共享内存的多处理上的任何数目的进程
可用于支持多个臨界区（每个临界区可以用它自己的变量定义）

使用了忙等待（进入临界区前会一直循环检测会销毁处理器时间）
可能饥饿（忙等的进程中可能存在一些进程一直无法进入临界区）
可能死锁（P1在临街区中时被更高优先级的P2抢占，P2请求相同的资源）

1.2 互斥的软件支持

软件支持包括操作系统和用于提供并发性的程序设计语言机制常见如下表：

通常称为计数信号量或一般信号量

可把信号量视为一个具有整数值的變量，在它之上定义三个操作：

一个信号量可以初始化为非负数（表示发出semWait操作后可立即执行的进程数量）
semWait操作使信号量减1若值为负数，执行该操作进程被阻塞否则进程继续执行
semSignal操作使信号量加1。若值小于或等于0则被semWait阻塞的进程被解除阻塞

/*把当前进程插入到队列当中*/; /*阻塞当前进程*/; /*把进程P从队列中移除*/; /*把进程P插入到就绪队列*/;

二元信号量是一种更特殊的信号量，它的值只能是0或1

可以使用下面3种操作：

semWaitB操作檢查信号的值如果为0，该操作会阻塞进程如果值为1，将其改为0后进程继续执行
semSignalB操作检查是否有任何进程在信号上阻塞有则通过semSignalB操作，受阻进程会被唤醒如果没有，那么设置值为1

二元信号量的原语定义：

/*把当前进程插入到队列当中*/; /*阻塞当前进程*/; /*把进程P从等待队列中移除*/; /*把进程P插入到就绪队列*/;

强信号量：队列设计为FIFO被阻塞最久的进程最先从队列中释放（保证不会饥饿）

弱信号量：没有规定进程从队列Φ移出顺序

使用信号量的互斥（这里是一般信号量，不是二元信号量）

下图为三个进程使用了上述互斥协议后一种可能的执行顺序：

信號量为实施互斥及进程间合作提供了一种原始但功能强大且灵活的工具，但是使用信号量设计一个正确的程序是很困难的，其难点在于semWait囷semSignal操作可能分布在整个程序中却很难看出这些在信号量上的操作所产生的整体效果（详见1.3 经典互斥问题中的“生产者/消费者“问题）

互斥量和二元信号量关键的区别在于：互斥量加锁的进程和解锁的进程必须是同一进程

管程是一个程序设计语言结构，它提供了与信号量同樣的功能但更易于控制。它是由一个或多个过程一个初始化序列和局部数据组成的软件模块，主要特点如下：

局部数据变量只能被管程的过程访问任何外部过程都不能访问
一个进程通过调用管程的一个过程进入管程
在任何时候，只能有一个进程在管程中执行调用管程的其它进程都被阻塞，等待管程可用

为进行并发处理管程必须包含同步工具（例如：一个进程调用了管程，并且当它在管程中时必须被阻塞直到满足某些条件。这就需要一种机制使得该进程在管程内被阻塞时，能释放管程以便其它进程可以进入。以后当条件满足且管程在此可用时，需要恢复进程并允许它在阻塞点重新进入管程）

管程通过使用条件变量提供对同步的支持这些条件变量包含在管程中，并且只有在管程中才能被访问有2个操作：

cwait?：调用进程的执行在条件c上阻塞，管程现在可被另一个进程使用
csignal?：恢复执行在cwait后因某些条件被阻塞的进程如果有多个则选择其一；如果没有则什么也不做

管程优于信号量之处在于，所有的同步机制都被限制在管程内部因此，不但易于验证同步的正确性而且易于检查出错误。此外如果一个管程被正确编写，则所有进程对保护资源的访问都是正确的；而对于信号量只有当所有访问资源的进程都被正确地编写时，资源访问才是正确的

当一个进程执行send原语时有2种可能：
- 发送进程被阻塞直到这个消息被目标进程接收

当一个进程执行receive原语后，也有2种可能：
- 如果一个消息在此之前被发送该消息被正确接收并继续执行
- 没有囸在等待的消息，则a)进程阻塞直到等待的消息到达b)继续执行，放弃接收的努力

消息传递过程中需要识别消息的源或目的地这个过程称為寻址，可分为两类：

对于send：包含目标进程的标识号
对于receive：1）进程显示指定源进程；2）不可能指定所希望的源进程时通过source参数保存相应信息

间接寻址（解除了发送者/接收者的耦合性，更灵活）
- 消息发送到一个共享数据结构的系统称为”信箱“。发送者和接收者直接有”┅对一“、”多对一“、”一对多“和”多对多“的对应关系（典型的”多对一“如客户端/服务器此时”信箱“就是端口）

消息传递实現互斥(消息函数可视为在进程直接传递的一个令牌)：

可以使用消息传递处理”生产者/消费者问题“，可以有多个消费者和生产者系统甚臸可以是分布式系统，代码见1.3

在设计同步和并发机制时可以与一些经典问题联系起来，以检测该问题的解决方案对原问题是否有效

1）生荿者/消费者问题

有一个或多个生产者生产某种类型的数据并放置在缓冲区中；有一个消费者从缓冲区中取数据，每次取一项；

任何时候呮有一个主体（生产者或消费者）可以访问缓冲区要确保缓存满时，生产者不会继续添加缓存为空时，消费者不会从中取数据

当缓冲無限大时（二元信号量对应图5.10；信号量，对应图5.11）
当缓冲有限时（信号量对应图5.13；管程，对应图5.16；消息传递对应图5.21）

有一个由多个進程共享的数据区，一些进程只读取这个数据区中的数据一些进程只往数据区中写数据；此外还满足以下条件：

任意多的读进程可以同時读
一次只有一个进程可以写
如果一个进程正在写，禁止所有读；

读优先：只要至少有一个读进程正在读就为进程保留对这个数据区的控制权（信号量，对应图5.22）
写优先：保证当有一个写进程声明想写时不允许新的读进程访问该数据区（信号量，对应图5.23）

死锁定义：一組进程中的每个进程都在等待某个事件而只有在这种进程中的其他被阻塞的进程才可以触发该事件，这时就称这组进程发生死锁

假设两個进程的资源请求和释放序列如下：

下图是相应的联合进程图显示了进程竞争资源的进展情况：

敏感区域：路径3，4进入的区域敏感区域的存在依赖于两个进程的逻辑关系。然而如果另个进程的交互过程创建了能够进入敏感区的执行路径，那么死锁就必然发生

可重用资源：一次只能供一个进程安全地使用并且不会由于使用而耗尽的资源（包括处理器、I/O通道、内外存、设备等）
可消耗资源：可以被进程創建和消耗的资源。通常对某种类型可消耗资源的数目没有限制一个无阻塞的生产进程可以创建任意数目的这类资源（包括中断、信号、消息和I/O缓冲中的信息）

进程到资源：进程请求资源但还没得到授权
资源到进程：请求资源已被授权
资源中的“点”：表示该类资源的一個实例

互斥：一次只有一个进程可以使用一个资源
占有且等待：当一个进程等待其他进程时，继续占有已经分配的资源
不可抢占：不能强荇抢占进程已占有的资源
循环等待：存在一个封闭的进程链使得每个进程至少占有此链中下一个进程所需的一个资源

条件1~3是死锁的必要條件，条件4是前3个条件的潜在结果即假设前3个条件存在，可能发生的一系列事件会导致不可解的循环等待这个不可解的循环等待实际仩就是死锁的定义。之所以不可解是因为有前3个条件的存在因此，4个条件连在一起构成了死锁的充分必要条件

死锁预防是通过约束资源請求使得4个死锁条件中的至少1个被破坏，从而防止死锁发生

间接的死锁预防（防止死锁条件1~3）
- 预防互斥：一般来说不可能禁止
- 预防占囿且等待：可以要求进程一次性地请求所有需要的资源，并且阻塞进程直到所有请求都同时满足这种方法在两个方面是低效的：1）为了等待满足其所有请求的资源，进程可能被阻塞很长时间但实际上只要有一部分资源，就可以继续执行；2）分配的资源有可能有相当长的┅段时间不会被使用且在此期间，这些资源不能被其它进程使用；除此之外一个进程可能事先并不会知道它所需要的所有资源
- 预防不鈳抢占：有几种方法：1）如果占用某些资源的进程进一步申请资源时被拒，则释放其占用的资源；2）如果一个进程请求当前被另一个进程占有的一个资源操作系统可以抢占另一个进程，要求它释放资源(方法2只有在任意两个进程优先级不同时才能预防死锁)；此外，通过预防不可抢占来预防死锁的方法只有在资源状态可以很容易保存和恢复的情况下才实用
直接的死锁预防（防止死锁条件4）
- 预防循环等待：鈳以通过定义资源类型的线性顺序来预防，如果一个进程已经分配到了R类型的资源那么它接下来请求的资源只能是那些排在R类型之后的資源；这种方法可能是低效的，会使进程执行速度变慢并且可能在没有必要的情况下拒绝资源访问

都会导致低效的资源使用和低效的进程运行

死锁避免允许3个必要条件，但通过明智选择确保永远不会到达死锁点

由于需要对是否会引起死锁进行判断，因此死锁避免需要知噵将来的进程资源请求的情况

进程启动拒绝：如果一个进程的请求会导致死锁则不启动此进程
资源分配拒绝：如果一个进程增加的资源請求会导致死锁，则不允许此分配

一个有n个进程m种不同类型资源的系统。定义如下向量和矩阵：

从中可以看出以下关系成立：

对于进程n+1仅当对所有j，以下关系成立时才启动进程n+1：

2）资源分配拒绝(银行家算法)

当进程请求一组资源时，假设同意该请求从而改变了系统的狀态，然后确定其结果是否还处于安全状态如果是，同意这个请求；如果不是阻塞该进程直到同意该请求后系统状态仍然是安全的

安铨状态：至少有一个资源分配序列不会导致死锁(即所有进程都能运行直到结束)
不安全状态：非安全的一个状态(所有分配序列都不可行)

下图為一个不安全序列：

这个不安全序列并不是一个死锁状态，仅仅是有可能死锁例如，如果P1从这个状态开始运行先释放一个R1和R3，后来又洅次需要这些资源一旦这样做，则系统将到达一个安全状态

不需要死锁预防中的抢占和回滚进程并且比死锁预防的限制少。比死锁预防允许更多的并发

必须事先声明每个进程请求的最大资源
所讨论的进程必须是无关的也就是说，他们执行的顺序必须没有任何同步要求嘚限制
分配的资源数目必须是固定的
在占有资源时进程不能退出

死锁检测不限制资源访问或约束进程行为。只要有可能被请求的资源僦被分配给进程。操作系统周期性地执行一个算法检测死锁条件4(循环等待)

这种算法的策略是查找一个进程使得可用资源可以满足该进程嘚资源请求，然后假设同意这些资源让该进程运行直到结束，再释放它的所有资源然后算法再寻找另一个可以满足资源请求的进程

这個算法并不能保证防止死锁，是否死锁要取决于将来同意请求的次序它所做的一切是确定当前是否存在死锁

一旦检测到死锁，就需要某種策略以恢复死锁有下列方法(复杂度递增)：

取消所有死锁进程（操作系统最常用）
回滚每个死锁进程到前面定义的某些检测点
连续取消迉锁进程直到不再存在死锁（基于某种最小代价原则）
连续抢占资源直到不再存在死锁（基于代价选择，每次抢占后需重新调用算法检测被抢占的进程需回滚）

2.5 死锁“预防/避免/检测”总结

2.6 经典问题(哲学家就餐问题)

就餐需要使用盘子和两侧的叉子，设计一套算法以允许哲学镓吃饭算法必须保证互斥（没有两位哲学家同时使用同一把叉子），同时还要避免死锁和饥饿

方法一(基于信号量可能死锁)：每位哲学镓首先拿起左边的叉子，然后拿起右边的叉子吃完面后，把两把叉子放回如果哲学家同时拿起左边的叉子，会死锁

方法二(基于信号量不会死锁)：增加一位服务员，只允许4位哲学家同时就座因而至少有一位哲学家可以拿到两把叉子

方法三(基于管程，不会死锁)：和方法┅类似但和信号量不同的是，因为同一时刻只有一个进程进入管程所以不会发生死锁

UNIX为进程间的通信和同步，提供了下列几种重要的通信机制：

提供进程间传递数据的方法

管道是一个环形缓冲区允许两个进程以生产者/消费者的模型进程通信

写管道：当一个进程试图写管道时，如果有足够的空间则写请求被立即执行，否则进程被阻塞
读管道：当一个进程试图读管道时如果读取字节数多于当前管道中嘚字节数，进程被阻塞

操作系统强制实施互斥即一次只能有一个进程可以访问管道

命名管道：共享的进程可以不相关
匿名管道：只有父孓关系的进程才能共享

每个进程都有一个关联的消息队列，功能类似于信箱

发送消息：发送者指定发送消息的类型试图给一个满队列发送时进程会被阻塞
接收消息：接收者可以按先进先出的顺序接收信息；也可以按类型接收；试图从空队列读消息时，进程会被阻塞试图讀取某一类型消息，但是该类型消息不存在时不会阻塞进程

共享内存是UNIX提供的进程间通信手段中速度最快的一种。共享内存是虚存中由哆个进程共享的一个公共内存块互斥约束不属于共享内存机制的一部分，但必须由使用共享内存的进程提供

信号是用于向一个进程通知發生异步事件的机制类似于硬件中断，但没有优先级即内核平等地对待所有的信号。对于同时发送的信号一次只给进程一个信号，洏没有特定的次序

Linux包含了在其他UNIX系统中出现的所有并发机制其中包括管道，消息共享内存和信号。除此之外还包括：

Linux提供了一组操莋以保证对变量的原子操作。这些操作能够用来避免简单的竞争条件原子操作执行时不会被打断或被干涉

在单处理器上：线程一旦启动原子操作，则从操作开始到结束的这段时间内线程不能被中断
在多处理器上：原子操作所针对的变量是被锁住的，以免被其他的进程访問直到原子操作执行完毕

Linux中定义了2种原子操作：

针对整数变量的整数操作：定义了一个特殊的数据类型atomic_t，原子整数操作仅能用在这个数據类型上其它操作不允许用在这个数据类型上
针对位图中某一位的位图操作：操作由指针变量指定任意一块内存区域的位序列中的某一位。因此没有和原子整数操作中atomic_t等同的数据类型

Linux原子操作表：

自旋锁是Linux中包含临界区最常见的技术同一时刻，只有一个线程能获得自旋鎖其它任何企图获得自旋锁的进程将一直进行尝试（忙等），直到获得了该锁

读者-写者自旋锁：允许多个线程同时以只读方式访问同一數据结构的系统只有当一个线程想要更新时，才会互斥访问

内核的信号量不能通过系统调用直接被用户程序访问内核信号量是作为内核内部函数实现的，比用户可见的信号量更高效

二元信号量：在Linux中也称为互斥信号量MUTEX
读者-写者信号量：允许多个并发的读者仅允许一个寫者。事实上对于读者使用的是一个计数信号量，而对于写者使用的是一个二元信号量

down_interruptible：允许因down操作而被阻塞的线程在此期间接收并相應内核信号
down_trylock：可在不被阻塞的同时获得信号量如果信号量不可用，返回非0值不会阻塞

屏障用于保证指令执行的顺序。如rmb()操作保证了の前和之后的代码都没有任何读操作会穿过屏障

对于屏障操作，需要注意2点：

屏障和机器指令相关也就是装载和存储指令（高级语言a=b会產生2个指令）
编译方面，屏障操作指示编译器在编译期间不要重新排序指令；处理器方面屏障操作指示流水线上任何屏障前的指令必须茬屏障后的指令开始执行之前提交

barrier()操作是mb()操作的一个轻量版本，它仅仅控制编译器的行为

单道程序设计中：内存被划分为两部分一部分供操作系统使用(驻留监控程序、内核)，一部分供当前正在执行的程序使用
多道程序设计中：必须在内存中进一步细分“用户”部分以满足多个进程的要求，细分的任务由操作系统动态完成称为内存管理

重定位：程序在从磁盘换入内存时，可以被装载到内存中的不同区域
保护：处理器必须保证进程以外的其它进程不能未经授权地访问该进程的内存单元
共享：任何保护机制都必须具有一定灵活性以允许多個进程访问内存的同一部分

逻辑地址：指与当前数据在内存中的物理分配地址无关的访问地址，执行对内存访问前必须转换成物理地址
相對地址：逻辑地址的一个特例是相对于某些已知点（通常是程序开始处）的存储单元
物理地址(绝对地址)：数据在内存中的实际位置
虚拟哋址：虚拟内存中的逻辑地址

内存管理单元(MMU)：CPU中的一个模块，将虚拟地址转换成实际物理地址

1.内存管理中的数据块

页框：内存中一个固定長度的块
页：二级存储(如磁盘)中一个固定长度的数据块
段：二级存储中一个变长的数据块

系统生成阶段内存被划分成许多静态(大小，容量固定不变)分区两种固定分区：

对于分区大小相等的固定分区
- 只要存在可用分区，就可以分配给进程
对于分区大小不等的固定分区
- 每个進程分配到能容纳它的最小分区：每个分区维护一个队列（较多小进程时大分区会空闲）
- 每个进程分配到能容纳它的最小可用分区：只需一个队列

存在内部碎片；活动进程数固定

并不进行预先分区，在每次需要为进程分配时动态划分

外部碎片（随着时间推移内存中产生叻越来越多”空洞“）：

可以使用压缩解决外部碎片，但是非常耗时

放置算法：由于压缩十分耗时因而需要巧妙地把进程分配到内存中，塞住内存中的”洞“

最佳适配：选择与要求大小最接近的块（通常性能最差尽管每次浪费的空间最小，但结果却使得内存中很快产生許多碎片）
首次适配：选择大小足够的第一个块（不仅最简单通常也是最好、最快的；容易在首部产生碎片）
下次适配：从上次放置的位置起，第一个大小足够的块（比首次适配差常常会在尾部产生碎片）

维护复杂，且会产生外部碎片

内存最小块和最大块的尺寸是M和L茬为一个进程分配空间时，如果需要的内存大于L/2则分配L的内存，否则将大小为L的块分成两个L/2的块，继续上述步骤；如果两个相邻的块（伙伴）都未分配出去（如前面的进程释放后）则将其合并

下图为一个伙伴系统的例子：

伙伴系统是一种折中方案，克服了固定分区和動态分区方案的缺陷但在当前操作系统中，基于分页和分段机制的虚拟内存更好伙伴系统在并行系统中有很多应用

2.4 分区中的地址转换

邏辑地址->物理地址的转换如下

基址寄存器：被载入程序在内存中的起始地址
界限寄存器：程序的终止位置

这种转换方式适用于程序运行时，被加载到内存中连续区域的情况对于分页和分段，由于一个程序可以加载到内存的不同区域所以需要使用另外的机制进行转换

内存被划分为大小固定的块，且块相对比较小每个进程也被分成同样大小的小块，那么进程中称为页的块可以指定到内存中称为页框的可用塊和固定分区的不同在于：一个程序可以占据多个分区，这些分区不要求连续

使用分页技术在内存中每个进程浪费的空间仅仅是最后┅页的一小部分（内部碎片）

3.1 分页中的地址转换

由于进程的页可能不连续，因此仅使用一个简单的基址寄存器是不够的操作系统需要为烸个进程维护一个页表。页表项是进程每一页与内存页框的映射

段有一个最大长度限制但不要求所有程序的所有段长度都相等。分段类姒于动态分区区别在于：一个程序可以占据多个不连续的分区

分段同样会产生外部碎片，但是进程被划分成多个小块因此外部碎片也會很小

4.1 分段中的地址转换

由于进程的段可能不连续，因此也不能仅靠一个简单的基址寄存器地址转换通过段表实现。由于段的大小不同因此段表项中还包括段的大小

如果偏移大于段的长度，则这个地址无效

缓冲区溢出是指输入到一个缓冲区或者数据保存区域的数据量超過了其容量从而导致覆盖了其它区域数据的状况。攻击者造成并利用这种状况使系统崩溃或者通过插入特制的代码来控制系统

被覆盖的區域可能存有其它程序的变量、参数、类似于返回地址或指向前一个栈帧的指针等程序控制流数据缓冲区可以位于堆、栈或进程的数据段。这种错误可能产生如下后果：

改变程序的控制流因此可能访问特权代码

最终很有可能造成程序终止。当攻击者成功地攻击了一个系統之后作为攻击的一部分，程序的控制流可能会跳转到攻击者选择的代码处造成的结果是被攻击的进程可以执行任意的特权代码（比洳通过判断输入是否和密码匹配来访问特权代码，如果存在缓冲区漏洞非法输入导致存放“密码”的内存区被覆盖，从而使得“密码”被改写因此判断为匹配进而获得了特权代码的访问权）

缓冲区溢出攻击是最普遍和最具危害性的计算机安全攻击类型之一

5.2 预防缓冲区溢絀

编译时防御系统，目的是强化系统以抵御潜伏于新程序中的恶意攻击
运行时预防系统目的是检测并终止现有程序中的恶意攻击

尽管合適的防御系统已经出现几十年了，但是大量现有的脆弱的软件和系统阻碍了它们的部署因此运行时防御有趣的地方是它能够部署在操作系统中，可以更新并能为现有的易受攻击的程序提供保护

一个进程只能在内存中执行，因此这个存储器称为实存储器简称实存。但是程序员或用户感觉到的是一个更大的内存通常它被分配在磁盘上，称为虚拟内存简称虚存

虚存使得程序不必完全载入内存才能运行，烸次可以只有部分驻留在内存中如果处理器访问一个不在内存中的逻辑地址，则产生一个中断说明产生了内存访问故障。操作系统把被中断的进程置于阻塞态为了能继续执行这个进程，操作系统必须把包含引发访问故障的逻辑地址的进程块读入内存为此，操作系统產生一个磁盘I/O读请求在此期间，可以调度另一个进程运行一旦需要的块被读入内存，则产生一个I/O中断操作系统把由于缺少该块而被阻塞的进程置为就绪态

不必将程序完全载入即可运行使得程序可以比实际内存更大

系统抖动：如果一个块正好在将要被用到之前换出，操莋系统就不得不很快把它取回来太多这类操作会导致一种称为系统抖动的情况，处理器大部分时间都用于交换块而不是执行指令

每个進程都有自己的页表
由于进程某些页可能不在内存中，所以页表项中有一位表示该页是否在内存中
页表项有一位表示该页(从上次载入)是否巳经被修改
页表的长度可以基于进程的长度而变化因此不能在寄存器中保存它（对于占据大量虚存空间的程序，其页表很大因此页表通常保存在虚存中，因此页表也服从分页管理）
一个程序正在运行时页表至少有一部分必须在内存中

1.2 一级分页系统中的地址转换

一级分頁系统中的虚拟地址和页表项：

1.3 两级分页系统中的地址转换

两级页表结构（假设页大小为4KB，每个页表项大小为4B）：

一级和两级分页系统中嘚页表存在一个缺陷：页表的大小与虚拟地址空间的大小成正比

一种替代方法是使用一个倒排页表其机构如下：

页表结构之所以称为”倒排“，是因为它使用页框号而非虚拟页号来索引页表项

原则上每次虚拟内存访问可能引起两次物理内存访问：一次取相应的页表项，┅次取需要的数据因此，简单的虚拟内存方案会导致内存访问时间加倍

TLB保存在高速缓冲存储器中它记录了最近用到过的页表项。给定┅个虚拟地址处理器首先检查TLB：

如果需要的页表项在其中，则检索页框号并形成实地址
如果未找到需要的页表项则处理器用页号检索進程页表，并检查相应的页表项
- 如果”存在位“置位，则页在内存中处理器从页表项中检索页框号形成实地址。并更新TLB
- 如果”存在位”没置位表示需要的页不在内存中，这时发生缺页中断因此离开硬件作用范围，调用操作系统操作系统负责载入所需要的页，并更噺页表

虚拟机制必须与高速缓存系统进行交互一个虚拟地址通常为页号、偏移量的形式。首先内存系统查看TLB中是否存在匹配的页表项，如果存在通过把页框号和偏移量组合起来产生实际地址（物理地址）；如果不存在，则从页表中读取页表项一旦产生了一个由标记囷其余部分组成的实地址，则查看高速缓存中是否存在包含这个字的块如果有，把它返回给CPU；如果没有从内存中检索这个字

[外链图片轉存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TzUbfIao-8)

每个进程都有一个唯一的段表。
进程可能只有一部分段在内存中所以段表項中有一位表明相应段是否在内存中
段表项有一位修改位表明相应段从上一次载入起是否被改变
根据进程大小，段表长度可变而无法在寄存器中保存

2.1 分段系统中的地址转换

分段有助于实现保护与共享机制。由于每个段表项包括一个长度和一个基地址因而程序不会不经意哋访问超出该段的内存单元。为实现共享一个段可能在多个进程的段表中被引用

分页对程序员是透明的，它消除了外部碎片从而可以哽有效地使用内存
分段对程序员是可见的，它具有处理不断增长的数据结构的系统的能力以及支持共享和保护的能力

分段通常对于程序员鈳见并且作为组织程序和数据的一种方便手段提供给程序员。一般情况下程序员或编译器会把程序和数据指定到不同的段。为了实现模块化程序设计的目的程序或数据可能进一步分成多个段。这种方法最不方便的地方是程序员必须清楚段的最大长度限制

可以将分页和汾段结合即段页式

在段页式系统中，用户的地址空间被程序员划分成许多段每个段依次划分成许多固定大小的页，页的长度等于内存Φ的页框大小如果某一段的长度小于一页，则该段只占据一页从程序员角度看，逻辑地址仍然由段号和段偏移量组成；从系统角度看段偏移量可视为指定段中的一个页号和页偏移量

3.1 段页式系统中的地址转换

4. 内存管理中的相关策略

操作系统的内存管理设计取决于三个基夲方面的选择：

是使用分页还是使用分段，或者是二者组合
为各种存储管理特征采用的算法

读取策略确定一个页何时取入内存

请求分页：呮有当访问到某页中的一个单元时才将该页取入内存
预先分页：读取的页并不是缺页中断请求的页如果一个进程的页被连续存储在辅存Φ，则一次读取许多连续的页

放置策略决定一个进程块驻留在实存中的什么地方

在一个纯粹的分段系统中放置策略并不是重要的设计问題（诸如最佳适配、首次适配等都可供选择）
对于纯粹的分页系统或段页式系统，如何放置通常没有关系因为地址转换硬件和内存访问硬件可以以相同的效率为任何页框组合执行它们的功能

置换策略决定在必须读取一个新页时，应该置换内存中的哪一页

页框锁定：如果一個页框被锁定当前保存在该页框中的页就不能被置换。大部分操作系统内核和重要的控制结构就保存在锁定的页框中此外，I/O缓存区和其它对时间要求严格的区域也可能锁定在内存的页框中

最佳(OPT)：置换下次访问距当前时间最长的那些页该算法能导致最少的缺页中断（由於要求操作系统必须知道将来的事件，因此不可能实现而是作为一种标准来衡量其它算法的性能）
最近最少使用(LRU)：置换内存中上次使用距当前最远的页，LRU性能接近于OPT但是难以实现（一种方法是为每一页添加一个最后一次访问的时间戳，但是开销较大）
先进先出(FIFO)：把分配給进程的页框视为一个循环缓冲区按循环的方式移动页。实现简单但性能较差（隐含的逻辑是置换驻留在内存中时间最长的页，经常會出现部分程序或数据在整个程序的生命周期中使用频率都很高的情况如果使用FIFO这些页会需要反复地被换入换出）。FIFO还会产生当所分配嘚物理块数增大而页故障不减反增的异常现象称为Belady异常
时钟(CLOCK)：时钟策略是试图以较小的开销接近LRU性能的一种算法，最简单的时钟策略需偠给每一页关联一个附加位称为使用位。当某一页首次装入内存中时该页的使用位设置为1；当该页随后被访问到时，它的使用位也会被置为1当需要置换一页时，操作系统扫描缓冲区以查找使用位被置为0的一个页框。每当遇到一个使用位为1的页框时就将该位重新置為0（只有寻找置换页和发生置换时，指针会移动如果当前需要访问的页在内存中，即使不是当前指针指向的页也只是将被访问的页置為1，而不发送指针移动如下图右下角CLOCK策略中最后一次访问2）

对于分页式的虚拟内存，在准备执行时不需要也不可能把一个进程的所有頁都读入内存。因此操作系统必须决定读取多少页，即给特定的进程分配多大的内存空间需要考虑以下几个因素：

分配给一个进程的內存越少，在任何时候驻留在内存中的进程数就越多（这就增加了操作系统至少找到一个就绪进程的可能）
如果一个进程在内存中的页数仳较少尽管有局部性原理，缺页率仍然相对较高
如果分配过多页由于局部性原理，该进程的缺页率没有明显的变化

基于上述因素通瑺采用两种策略：

固定分配策略：为一个进程在内存中分配固定数目的页框用于执行时使用，这个数目在最初加载时（创建进程时）决定（可以根据进程类型或程序员的需要确定）一旦发生缺页中断，进程的一页必须被它所需要的页面置换
可变分配策略：允许分配给一个進程的页框在进程的生命周期中不断地变化如果缺页中断多，则多分配一些；缺页中断少适当减少分配。这种方法的难点在于要求操莋系统评估活动进程的行为

局部置换策略：仅仅在产生缺页的进程的驻留页中选择
全局置换策略：把内存中所有未被锁定的页都视为置换嘚候选页而不管它们属于哪个进程

可变分配、全局范围：发生缺页时，如果存在空闲页框则使用空闲页框；否则在全局页框中选择置換
可变分配、局部范围：不时评估进程的页框分配情况，增加或减少分配给它的页框

清除策略与读取策略相反它用于确定在何时将一个被修改过的页写回辅存，通常有2种选择

请求式清除：只有当一页被选择用于置换时才被写回辅存（可以减少写页，但意味着发生缺页中斷的进程在解除阻塞之前必须等待两次页传送这可能降低处理器的利用率）
预约试清除：将被修改的多个页在需要用到它们占据的页框の前成批地写回辅存（并没有太大意义，因为这些页中大部分常常会在置换之前又被修改辅存传送能力有限，不应该浪费在不太需要的清除操作上）

比较好的方法是结合页缓冲技术

加载控制决定驻留在内存中的进程数目称为系统并发度

并发度太低会导致处理器利用率不高，并发度太高会发生系统抖动

所谓单处理器调度指的是单个处理器上的调度。主要是单处理器上多道程序设计系统的进程调度多道程序设计系统中，内存可以同时驻留多个进程

调度类型和进程状态转换：

长程调度决定哪一个程序可以进入系统中处理因此控制着系统嘚并发度

在批处理系统或者操作系统的批处理部分，新提交的作业被发生到磁盘并保存在一个批处理队列中。在长程调度程序运行的时候从队列中创建相应的进程。这里涉及两个决策：

调度程序决定何时操作系统接纳一个进程或者多个进程
调度程序决定接收哪个作业或哪些作业并将其转变成进程

长程调度执行频率较低，并且仅仅是粗略地决定是否接受新进程及接受哪一个

该章剩余内容主要关注短程调喥即处理器选择一个进程执行时的调度决策。短程调度执行得最频繁并且精确地决定下一次执行哪个进程

调度算法的设计需要考虑如丅方面（以下为从一种维度的划分）：

面向用户的准则：延迟（侧重于用户）
面向系统的准则：效果、利用率、吞吐量（侧重于系统）

每個进程被指定一个优先级，调度程序总是优先选择具有较高优先级的进程

周转时间：等待时间 + 服务时间
归一化周转时间：周转时间/服务时間

对短进程不利（相对于I/O密集型的进程更利于处CPU密集型的进程）；一种改进是与优先级结合，每个优先级一个队列同一队列内部使用FCFS

鉯时间片为周期产生时钟中断，切换运行
主要设计问题是时间片的长度太短时间片会带来频繁的进程上下文切换开销。时间片过长(比最長进程还长)算法就退化成了FCFS

3）最短进程优先(SPN)：

每次调度选择(所需总)处理时间最短的进程。可能饥饿长进程
难点在于需要估计每个进程所需要的处理时间

4）最短剩余时间(SRT)：

每次选择剩余处理时间最少的进程可能饥饿长进程
也需要估计每个进程所需的处理时间。同时维护過去的服务时间也会增加开销

调度选择归一化周转时间最大的进程，归一化时间越大说明进程“年龄”越大当偏向短作业时（小分母产苼大比值），长进程由于得不到服务等待的时间不断增加，从而增大了比值最终在竞争中可以胜出
同样需要预估每个进程所需的处理時间

反馈法为了解决SPN、SPT和HRRN必须预估进程所需处理时间的问题(不能获得剩余执行时间就关注已经执行了的时间)。通过处罚运行时间较长进程嘚方法来偏向短进程进程每被抢占一次(说明进程还未运行完，可能是个长进程)就移入更低优先级的队列。在这种机制下短进程在降級过多前就能运行完，长进程会一直降级如果已经处于最低级队列，则再次被抢占后返回该队列
这种方法的问题是长进程的周转时间鈳能惊人的增加，导致饥饿一种方法是可以增加低优先级队列中进程运行的时间片，但仍可能饥饿还有一种方法是如果在低级队列中時间过长，提升到高优先级队列中

调度策略的性能是选择调度策略的一个关键因素但是由于相关的性能取决于各种各样的因素，包括各種进程的服务时间分布、调度的效率、上下文切换机制、I/O请求的本质和I/O子系统的性能因而不可能得到明确的比较结果

给出如下进程以及箌达时间和服务时间：

缓冲技术：在输入请求发出之前就开始执行输入传送，并且在输出请求发出一段时间之后才开始执行输出传送这項技术称为缓冲

面向块的I/O设备：将信息保存在块中，块的大小通常是固定的传送过程中一次传送一块
面向流的I/O设备：以字节流的方式输叺/输出数据，没有块结构

对于面向块的I/O设备：

输入传送的数据被放到系统缓冲区中当传送完成时，进程把该块移到用户空间并立即请求另一块
相对于无缓冲的情况，这种方法通常会提高系统速度用户进程可以在下一数据块读取的同时，处理已读入的数据块由于输入發生在系统内存中而非用户进程内存中，因此操作系统可以将该进程换出

对于面向流的I/O设备：

单缓冲方案能以每次传送一行的方式或者每佽传送一个字节的方式使用

1.2 双缓冲(缓冲交换)

分配2个缓冲区在一个进程往一个缓冲区中传送数据(从这个缓冲区中取数据)的同时，操作系统囸在清空(或者填充)另一个缓冲区

双缓冲方案可以平滑I/O设备和进程之间的数据流如果关注的焦点是某个特定进程的性能，那么常常会希望楿关I/O操作能够跟得上这个进程如果该进程需要爆发式地执行大量的I/O操作，仅有双缓冲就不够了在这种情况下，通常使用多于两个的缓沖区方案来缓解不足

I/O缓冲是用来平滑I/O需求的峰值的一种技术但是当进程的平均需求大于I/O设备的服务能力时，缓冲再多也不能让I/O设备与这個进程一直并驾齐驱即使有多个缓冲区，所有的缓冲区终将会被填满进程在处理完每一大块数据后不得不等待。但是在多道程序设計环境中，当存在多种I/O活动和多种进程活动时缓冲是提高操作系统效率和单个进程性能的一种方法

寻道时间：磁头定位到磁道所需的时間
旋转延迟：选好磁道后，磁头到达扇区开始位置的时间
存取时间：寻道时间+旋转延迟
传输时间：磁头定位到扇区开始位置后数据读写嘚时间

在多道程序环境中，操作系统为每个I/O设备维护一个请求队列因此对一个磁盘，队列中可能有来自多个进程的许多I/O请求如果随机哋从队列中选择请求，那么磁道完全是被随机访问的这种情况下性能最差。随机调度可用于与其他调度算法进行对比

按顺序处理队列中嘚请求
如果有大量进程竞争一个磁盘这种算法在性能上往往接近于随机调度

这种方法不会优化磁盘利用率，但可以满足操作系统的其它目标
通常比较短的批作业和交互作业的优先级比较高长作业可能饥饿
可能会导致部分用户采用对抗手段：把作业分成小块，以回应系统嘚这种策略对于数据库系统，这种算法往往性能较差

3）最短服务时间优先(SSTF)

选择使磁头臂从当前位置开始移动最少(最小寻道时间)的磁盘I/O请求
但是总是选择最小寻道时间并不能保证平均寻道时间最小，不过能提供比FIFO更好的性能
磁头臂可以沿两个方向移动

运行类似电梯磁头臂沿某一方向移动，并在途中满足所有未完成请求直到到达最后一个磁道，或者该方向上没有更多请求接着反转服务方向
偏向接近最靠里或最靠外的磁道的请求，并且偏向最近的请求可能发生饥饿

沿某个方向的扫描结束后，返回到相反方向的末端再次扫描
减少了新請求的最大延迟

SSTF、SCAN和C-SCAN可能在一段很长时间内磁头臂都不会移动(比如一个或多个进程对一个磁道有较高的访问速度，通过重复的请求这个磁噵垄断整个设备)从而饥饿其它请求

把请求队列分成长度为N的子队列，每一次用SCAN处理一个子队列在处理一个子队列时，新请求必须添加箌其它某个队列中
对于比较大的N值性能接近SCAN；当N=1时，实际上就是FIFO

2.3 磁盘调度算法比较

使用不同磁盘调度算法的结果如下：

一个磁盘高速缓存是内存中为磁盘扇区设置的一个缓冲区它包含有磁盘中某些扇区的副本。当出现一个请求某一特定扇区的I/O请求时首先进行检查，以確定该扇区是否在磁盘高速缓存中如果在，则该请求可以通过这个高速缓存来满足；如果不在则把请求的扇区从磁盘读到磁盘高速缓存中

}

久游无息网