指令系统

字、字长

字：计算机中的基本访问单位

MIPS体系结构中，字长与寄存器大小相同，为32bit

字长：决定虚拟地址空间的最大大小，比如32位机器支持最大虚拟地址空间为2³²

Intel X86体系中，字表示16bit数据类型，32位称为双字，64位称为四字

一条指令的构成：操作码+地址码

一台计算机的所有指令的集合构成该机的指令系统，也称为指令集(x86、arm)

根据地址码数目的不同，可以将指令分为零地址指令、一地址指令、二地址指令等

指令字长：一条指令的长度(可变)，将直接影响取指令所需时间

半字长指令、单字长指令、双字长指令表示指令是机器字长的多少倍

定长指令字结构：指令系统中所有指令的长度都相等

变长指令字结构：指令系统中各种指令长度不等

定长操作码：指令系统中所有指令的操作码长度相同

可变长操作码：指令系统中各指令的操作码长度可变

扩展操作码指令格式：定长指令字结构+可变长操作码

注意：

不允许短码是长码的前缀，即短操作码不能与长操作码的前面部分的代码相同

各指令的操作码一定不能重复

对于使用频率高的指令，分配较短的操作码(减少译码时间)

设地址长度为n，上一层留出m种状态，下一层可扩展出m*2ⁿ种状态

下一条欲执行的指令的地址，将始终由程序计数器PC给出，并且每次取完指令后，PC一定会自动+“1”，再执行指令

例如：对于一个变长指令字结构，主存按字节编址，指令字长=存储字长

(PC)+“1”→PC

这个“1”应该理解为一个指令字长，需要根据指令长度、编址方式来判断

由转移指令指出跳转至的指令地址，类似于C语言的GOTO语句

确定本条指令的地址码指明的真实地址

在一条指令中，再包含寻址方式位(4位二进制)，一般加在地址位前。

直接寻址：指令字的形式地址A就是操作数的真实地址EA
- 一条指令执行取指令访存1次，执行指令访存1次
- 执行阶段仅访问一次主存，不需专门计算操作数的地址
- 操作数的地址不易修改
间接寻址：指令的形式地址装入的是主存中装有真实地址单元的地址，即EA=(A).
- 一次间址需要3次访存
- 过程可以套娃n次，称为n次间址，那么访存次数就是n+2次，将导致指令执行效率变低
- 可以扩大寻址范围(EA位数大于A的位数)，便于编程(方便子程序通过间址返回)

寄存器寻址：指令字中直接给出操作数所在的寄存器编号，即EA=R₁。
- 访存1次,只有取指令访存
- 执行阶段不访存，访寄存器
- 指令字短(寄存器数目少)且执行速度快，支持向量/矩阵运算
寄存器间接寻址：类似于间接寻址，只是寄存器中存放的是操作数所在主存单元的地址，即EA=（R_i）
隐含寻址：在指令中隐含着操作数的地址(例如隐含在ACC中)。
- 有利于缩短指令字长
- 需要增加存储操作数，或隐含地址的硬件
立即寻址：形式地址A就是操作数本身，又称为立即数(在前用#标识)，一般采用补码形式
- 访存一次，来源于取指，指令执行时间最短
- A的位数限制了立即数的范围

基址寻址：以程序的起始存放地址作为“起点” EA=(BR)+A
- BR:基址寄存器，在有的计算机内部使用通用寄存器实现，在指令中声明使用哪个寄存器作为BR，位数根据寄存器数量n判断(log₂(n))
- 便于程序“浮动”，方便实现多道程序并发运行
- 面向操作系统，由操作系统或管理程序确定
- 可扩大寻址范围(基址寄存器的位数大于形式地址A的位数)

变址寻址：程序员自己决定从哪里作为“起点” EA=(IX)+A
- 变址寄存器IX(Index Register)
- 与基址类似，区别在于IX的内容面向用户，可由用户改变
- 在处理数组时，可以将A设定为首地址，通过并不断改变IX的内容（偏移量）来得到任意数组元素的地址，适合编制循环程序
基址与变址复合寻址：
- 先基址后变址：EA = (IX)+((BR)+A)
相对寻址：以程序计数器PC所指地址作为“起点” EA=(PC)+A
- A是相对于PC所指地址(下一条指令地址)的偏移量，可正可负，补码表示
- 操作码地址不固定，随PC值变化
- 便于程序浮动(代码块在程序内部的浮动)，广泛应用于转移指令