计算:
Y=a×X+Y
其浮点指令延迟如表4.3所示,整数指令均为1个时钟周期完成,浮点和整数部件均采
用流水。整数操作之间以及与其它所有浮点操作之间的延迟为0,转移指令的延迟为0。x
中的最后一个元素存放在存储器中的地址为DONE。
(1)对于标准的 MIPS单流水线,上述循环计算一个Y值需要多少时间?其中有多少空转周期?
(2)对于标准的 MIPS单流水线,将上述循环顺序展开4次,不进行任何指令调度,计算一个Y值平均需要多少时间?加速比是多少?其加速是如何获得的?
(3)对于标准的MIPS单流水线,将上述循环顺序展开4次,优化和调度指令,使循环处理时间达到最优,计算-一个Y值平均需要多少时间?加速比是多少?
(4)对于采用如图 4.8前瞻执行机制的MIPS处理器(只有一个整数部件)。当循环第二次,执行到BNEZ R3,FOO
时,写出前面所有指令的状态,包括指令使用的保留站、指令起始节拍,执行节拍和写结果节拍,并写出处理器当前的状态。
(5)对于2路超标量的MIPS流水线,设有两个指令流出部件,可以流出任意组合的指令,系统中的功能部件数量不受限制。将上述循环展开4次,优化和调度指令,使循环处理时间达到最优。计算-一个Y值平均需要多少时间?加速比是多少?
(6)对于 如图4.13结构的超长指令字MIPS处理器,将上述循环展开4次,优化和调度指令,使循环处理时间达到最优。计算一个Y值平均需要多少时间?加速比是多少?