念尽天涯 制作
---------------------------------------------------------------------------------------------------------------------- 题目类型、分值解析:
单选:5题, 每题 2分, 共 10分 填空:10题,每题 2分, 共 20分 名解:4题, 每题 5分, 共 20分 问答:2题, 每题 15分 共 30分 计算:1题, 每题 20分 共 20分
----------------------------------------------------------------------------------------------------------------------
单选及填空:
计算机系统设计的主要方法
1、 由上往下的设计(top-down) 2、 由下往上的设计(bottom-up) 3、 从中间开始(middle-out)
Flynn分类法把计算机系统的结构分为以下四类: (1)单指令流单数据流 (2)单指令流多数据流 (3)多指令流单数据流 (4) 多指令流多数据流
堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。 累加器型机器:CPU 中存储操作数的单元是累加器的机器。
通用寄存器型机器:CPU 中存储操作数的单元是通用寄存器的机器。
名词解释:
虚拟机:用软件实现的机器叫做虚拟机,但虚拟机不一定完全由软件实现,有些操作可以由硬件或固件(固件是指具有软件功能的固件)实现。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
兼容机:它是指由不同公司厂家生产的具有相同系统结构的计算机。
流水线技术:将一个重复的时序过程,分解成为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。
单功能流水线:指流水线的各段之间的连接固定不变、只能完成一种固定功能的流水线。
多功能流水线:指各段可以进行不同的连接,以实现不同的功能的流水线。 顺序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。
乱序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同,允许后进入流水线的任务先完成。这种流水线又称为无序流水线、错序流水线、异步流水线。
吞吐率:在单位时间内流水线所完成的任务数量或输出结果的数量。
指令的动态调度:
是指在保持数据流和异常行为的情况下,通过硬件对指令执行顺序进行重新安排,以提高流水线的利用率且减少停顿现象。是由硬件在程序实际运行时实施的。
指令的静态调度:
是指依靠编译器对代码进行静态调度,以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。
超标量:
一种多指令流出技术。它在每个时钟周期流出的指令条数不固定,依代码的具体情况而定,但有个上限。
超流水:在一个时钟周期内分时流出多条指令。
多级存储层次:
采用不同的技术实现的存储器,处在离CPU不同距离的层次上,各存储器之间一般满足包容关系,即任何一层存储器中的内容都是其下一层(离CPU更远的一层)存储器中内容的子集。目标是达到离CPU最近的存储器的速度,最远的存储器的容量。 写直达法:
在执行写操作时,不仅把信息写入Cache中相应的块,而且也写入下一级存储器中相应的块。 写回法:
只把信息写入Cache中相应块,该块只有被替换时,才被写回主存。
集中式共享多处理机:
也称为对称式共享存储器多处理SMP。它一般由几十个处理器构成,各处理器共享一个集中式的物理存储器,这个主存相对于各处理器的关系是对称的,
分布式共享多处理机:
它的共享存储器分布在各台处理机中,每台处理机都带有自己的本地存储器,组成一个“处理机-存储器”单元。但是这些分布在各台处理机中的实际存储器又合在一起统一编址, 在逻辑上组成一个共享存储器。这些处理机存储器单元通过互连网络连接在一起 ,每台处理机除了能访问本地存储器外,还能通过互连网络直接访问在其他处理机存储器单元中的 “远程存储器”。
多Cache一致性:
多处理机中,当共享数据进入Cache,就可能出现多个处理器的Cache中都有同一存储器块
的副本,要保证多个副本数据是一致的。
写作废协议:
在处理器对某个数据项进行写入之前,它拥有对该数据项的唯一的访问权 。
写更新协议:
当一个处理器对某数据项进行写入时,它把该新数据广播给所有其它Cache。这些Cache用该新数据对其中的副本进行更新。
机群:是一种价格低廉、易于构建、可扩放性极强的并行计算机系统。它由多台同构或异构的独立计算机通过高性能网络或局域网互连在一起,协同完成特定的并行计算任务。从用户的角度来看,机群就是一个单一、集中的计算资源。
问答:
2.2 区别不同指令集结构的主要因素是什么?根据这个主要因素可将指令集结构分为哪3类?
答:区别不同指令集结构的主要因素是CPU中用来存储操作数的存储单元。据此可将指令系统结构分为堆栈结构、累加器结构和通用寄存器结构。
2.3 常见的3种通用寄存器型指令集结构的优缺点有哪些? 答: 指令系统结构类型 寄存器-寄存器型(0,3) 寄存器-存储器型(1,2) 优 点 指令字长固定,指令结构简洁,是一种简单的代码生成模型,各种指令的执行时钟周期数相近。 可以在ALU指令中直接对存储器操作数进行引用,而不必先用load指令进行加载。容易对指令进行编码,目标代码比较紧凑。 缺 点 与指令中含存储器操作数的指令系统结构相比,指令条数多,目标代码不够紧凑,因而程序占用的空间比较大。 由于有一个操作数的内容将被破坏,所以指令中的两个操作数不对称。在一条指令中同时对寄存器操作数和存储器操作数进行编码,有可能限制指令所能够表示的寄存器个数。指令的执行时钟周期数因操作数的来源(寄存器或存储器)不同而差别比较大。 指令字长变化很大,特别是3操作数指令。而且每条指令完成的工作也差别很大。对存储器的频繁访问会使存储 存储器-存储器型(2,2)或(3,3) 目标代码最紧凑,不需要设置寄存器来保存变量。 器成为瓶颈。这种类型的指令系统现在已不用了。
2.6 简述CISC指令集结构功能设计的主要目标。从当前的计算机技术观点来看,CISC指令集结构的计算机有什么缺点? 答:主要目标:
增强指令功能,把越来越多的功能交由硬件来实现,并且指令的数量也是越来越多。 缺点: (1) CISC结构的指令集中,各种指令的使用频率相差悬殊。
(2)CISC结构指令的复杂性带来了计算机体系结构的复杂性,这不仅增加了研
制时间和成本,而且还容易造成设计错误。 (3)CISC结构指令集的复杂性给VLSI设计增加了很大负担,不利于单片集成。(4)CISC结构的指令集中,许多复杂指令需要很复杂的操作,因而运行速度慢。 (5) 在CISC结构的指令集中,由于各条指令的功能不均衡性,不利于采用先 进的计算机体系结构技术(如流水技术)来提高系统的性能。
2.7 简述RISC指令集结构的设计原则。 (1)指令条数少,指令功能简单。
(2)采用简单而又统一的指令格式,并减少寻址方式 (3)指令的执行在单周期内完成。 (4)采用load-store结构。
(5)大多数指令都采用硬连逻辑来实现。
(6)强调优化编译器的作用,为高级语言程序生成优化的代码。 (7)充分利用流水技术来提高性能。
3.5 简述流水线技术的特点。 答:流水技术有以下特点: (1) 流水线把一个处理过程分解为若干个子过程,每个子过程由一个专门的功能部件来实现。因此,流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件,并依靠它们的并行工作来提高吞吐率。
(2) 流水线中各段的时间应尽可能相等,否则将引起流水线堵塞和断流。 (3) 流水线每一个功能部件的前面都要有一个缓冲寄存器,称为流水寄存器。
(4) 流水技术适合于大量重复的时序过程,只有在输入端不断地提供任务,才能充分发挥流水线的效率。
(5) 流水线需要有通过时间和排空时间。在这两个时间段中,流水线都不是满负荷工作。 4.3用什么方法可以提高向量处理机的性能。 (1)设置多个功能部件,使它们并行工作。 (2)采用连接技术,加快一串向量指令的执行。 (3)采用循环开采技术,加快循环的处理。 (4)采用多处理机系统,进一步提高性能。
4.A指令动态调度的优点(P113页) (1) 能够处理一些编译时情况不明的相关(如涉及存储器访问的相关),并简化了编译器; (2) 能够使本来是面向某一流水线优化编译的代码在其他动态调度的流水线上也能高效
运行。
4.2 简述Tomasulo算法的基本思想。
答:核心思想是:① 记录和检测指令相关,操作数一旦就绪就立即执行,把发生RAW冲突的可能性减小到最少;② 通过寄存器换名来消除WAR冲突和WAW冲突。寄存器换名是通过保留站来实现,它保存等待流出和正在流出指令所需要的操作数。
基本思想:只要操作数有效,就将其取到保留站,避免指令流出时才到寄存器中取数据,这就使得即将执行的指令从相应的保留站中取得操作数,而不是从寄存器中。指令的执行结果也是直接送到等待数据的其它保留站中去。因而,对于连续的寄存器写,只有最后一个才真正更新寄存器中的内容。一条指令流出时,存放操作数的寄存器名被换成为对应于该寄存器保留站的名称(编号)。
4.B单级存储器的缺点,采用什么方法可以解决? 答:
单机存储器不能解决计算机运行速度、价格和容量的问题,直接影响了整个计算机系统的性能。
解决方发:
采用多种存储器技术,构成多级存储层次结构。
4.D Cache的映像方法有哪几种,各有什么优缺点? (1)全相联映像:
主存中的任何一块可以被放置到cache中的任意一个位置。但其不命中率最低。 (2)直接映像:
主存中的每一个块只能被放置到cache中的唯一位置,不命中率最高,但其实现复杂度和成本增加。 (3)主相联映像:
主存中的每一块可以被放置到Cache中唯一的一个组中的任何一个位置。综合了前两者的优点,但其实现更为复杂度、成本更高。
4.E采用两级cache的优缺点、基本思想(为什么) 基本思想(为什么):
为了解决CPU与存储器之间性能差距越来越大的问题,当一级Cache不能满足要求时,可以在原有的Cache和存储器之间增设另一级Cache,构成两级cache。 优缺点:
Cache设计的本质是在快速命中和减少不命中次数这两个方面进行权衡。虽然较大容量的第二级cache消除了一些冲突不命中,但它同时也减少了容量不命中,所以在直接映像的第二级cache中,冲突不命中所占得比例仍然很大。
4.F替换算法有哪几种,各有什么优缺点? (1) 随机法
这种方法随机地选择被替换的块。其优点是简单,易于用硬件实现,但这种方法没有考虑Cache过去被使用的情况,反应不了程序的局部性,所以命中率比较低。
(2) 先进先出法FIFO(first-In-First-Out) 这种方法选择最早调入的块作为被替换的块。其优点也是容易实现。它虽然利用了同一组中各块进入cache的先后顺序这一“历史”信息,但还是不能正确地反应程序的局部性。因为最先进入的块也可能是经常被调用的块。
(3) 最近最少使用法LRU(Least Recently Used) 这种方法是选用最近使用次数最少的块作为被替换的块。但由于其实现比较复杂,现在实际上实现的LRU都只是选择最久没有被访问的块。
计算题:
1.6 某台主频为400MHz的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下: 指令类型 整数 数据传送 浮点 分支 指令执行数量 45000 75000 8000 1500 平均时钟周期数 1 2 4 2 求该计算机的有效CPI、MIPS和程序执行时间。 解:(1)CPI =(45000×1+75000×2+8000×4+1500×2) / 129500=1.776 (2)MIPS速率=f/ CPI =400/1.776 =225.225MIPS
(3)程序执行时间= (45000×1+75000×2+8000×4+1500×2)/400=575s
因篇幅问题不能全部显示,请点此查看更多更全内容