第一部分 算法与数据结构 (历年比例41%) 1、算法 ◆ 问题处理方案的正确而完整的描述称为【算法】。算法分析的目的是,分析算法的效率以求改进。算法的基本特征是【可行性】、【确定性】、【有穷性】和拥有足够情报。 ◆ 算法的有穷性是指:算法程序的运行时间是有限的。
◆ 算法的复杂度是衡量算法好坏的度量,分为【时间复杂度】和【空间复杂度】。 ★★ 时间复杂度是指执行算法所需要的【计算工作量】;算法的空间复杂度是指算法执行过程中所需的【存储空间】。 ◆ 算法时间复杂度或空间复杂度中的一项的值,没有办法推出另一项的值。
2、数据结构 ◆ 数据结构分为【逻辑结构】和【存储结构】。线性结构和非线性结构属于逻辑结构;顺序、链式、索引属于存储结构(物理结构)。循环队列属于【存储结构】。 ★ 数据的存储结构又称为物理结构,是数据的逻辑结构在计算机存储空间中的存放形式。 ◆ 一个逻辑结构可以有多种存储结构,且各种存储结构影响数据处理的效率。程序执行的效率与数据的存储结构密切相关。
◆ 数据结构分为线性结构和非线性结构,带链的队列属于【线性结构】。
◆ 线性表的存储结构主要分为顺序存储结构和链式存储结构。顺序存储结构的存储一定是连续的,链式存储的存储空间不一定是连续的。
◆ 有序线性表既可以采用顺序存储结构,也可以采用链式存储结构。
◆ 队列是一种特殊的线性表,循环队列按照【先进先出】原则组织数据。循环队列是队列的【顺序】存储结构。
◆ 数据的独立性分为【物理独立】性和【逻辑独立性】。当数据的存储结构改变时,其逻辑结构可以不变,因此,基于逻辑结构的应用程序可以不用修改,称为【物理独立性】。 3、栈和队列 ★★ 栈是一种特殊的线性表,是只能在一端进行插入和删除的线性表,特点是FILO(First In Last Out)。
★★ 栈是【先进后出】的线性表;栈具有记忆作用;对栈的插入与删除操作中,不需要改变【栈底指针】。假定让元素1、2、3、A、B依次入栈,则出栈的顺序是:B、A、3、2、1。 ◆ 栈与队列都是线性结构,树是非线性结构。支持子程序调用的数据结构是【栈】。 ◆ 栈与队列的共同点是,都只允许在【端点处】插入和删除元素。
◆ 栈只能顺序存储的描述是错误的。栈可以有【顺序和链式】两种存储方式。 ★★ 队列是允许在一段插入,在另一端进行删除的线性表,其特点是【先进先出】。
◆ 循环队列中元素的个数是由队头指针和队尾指针共同决定。循环队列的头指针为front,尾指针为rear,容量为maxSize,则循环队列中元素的个数是【 (rear-front+maxSize) mod maxSize】。 4、线性链表 ◆ 线性链表是线性表的链式存储结构。用链表表示线性表的优点是【便于插入和删除操作】。 ◆ 线性链表的存储空间不一定连续,且个元素的存储顺序是任意的。
5、树与二叉树 ◆ 在树结构中,一个结点所拥有的后件(继)的个数称为该结点的度,所有结点中最大的度称为树的度。二叉树各结点的度只可能取值0、1、2,不可能是其它值。换言之,知道了度为1结点数量的前提下,叶子结点或度为2的结点中知道其一,就可以求出总的结点数。 ★★★下面关于计算结点数量的几个性质,非常重要:
(1)对任意的二叉树,叶子结点的数量,比度为2的结点数量多一个(换言之,已知叶子结点的数量,减去1则是度为2的结点数量;已知度为2的结点数量,加上1就是叶子结点数量) (2)完全二叉树如果有N个结点,当N为奇数的时候,叶子结点数为(N+1)/2,此时二叉树只有度为0的叶子结点及度为2的结点,没有度为1的结点;当N为偶数的时候,叶子结点的数量为N/2。(注意条件,必须是完全二叉树,当然包括满二叉树) (3)满二叉树第K层上的结点数量为2K-1;深度为K的满二叉树,结点总数为2K-1。 上述的计算公式,关键要能够应用,例如,深度为7的满二叉树,度为2的结点数量是多少?既然是满二叉树,叶子结点的数量就是第7层的结点数量,也就是26,可以算出叶子结点为64,因此度为2的结点数是63(叶子结点数减去1)。
★★★ 二叉树的前序遍历、中序遍历、后续遍历:前中后三个词是相对于根来讲的,前序是【根-->左-->右】,中序是【左-->根-->右】,后续是【左-->右-->根】。具体操作为: 先序遍历(D L R): 访问根结点,按先序遍历左子树,按先序遍历右子树。 中序遍历(L D R): 按中序遍历左子树,访问根结点,按中序遍历右子树。 后序遍历(L R D): 按后序遍历左子树,按后序遍历右子树,访问根结点。
下面以中序遍历为例,来讲解实际的解题方法:对一棵树,将根结点下的左子树用一个椭圆圈起来,右子树也用一个椭圆圈起来。之后,在左子树上标记上1,在根结点标记上2,在右子树上标记上3。对在左边椭圆内的左子树,现在把它单独拿出来分析。把它的左子树圈起来标上1.1,根结点标记上1.2,右子树标上1.3。按照上述方法依次往下,直到树不能拆分,然后按照“左-->根--->右”的顺序写出结点的访问先后即可。
6、查找技术 ◆ 对于长度为n的线性表,顺序查找最坏情况下需要比较n次。(对数据是否有序没有要求)。◆ 顺序查找最好情况下查询次数是1,最坏情况下是n,平均为(1+n)/2。
★★ 对于长度为n的有序线性表,二分法最坏情况下只需要比较log2n次。(数据必须有序) ◆ 能用二分法进行查找的是【顺序存储的有序线性表】。
7、排序技术 ★★ 对于长度为n的线性表,【冒泡排序、快速排序、简单插入排序、简单选择排序】这四种排序方式在最坏情况下的比较次数相同,都是【n(n-1)/2】。堆排序的效率最高,是【nlog2n】。★★ 希尔排序最坏情况下需要次比较【n1.5】。希尔排序属于【插入类排序法】。 ◆ 已知数据表A中每个元素距最终位置不远,为节省时间,应该采用的算法是【直接插入排序】。选择排序、插入排序、快速排序、归并排序中对内存要求最大的是【归并排序】。 第二部分 软件工程基础 (历年比例27%) 1、软件工程基本概念 ★★ 软件是包括【程序】、【数据】及【相关文档】的完整集合,软件是一种逻辑产品。软件工程三要素包括【方法、工具和过程】,其中【过程】支持软件开发的各个环节的控制和管理。
◆ 软件工程的核心思想:把软件产品当作是一个工程产品来处理,强调在软件开发过程中应用【工程化】原则。
◆ 从工程管理角度,软件设计一般分为两步完成,它们是【概要设计】和【详细设计】。 ★★ 软件生命周期可分为多个阶段,一般分为【定义】阶段、【开发】阶段和【维护】阶段,编码和测试属于【开发阶段】。 ◆ 需求分析阶段产生的主要文档是【软件需求规格说明书】。软件需求的规格说明书应该有完整性、无歧义性、正确性、可验证性、可修改性等特征,其中最重要的是【正确性】。 2、结构化分析与设计 ★★ 需求分析的分发有:【结构化】需求分析方法,【面向对象】的分析方法。DFD是【需求分析阶段】可以使用的工具之一。
◆ 结构化分析的常用工具:数据流图(DFD);数据字典;判定树;判定表。
◆ 在结构化分析使用数据流图(DFD)时候,利用【数据字典】对其中的图形元素进行确切的解释。【数据字典】是结构化分析的核心。 ◆ 典型的数据流类型有两种,【交换性】和【事务型】。
◆ 常见的过程设计工具有:图形工具(程序流程图、N-S,PAD,HIPO)、表格工具(判定表)、语言工具(PDL伪码)。
◆ 内聚性是模块内部的联系,耦合性模块之间的相互联系的紧密程度。
★★★ 追求目标是:模块的内聚程度要高,模块间的耦合程度要尽量弱。即高内聚低耦合。 ★★ 程序流程图中带有箭头的线段表示的是【控制流】。【平行四边形】代表输入输出,【矩形】代表处理,菱形代表【判断】(注意,数据流图中的箭头,代表【数据流】)。 ◆ 符合结构化原则的三种基本控制结构是:【顺序结构】,【选择结构】和【循环结构】。 3、软件测试与维护 ★★ 软件测试的目的是尽可能多的发现程序中的错误,但是不包括改正错误。(软件调试的目的才是改正错误)
★★ 软件测试分为静态测试和动态测试,其中【静态测试】是指不执行程序,只对程序文本进行检查。软件的动态测试主要包括【黑盒测试】和【白盒测试】。 ◆ 黑盒测试的方法有等价类划分法,边界值分析法,错误推测法,因果图;白盒测试主要方法有逻辑覆盖、基本路径测试。(考试时给出一种方法的名字,你要知道属于白盒还是黑盒)
【白盒测试】的原则之一是保证所测模块的每一个独立路径至少要执行一次。白盒测试将程序看做是【路径的集合】。 ◆ 软件测试一般按照四个步骤进行:单元测试,集成测试,验收测试和系统测试。集成测试应该在【单元测试】之后进行。
◆ 在模块测试中,需要为每个被测试的模块设计【驱动模块】和【承接模块】。其中,驱动模块的作用是将测试的数据传给被测试的模块,并显示结果。
◆ 【测试用例】是为某个目标而编制的一组测试输入、执行条件及预期结果。测试用例包括输入值集和【输出值集】。 ★★ 诊断和改正程序中的错误称为【程序调试】(或软件调试),通常也称为Debug。软件调试可分为【静态调试】和【动态调试】。 ◆ 在软件已经交付使用之后,为了改正错误或满足新的需要而修改软件的过程称为【软件维护】。注意软件维护不属于软件生命周期【开发阶段】的任务。 第三部分 数据库设计基础 (历年比例24%) 1、数据库系统基本概念 ◆ 数据库设计的根本目标是要解决【数据共享问题】。在数据库管理技术发展的三个阶段中,数据共享最好的是【数据库系统阶段】。数据独立性最高的阶段是【数据库系统阶段】。 ◆ 数据库系统与文件系统的区别是前者具有【特定的数据模型】。 ◆ 数据库系统常见的数据模型有层次模型,网络模型和【关系模型】。 ★★ 数据库系统的核心是【数据库管理系统】。
◆ DBS包括DB和DBMS。完整讲,数据库系统DBS由数据库DB、数据库管理系统DBMS、数据库管理员DBA、硬件平台和软件平台组成。 ◆ 数据库应用系统的核心是【数据库维护】。
◆ 数据库系统的三级模式结构:内模式处于最底层,它反映了数据在计算机物理结构中的实际存储形式;概念模式处于中层,它放映了设计者的数据全局逻辑要求,与软硬件环境无关;
外模式处于最外层,它反映了用户对数据的要求。 ◆ 在数据库系统中,用户所见的数据模式为【外模式】。
◆ 数据库设计的四个阶段是:需求分析、概念设计、【逻辑设计】和【物理设计】。将E-R图转换成关系数据模型属于【逻辑设计】阶段。
◆ 数据库管理系统提供的数据语言:数据定义语言DDL,数据操纵语言DML,数据控制
语言DCL。SQL的全称是Structured Query Language,中文意思是【结构化查询语言】。 2、数据模型 ★★★ 实体之间的联系用树形结构来表示的模型是【层次模型】。采用二维表来表示的是【关系模型】。在关系数据库中,把数据表示成二维表,每一个二维表称为【关系】。 ◆ 在关系数据库中,用来表示实体之间联系的是【关系】。
◆ 将E-R图转化为关系模式时,实体和联系都可以表示为【关系】。
★★★ 确定两个实体之间是一对一、一对多、还是多对多的方法是:选择实体A,看是否有多个实体B与之对应;选择实体B,看是否有多个实体A与之对应。例如在“学生学习课程”中的两个实体,学生与课程,一个学生可以学习多门课程,一门课程可以被多个学生学习,所以二者是一种多对多的关系。
★★ 在E-R 图中,用来表示实体的图形是【矩形】。用来表示【属性】的图形是椭圆。用菱形来表示联系。
★★ 一个关系表的行称为【元组】(或记录),列称为【属性】(或字段)。 ◆ 在二维表中,元组的【分量】不能再分为更小的数据线。 ◆ 为了建立一个关系,首先要构造数据的【逻辑关系】。
3、关系代数 ◆ 在交、差、投影中,不改变关系表中的属性个数但是能减少元组个数的是【交】运算。 ★★★ 关系运算的规则(下面介绍的7种运算,考试的时候一般会考察一种,都要背) (1)并运算R∪S:并运算是两个表行上的合并,重复的行只出现一次。 (2)交运算R∩S:交运算是选出两个表中的公共行。
(3)差运算R-S:差运算是从表R中,删除R与S中都出现过的行。 (4)选择运算:选出二维表【部分的行】称为选择运算。 (5)投影运算:选出二维表【部分的列】称为投影运算。
(6)连接运算:根据两个表的共同属性的值,将它们连接起来,无需去除共同属性。如果去掉了重复属性,就称为自然连接。
(7)笛卡尔乘积:将关系R中的每一行依次与关系S中的每一行进行排列组合。
注意:除了选择运算和投影运算操作的是单个表之外,其余的元算都需要两个表(两个关系)。其中,并运算、交运算和差运算要求两个关系R与S要具有相同个数的属性。 第四部分 程序设计基础 (历年比例8%) ★★ 程序设计总体原则:清晰第一、效率第二。
◆ 良好程序风格包括:源程序要文档化,数据说明的次序要规范化,避免滥用goto语句。 ◆ 结构化程序设计的核心是算法,面向对象的核心是对象(类)。
★★ 结构化程序设计的基本原则是:【自顶向下】、【逐步求精】、【模块化】、【限制使用Goto语句】。 ★★ 类是一组具有相同属性和相同操作的对象的集合。面向对象模型中,最基本的概念是对象和【类】。在面向对象方法中,类的实例称为【对象】,实现信息隐藏是通过对象的【封装】。 ★★ 面向对象的特征包括抽象,【封装】、【继承】、【多态】。 ◆ 继承提高了软件的【可重用性】。
◆ 对象是【属性和方法】的封装体,对象间的通讯靠【消息传递】,操作是对象的动态性属性。
因篇幅问题不能全部显示,请点此查看更多更全内容