《华东理工大学数据结构第1章.ppt》由会员分享,可在线阅读,更多相关《华东理工大学数据结构第1章.ppt(34页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数数据据结结构构信息学院信息学院1参考书:参考书:数据结构题集(数据结构题集(c语言版)严蔚敏等编语言版)严蔚敏等编2第一章第一章绪绪论论1.1数据结构讨论的范畴数据结构讨论的范畴1.2基本概念和术语基本概念和术语1.3算法和算法的衡量算法和算法的衡量3第一章第一章绪绪论论1.1数据结构讨论的范畴数据结构讨论的范畴NiklausWirthAlgorithm+DataStructures=Programs程序设计程序设计:为计算机处理问题编制一组指令集为计算机处理问题编制一组指令集涉及到两个问题:涉及到两个问题:信息的表示信息的表示 信息的处理信息的处理算法算法:处理问题的策略处理问题的策略数据
2、结构数据结构:问题的数学模型问题的数学模型4包括包括:数值计算的程序设计问题数值计算的程序设计问题 结构静力分析计算结构静力分析计算线性代数方程组线性代数方程组全球天气预报全球天气预报环流模式方程环流模式方程非数值计算的程序设计问题非数值计算的程序设计问题 例一例一:求一组求一组(n个个)整数中的最大值整数中的最大值 算法算法:基本操作是基本操作是“比较两个数的大小比较两个数的大小”模型:模型:?例二:计算机对弈例二:计算机对弈 算法:算法:对弈的规则和策略对弈的规则和策略 模型:模型:?5例三:足协的数据库管理例三:足协的数据库管理算法:算法:需要管理的项目?如何管理?用需要管理的项目?如何
3、管理?用户界面?户界面?模型:模型:?数据结构描述现实世界实体的数学模型数据结构描述现实世界实体的数学模型(非非数值计算数值计算)及其上的操作在计算机中的表示和及其上的操作在计算机中的表示和实现实现61.2 1.2 基本概念和术语基本概念和术语一、数据与数据结构一、数据与数据结构数据数据:所有能被输入到计算机中,且被计算机处理的符所有能被输入到计算机中,且被计算机处理的符号的集合号的集合 计算机操作的对象的总称计算机操作的对象的总称 是计算机处理的信息的某种特定的符号表示形式是计算机处理的信息的某种特定的符号表示形式数据元素数据元素:数据中的一个数据中的一个“个体个体”,数据结构中讨,数据结构
4、中讨论的基本单位论的基本单位数据项:数据项:数据结构中讨论的最小单位数据结构中讨论的最小单位数据元素是数据项的集合数据元素是数据项的集合7姓名姓名俱乐部名称俱乐部名称出生日期出生日期 参加日期参加日期职务职务业绩业绩其中其中出生日期出生日期年年月月日日是组合项是组合项例如:例如:运动员(数据元素)运动员(数据元素)8数据结构:数据结构:带结构结构的数据元素的集合例如例如,一个含一个含12位数的十进制数位数的十进制数可以用三个三个4位的十位的十进制数进制数表示3214,6587,9345a1(3214),a2(6587),a3(9345)在在a1、a2和和a3之间存在之间存在“次序次序”关系关系
5、:、3214,6587,93456587,3214,9345a1a2a3a2a1a39又例,又例,2行行3列的二维数组列的二维数组a1,a2,a3,a4,a5,a6a1 a2 a3a4 a5 a6行的次序关系行的次序关系:row=,列的次序关系列的次序关系:col=,数据结构:数据结构:带结构结构的数据元素的集合再例,一维数组再例,一维数组a1,a2,a3,a4,a5,a6中存在中存在次序关系次序关系:|i=1,2,3,4,5,610一、一、集合集合结构中的数据元素除了同属于一种结构中的数据元素除了同属于一种类型外,别无其它关系。类型外,别无其它关系。二、二、线性结构线性结构结构中的数据元素之
6、间存在一结构中的数据元素之间存在一对一的关系。对一的关系。三、三、树型结构树型结构结构中的数据元素之间存在一结构中的数据元素之间存在一对多的关系。对多的关系。四、四、图状结构或网状结构图状结构或网状结构结构中的数据元素结构中的数据元素之间存在多对多的关系。之间存在多对多的关系。数据的逻辑结构可归结为以下四类数据的逻辑结构可归结为以下四类:11数据结构的形式定义为:数据结构是一个二元组:数据结构的形式定义为:数据结构是一个二元组:Data-Structure=(D,S)其中:其中:D是数据元素的有限集,是数据元素的有限集,S是是D上关系的有上关系的有限集。限集。d1d2数据元素数据元素之间的关系
7、若若d1d1和和d2d2表示两个数据元素,它们具有关系表示两个数据元素,它们具有关系d1,d2d1,d2.12例例 复数的数据结构定义如下:复数的数据结构定义如下:Complex=(C,R)其中:其中:C是含两个实数的集合是含两个实数的集合C1,C2,分别分别表示复数的实部和虚部。表示复数的实部和虚部。R=P,P是定义在集合是定义在集合上的一种关系上的一种关系C1,C2。严格地讲,以上定义仅是数据的逻辑结构的定义严格地讲,以上定义仅是数据的逻辑结构的定义13数据元素的映象方法数据元素的映象方法:数据的存储结构数据的存储结构数据结构在计算机中的表数据结构在计算机中的表示,即逻辑结构在存储器中的映
8、象示,即逻辑结构在存储器中的映象,又称为又称为物物理结构理结构用二进制位用二进制位(bit)的位串表示数据元素的位串表示数据元素(321)10=(501)8=(101000001)2A=(101)8=(001000001)214数据区数据区 指针区指针区链式映象链式映象:以附加信息以附加信息(指针指针)表示后继关系表示后继关系需要用一个和需要用一个和x在一起的附加信息指示在一起的附加信息指示y的存储位置的存储位置数据元素之间关系的两种映象方法:(表示数据元素之间关系的两种映象方法:(表示 的方法)的方法)顺序映象顺序映象:以存储位置的相邻表示后继关系以存储位置的相邻表示后继关系y的存储位置和的
9、存储位置和x的存储位置之间差一个常量的存储位置之间差一个常量C而而C是一个隐含值,是一个隐含值,整个存储结构中只含数据元整个存储结构中只含数据元素本身的信息素本身的信息.15当用高级程序设计语言进行编程时,通常可用当用高级程序设计语言进行编程时,通常可用高级编程语言中提供的数据类型描述之。高级编程语言中提供的数据类型描述之。例如例如:以三个带有次序关系的整数表示一个长以三个带有次序关系的整数表示一个长整数时,可利用整数时,可利用C语言中提供的整数数组类型,语言中提供的整数数组类型,定义长整数定义长整数为为:typedefintLong_int3在不同的编程环境中,存储结构可有不同的描在不同的编
10、程环境中,存储结构可有不同的描述方法,述方法,16二、数据类型二、数据类型在用高级程序语言编写的程序中,必须对程序在用高级程序语言编写的程序中,必须对程序中出现的每个变量、常量或表达式,明确说明中出现的每个变量、常量或表达式,明确说明它们所属的数据类型。因为类型明显或隐含地它们所属的数据类型。因为类型明显或隐含地规定了,在程序执行期间,变量或表达式所有规定了,在程序执行期间,变量或表达式所有可能取值的范围,以及在这些之上允许进行的可能取值的范围,以及在这些之上允许进行的操作。操作。数据类型是一个值的集合和定义在此集合上的数据类型是一个值的集合和定义在此集合上的一组操作的总称。一组操作的总称。1
11、7三、抽象数据类型三、抽象数据类型(AbstractDataType简称简称ADT)ADT有两个重要特征有两个重要特征:数据抽象数据抽象用用ADT描述程序处理的实体时,描述程序处理的实体时,强调的是强调的是其本质的特征、其所能完成的功能以及它其本质的特征、其所能完成的功能以及它和外部用户的接口和外部用户的接口(即外界使用它的方法)(即外界使用它的方法)数据封装数据封装将实体的外部特性和其内部实现细节分离,将实体的外部特性和其内部实现细节分离,并且对外部用户隐藏其内部实现细节并且对外部用户隐藏其内部实现细节是指一个数学模型以及定义在此数学模型上是指一个数学模型以及定义在此数学模型上的一组操作的一
12、组操作18例如例如抽象数据类型复数的定义:抽象数据类型复数的定义:ADTComplex数据对象:数据对象:De1,e2e1,e2RealSet数据关系:数据关系:R1|e1是复数的实数部分是复数的实数部分,e2是复数的虚数部分是复数的虚数部分基本操作:基本操作:InitComplex(&Z,v1,v2)操作结果:构造复数操作结果:构造复数Z,其实部和虚部分别被赋以参数其实部和虚部分别被赋以参数v1和和v2的值。的值。DestroyComplex(&Z)操作结果:复数操作结果:复数Z被销毁。被销毁。GetReal(Z,&realPart)初始条件:复数已存在。操作结果:用初始条件:复数已存在。操
13、作结果:用realPart返回复数返回复数Z的实部值。的实部值。GetImag(Z,&ImagPart)初始条件:复数已存在。操作结果:用初始条件:复数已存在。操作结果:用ImagPart返回复数返回复数Z的虚部值。的虚部值。Add(z1,z2,&sum)初始条件:初始条件:z1,z2是复数。操作结果:用是复数。操作结果:用sum返回两个复数返回两个复数z1,z2的和值。的和值。ADTComplex假设假设:z1和和z2是上述定义的复数,则是上述定义的复数,则Add(z1,z2,z3)操作操作的结果将得到的结果将得到z3=z1+z219抽象数据类型的描述方法抽象数据类型的描述方法抽象数据类型可
14、用抽象数据类型可用(D,S,P)三元组表示三元组表示其中,其中,D是数据对象,是数据对象,S是是D上的关系集,上的关系集,P是是对对D的基本操作集。的基本操作集。ADT 抽象数据类型名抽象数据类型名 数据对象:数据对象的定义数据对象:数据对象的定义数据关系:数据关系的定义数据关系:数据关系的定义基本操作:基本操作的定义基本操作:基本操作的定义 ADT 抽象数据类型名抽象数据类型名其中,数据对象和数据关系的定义用伪码描述,其中,数据对象和数据关系的定义用伪码描述,20基本操作的定义格式为基本操作的定义格式为基本操作名(参数表)基本操作名(参数表)初始条件:初始条件描述初始条件:初始条件描述操作结
15、果:操作结果描述操作结果:操作结果描述基本操作有两种基本操作有两种参数参数:赋值参数赋值参数只为操作提供输入值;只为操作提供输入值;引用引用参数参数以以&打头,打头,除可提供输入值外,还将返回操作结果。除可提供输入值外,还将返回操作结果。“初始条件初始条件”描述了操作执行之前数据结构和参数应满足的描述了操作执行之前数据结构和参数应满足的条件,若不满足,则操作失败,并返回相应出错信息。条件,若不满足,则操作失败,并返回相应出错信息。“操作结果操作结果”说明了操作正常完成之后,数据结构的变化状说明了操作正常完成之后,数据结构的变化状况和应返回的结果。若初始条件为空,则省略之。况和应返回的结果。若初
16、始条件为空,则省略之。抽象数据类型需要通过固有数据类型抽象数据类型需要通过固有数据类型(高级编程语言中已实高级编程语言中已实现的数据类型现的数据类型)来实现来实现211.3算法和算法的衡量算法和算法的衡量一、算法一、算法算法是为了解决某类问题而规定的一个算法是为了解决某类问题而规定的一个有限长的操作序列。有限长的操作序列。22一个算法必须满足以下五个重要特性:一个算法必须满足以下五个重要特性:1有穷性有穷性对于任意一组合法输入值,在执行对于任意一组合法输入值,在执行有穷步骤有穷步骤之后一定能之后一定能结束,即:算法中的每个步骤都能在结束,即:算法中的每个步骤都能在有限时间有限时间内完成;内完成
17、;2确定性确定性对于对于每种情况每种情况下所应执行的操作,在算法中都有下所应执行的操作,在算法中都有确切确切的规定,使算法的执行者或阅读者都能明确其含义及如何执行。的规定,使算法的执行者或阅读者都能明确其含义及如何执行。并且在任何条件下,算法都只有一条执行路径;并且在任何条件下,算法都只有一条执行路径;3可行性可行性算法中的所有操作都必须算法中的所有操作都必须足够基本足够基本,都可以通过已经,都可以通过已经实现的基本操作运算有限次实现之;实现的基本操作运算有限次实现之;4有输入有输入作为算法加工对象的量值,通常体现为算法中的一组作为算法加工对象的量值,通常体现为算法中的一组变量。有些输入量需要
18、在算法执行过程中输入,而有的算法表面变量。有些输入量需要在算法执行过程中输入,而有的算法表面上可以没有输入,实际上已被嵌入算法之中;上可以没有输入,实际上已被嵌入算法之中;5有输出有输出它是一组与它是一组与“输入输入”与确定关系的量值,是算法进行与确定关系的量值,是算法进行信息加工后得到的结果,这种确定关系即为算法的功能。信息加工后得到的结果,这种确定关系即为算法的功能。23二、算法设计的原则二、算法设计的原则设计算法时,通常应考虑达到以下目标:设计算法时,通常应考虑达到以下目标:1正确性正确性首先,算法应当满足以特定的首先,算法应当满足以特定的“规格说明规格说明”方式给出的需方式给出的需求。
19、求。其次,对算法是否其次,对算法是否“正确正确”的理解可以有以下四个层次:的理解可以有以下四个层次:a程序中不含语法错误;程序中不含语法错误;b程序对于几组输入数据能够得出满足要求的结果;程序对于几组输入数据能够得出满足要求的结果;c程序对于精心选择的、典型、苛刻切带有刁难性的几组程序对于精心选择的、典型、苛刻切带有刁难性的几组输入数据能够得出满足要求的结果;输入数据能够得出满足要求的结果;d程序对于一切合法的输入数据都能得出满足要求的结果;程序对于一切合法的输入数据都能得出满足要求的结果;通常以第通常以第c层意义的正确性作为衡量一个算法是否合格的标层意义的正确性作为衡量一个算法是否合格的标准
20、。准。242.可读性可读性算法主要是为了人的阅读与交流,其次才是为计算机算法主要是为了人的阅读与交流,其次才是为计算机执行。因此算法应该易于人的理解;另一方面,晦涩执行。因此算法应该易于人的理解;另一方面,晦涩难读的程序易于隐藏较多错误而难以调试;难读的程序易于隐藏较多错误而难以调试;3健壮性健壮性当当输入的数据非法输入的数据非法时,算法应当恰当地作出反映或时,算法应当恰当地作出反映或进进行相应处理行相应处理,而不是产生莫名奇妙的输出结果。并且,而不是产生莫名奇妙的输出结果。并且,处理出错的方法不应是中断程序的执行,而应是返回处理出错的方法不应是中断程序的执行,而应是返回一个表示错误或错误性质
21、的值,以便在更高的抽象层一个表示错误或错误性质的值,以便在更高的抽象层次上进行处理。次上进行处理。4高效率与低存储量需求高效率与低存储量需求通常,效率指的是通常,效率指的是算法执行时间算法执行时间;存储量指的是算法;存储量指的是算法执行过程中执行过程中所需的最大存储空间所需的最大存储空间。两者都与问题的规。两者都与问题的规模有关。模有关。二、算法设计的原则二、算法设计的原则25三、算法效率的衡量方法和准则三、算法效率的衡量方法和准则通常有两种衡量算法效率的方法通常有两种衡量算法效率的方法:事后统计法事后统计法缺点:缺点:1.必须执行程序必须执行程序2其它因素掩盖算法本质其它因素掩盖算法本质事前
22、分析估算法事前分析估算法26和算法执行时间相关的因素:和算法执行时间相关的因素:1算法选用的策略算法选用的策略2问题的规模问题的规模3编写程序的语言编写程序的语言4编译程序产生的机器代码的质量编译程序产生的机器代码的质量5计算机执行指令的速度计算机执行指令的速度27一个特定算法的一个特定算法的“运行工作量运行工作量”的大小,只依的大小,只依赖于问题的规模(通常用整数量赖于问题的规模(通常用整数量n表示),或表示),或者说,它是问题规模的函数。者说,它是问题规模的函数。假如,随着问题规模假如,随着问题规模n的增长,算法执行时间的的增长,算法执行时间的增长率和增长率和f(n)的增长率相同,则可记作
23、:的增长率相同,则可记作:T(n)=O(f(n)称称T(n)为算法的为算法的(渐近渐近)时间复杂度时间复杂度28如何估算算法的时间复杂度?如何估算算法的时间复杂度?算法算法=控制结构控制结构+原操作原操作(固有数(固有数据类型的操作)据类型的操作)算法的执行时间算法的执行时间=原操作原操作(i)的执行次数的执行次数原操作原操作(i)的执行时间的执行时间算法的执行时间算法的执行时间与与原操作执行次数之和原操作执行次数之和成正比成正比从算法中选取一种对于所研究的问题来说是从算法中选取一种对于所研究的问题来说是基本基本操作操作的原操作,以该基本操作的原操作,以该基本操作在算法中重复执在算法中重复执行
24、的次数行的次数作为算法运行时间的衡量准则作为算法运行时间的衡量准则语句频度:指该语句重复执行的次数。语句频度:指该语句重复执行的次数。29例一例一 求两矩阵之积求两矩阵之积for(i=1;i=n;+i)for(i=1;i=n;+i)for(j=1;j=n;+j)for(j=1;j=n;+j)ci,j=0;ci,j=0;for(k=1;k=n;+k)for(k=1;k=n;+k)ci,j+=ai,kci,j+=ai,k*bk,j;bk,j;基本操作基本操作:乘法乘法操操作作时间复杂度时间复杂度:O(nO(n3 3)30例二例二voidselect_sort(inta,intn)/将将a中整数序列
25、重新排列成自小至大有序的整数序列中整数序列重新排列成自小至大有序的整数序列。for(i=0;in-1;+i)j=i;for(k=i+1;kn;+k)if(ak1&change;-i)for(i=n-1,change=TRUE;i1&change;-i)change=FALSE;change=FALSE;for(j=0;ji;+j)for(j=0;j aj+1)aj aj+1;if(aj aj+1)aj aj+1;change=TRUE change=TRUE /bubble_sort/bubble_sort基本操作基本操作:赋值操作赋值操作时间复杂度时间复杂度:O(nO(n2 2)32四、算法
26、的存储空间需求四、算法的存储空间需求算法的空间复杂度算法的空间复杂度S(n)=O(g(n)表示随着问题规模表示随着问题规模n的增大,算法运行所需存的增大,算法运行所需存储量的增长率与储量的增长率与g(n)的增长率相同。的增长率相同。算法的存储量包括算法的存储量包括:1输入数据所占空间输入数据所占空间;2程序本身所占空间;程序本身所占空间;3辅助变量所占空间。辅助变量所占空间。33若输入数据所占空间只取决与问题本身,和算若输入数据所占空间只取决与问题本身,和算法无关,则只需要分析法无关,则只需要分析除输入和程序之外的额除输入和程序之外的额外空间外空间。若所需额外空间相对于输入数据量来说是常数,若所需额外空间相对于输入数据量来说是常数,则称此算法为则称此算法为原地工作原地工作。若所需存储量依赖于特定的输入,则通常按最若所需存储量依赖于特定的输入,则通常按最坏情况考虑。坏情况考虑。34