《并行程序设计基础优秀PPT.ppt》由会员分享,可在线阅读,更多相关《并行程序设计基础优秀PPT.ppt(45页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、并行程序设计基础你现在浏览的是第一页,共45页并行程序设计基础 12.1 12.1 并行程序设计概述并行程序设计概述 12.2 12.2 进程进程 12.3 12.3 线程线程 12.4 12.4 同步同步 12.5 12.5 通信通信 12.6 12.6 并行程序设计模型并行程序设计模型2022/12/32你现在浏览的是第二页,共45页并行程序设计概述1并行程序设计难的原因并行程序设计难的原因并行程序设计难的原因并行程序设计难的原因2并行语言的构造方法并行语言的构造方法3 3并行性问题并行性问题4 4交互交互交互交互/通信问题通信问题通信问题通信问题5五种并行编程风范五种并行编程风范五种并行
2、编程风范五种并行编程风范6 6计算圆周率的样本程序计算圆周率的样本程序计算圆周率的样本程序计算圆周率的样本程序2022/12/33你现在浏览的是第三页,共45页1 并行程序设计难的原因并行程序设计难的原因 技术先行技术先行,缺乏理论指导缺乏理论指导 程序的语法程序的语法/语义复杂语义复杂,需要用户自已处理需要用户自已处理 任务任务/数据的划分数据的划分/分配分配 数据交换数据交换 同步和互斥同步和互斥 性能平衡性能平衡 并行语言缺乏代可扩展和异构可扩展并行语言缺乏代可扩展和异构可扩展,程序移植困难程序移植困难,重写重写代码难度太大代码难度太大 环境和工具缺乏较长的生长期环境和工具缺乏较长的生长
3、期,缺乏代可扩展和异构可扩缺乏代可扩展和异构可扩展展2022/12/34你现在浏览的是第四页,共45页2 并行语言的构造方法并行语言的构造方法串行代码段串行代码段for(i=0;iN;i+)Ai=bi*bi+1;for(i=0;iN;i+)ci=Ai+Ai+1;(a)使用库例程构造并行程序使用库例程构造并行程序id=my_process_id();p=number_of_processes();for(i=id;iN;i=i+p)Ai=bi*bi+1;barrier();for(i=id;iN;i=i+p)ci=Ai+Ai+1;例子例子:MPI,PVM,Pthreads(b)扩展串行语言扩展串
4、行语言my_process_id,number_of_processes(),and barrier()A(0:N-1)=b(0:N-1)*b(1:N)c=A(0:N-1)+A(1:N)例子例子:Fortran 90(c)加编译注释构造并行程序的方法加编译注释构造并行程序的方法#pragma parallel#pragma shared(A,b,c)#pragma local(i)#pragma pfor iterate(i=0;N;1)for(i=0;iN;i+)Ai=bi*bi+1;#pragma synchronize#pragma pfor iterate(i=0;N;1)for(i=
5、0;iN;i+)ci=Ai+Ai+1;例子:例子:SGI power C 2022/12/35你现在浏览的是第五页,共45页三种并行语言构造方法比较三种并行语言构造方法比较2 并行语言的构造方法并行语言的构造方法2022/12/36你现在浏览的是第六页,共45页3 并行性问题并行性问题3.1 进程的同构性vSIMD:所有进程在同一时间执行相同的指令vMIMD:各个进程在同一时间可以执行不同的指令SPMD:各个进程是同构的,多个进程对不同的数据执行相同的代码(一般是数据并行的同义语)常对应并行循环,数据并行结构,单代码MPMD:各个进程是异构的,多个进程执行不同的代码(一般是任务并行,或功能并行
6、,或控制并行的同义语)常对应并行块,多代码 要为有1000个处理器的计算机编写一个完全异构的并行程序是很困难的2022/12/37你现在浏览的是第七页,共45页并行块parbegin S1 S2 S3.Sn parendS1 S2 S3.Sn可以是不同的代码并行循环:当并行块中所有进程共享相同代码时parbegin S1 S2 S3.Sn parend S1 S2 S3.Sn是相同代码简化为parfor (i=1;i=n,i+)S(i)进程的同构性3 并行性问题并行性问题2022/12/38你现在浏览的是第八页,共45页用单代码方法说明用单代码方法说明SPMD要说明以下SPMD程序:parfo
7、r (i=0;i=N,i+)foo(i)用户需写一个以下程序:pid=my_process_id();numproc=number_of _processes();parfor (i=pid;i=N,i=i+numproc)foo(i)此程序经编译后生成可执行程序A,用shell脚本将它加载到N个处理结点上:run A numnodes NSPMD程序的构造方法程序的构造方法用数据并行程序的构造方法用数据并行程序的构造方法要说明以下SPMD程序:parfor (i=0;i=N,i+)Ci=Ai+Bi;用户可用一条数据赋值语句:C=A+B或forall(i=1,N)Ci=Ai+Bi进程的同构性3
8、 并行性问题并行性问题2022/12/39你现在浏览的是第九页,共45页用用SPMD伪造伪造MPMD要说明以下MPMD程序:parbegin S1 S2 S3 parend 可以用以下SPMD程序:parfor (i=0;i0)beginfork(foo(C);C:=boo(C);end3 并行性问题并行性问题静态并行性:程序的结构以及进程的个数在运行之前(如编译时,连接时或加载时)就可确定,就认为该程序具有静态并行性.动态并行性:否则就认为该程序具有动态并行性.即意味着进程要在运行时创建和终止2022/12/311你现在浏览的是第十一页,共45页Process A:begin Z:=1for
9、k(B);T:=foo(3);endProcess B:begin fork(C);X:=foo(Z);join(C);output(X+Y);endProcess C:begin Y:=foo(Z);end开发动态并行性的一般方法:Fork/Join静态和动态并行性3 并行性问题并行性问题Fork:派生一个子进程Join:强制父进程等待子进程2022/12/312你现在浏览的是第十二页,共45页3.3 进程编组目的:支持进程间的交互,常把需要交互的进程调度在同一组中一个进程组成员由:组标识符+成员序号 唯一确定.3.4 划分与分配原则:使系统大部分时间忙于计算,而不是闲置或忙于交互;同时不牺
10、牲并行性(度).划分:切割数据和工作负载分配:将划分好的数据和工作负载映射到计算结点(处理器)上分配方式显式分配:由用户指定数据和负载如何加载隐式分配:由编译器和运行时支持系统决定就近分配原则:进程所需的数据靠近使用它的进程代码3 并行性问题并行性问题2022/12/313你现在浏览的是第十三页,共45页并行度(Degree of Parallelism,DOP):同时执行的分进程数.并行粒度(Granularity):两次并行或交互操作之间所执行的计算负载.指令级并行块级并行进程级并行任务级并行并行度与并行粒度大小常互为倒数:增大粒度会减小并行度.增加并行度会增加系统(同步)开销 3 并行性
11、问题并行性问题2022/12/314你现在浏览的是第十四页,共45页4 交互通信交互通信问题问题交互:进程间的相互影响4.1 交互的类型v通信:两个或多个进程间传送数的操作 通信方式:共享变量父进程传给子进程(参数传递方式)消息传递 2022/12/315你现在浏览的是第十五页,共45页v同步:导致进程间相互等待或继续执行的操作 同步方式:原子同步 控制同步(路障,临界区)数据同步(锁,条件临界区,监控程序,事件)例子:原子同步parfor(i:=1;in;i+)atomicx:=x+1;y:=y-1路障同步parfor(i:=1;in;i+)Pi barrierQi 临界区parfor(i:
12、=1;in;i+)criticalx:=x+1;y:=y+1数据同步(信号量同步)parfor(i:=1;in;i+)lock(S);x:=x+1;y:=y-1;unlock(S)4 交互通信交互通信问题问题2022/12/316你现在浏览的是第十六页,共45页v聚集(aggregation):用一串超步将各分进程计算所得的部分结果合并为一个完整的结果,每个超步包含一个短的计算和一个简单的通信或/和同步.聚集方式:归约扫描交互的类型4 交互通信交互通信问题问题例子例子:计算两个向量的内积计算两个向量的内积parfor(i:=1;in;i+)Xi:=Ai*Biinner_product:=agg
13、regate_sum(Xi);2022/12/317你现在浏览的是第十七页,共45页4.2 交互的方式4 交互通信交互通信问题问题 交互代码交互代码 C P1P2Pn相对于交互代码C,可对进程P定义如下状态:到达(arrived):P刚到达C,但还未进入在内(in):P在代码中完成(finished):P刚完成执行代码C,但还未离开在外(out):P不在代码中(未到达或已离开)同步的交互:所有参与者同时到达并执行交互代码C异步的交互:进程到达C后,不必等待其它进程到达即可执行C2022/12/318你现在浏览的是第十八页,共45页交互方式与入口/出口条件的组合4 交互通信交互通信问题问题锁定的
14、发送:消息已发完,但不一定已收到锁定的接收:消息已收到非锁定的发/收:只是发出发/收的请求2022/12/319你现在浏览的是第十九页,共45页4.3 交互的模式按交互模式是否能在编译时确定分为:静态的动态的按有多少发送者和接收者参与通信分为一对一:点到点(point to point)一对多:广播(broadcast),播撒(scatter)多对一:收集(gather),归约(reduce)多对多:全交换(Tatal Exchange),扫描(scan),置换/移位(permutation/shift)4 交互通信交互通信问题问题2022/12/320你现在浏览的是第二十页,共45页1 3
15、5 P1P2P31 3 5,1 P1P2P31 3 5 P1P2P31,1 3,1 5,1 P1P2P31,3,5 P1P2P31,3,5 3 5 P1P2P31 3 5 P1P2P31,3,5 3 5 P1P2P3(a)点对点(一对一):P1发送一个值给P3(b)广播(一对多):P1发送一个值给全体(c)播撒(一对多):P1向每个结点发送一个值(d)收集(多对一):P1从每个结点接收一个值4 交互通信交互通信问题问题2022/12/321你现在浏览的是第二十一页,共45页1 3 5 P1P2P31,5 3,1 5,3 P1P2P31,2,3 4,5,6 7,8,9 P1P2P31,4,7 2
16、,5,8 3,6,9 P1P2P31 3 5 P1P2P31,1 3,4 5,9 P1P2P31 3 5 P1P2P31,9 3 5 P1P2P3(e)全交换(多对多):每个结点向每个结点发送一个不同的消息(f)移位(置换,多对多):每个结点向下一个结点发送一个值并接收来自上一个结点的一个值.(g)归约(多对一):P1得到和1+3+5=9(h)扫描(多对多):P1得到1,P2得到1+3=4,P3得到1+3+5=94 交互通信交互通信问题问题2022/12/322你现在浏览的是第二十二页,共45页 相并行(相并行(Phase ParallelPhase Parallel)分治并行(分治并行(Di
17、vide and Conquer ParallelDivide and Conquer Parallel)流水线并行(流水线并行(Pipeline ParallelPipeline Parallel)主从并行(主从并行(Master-Slave ParallelMaster-Slave Parallel)工作池并行(工作池并行(Work Pool ParallelWork Pool Parallel)5 五种并行编程风范五种并行编程风范2022/12/323你现在浏览的是第二十三页,共45页相并行(Phase Parallel)一组一组超级步超级步(相)(相)步内各自计算步内各自计算 步间通信
18、、同步步间通信、同步 BSPBSP(4.2.34.2.3)方便差错和性能分析方便差错和性能分析 计算和通信不能重叠计算和通信不能重叠CCCSynchronous Interaction.CCCSynchronous Interaction.2022/12/324你现在浏览的是第二十四页,共45页主从并行(Master-Slave Parallel)主进程:串行、协调任务主进程:串行、协调任务 子进程:计算子任务子进程:计算子任务 划分设计技术(划分设计技术(6.1 6.1)与相并行结合与相并行结合 主进程易成为瓶颈主进程易成为瓶颈MasterSlaveSlaveSlave2022/12/325
19、你现在浏览的是第二十五页,共45页分治并行(Divide and Conquer Parallel)父进程把负载分割并指派给父进程把负载分割并指派给子进程子进程 递归递归 重点在于归并重点在于归并 分治设计技术(分治设计技术(6.26.2)难以负载平衡难以负载平衡2022/12/326你现在浏览的是第二十六页,共45页流水线并行(Pipeline Parallel)一组进程一组进程 流水线作业流水线作业 流水线设计技术(流水线设计技术(6.56.5)P1P2P32022/12/327你现在浏览的是第二十七页,共45页工作池并行(Work Pool Parallel)初始状态:一件工作初始状态:
20、一件工作 进程从池中取任务执行进程从池中取任务执行 可产生新任务放回池中可产生新任务放回池中 直至任务池为空直至任务池为空 易与负载平衡易与负载平衡 临界区问题(尤其消息传递)临界区问题(尤其消息传递)Work PoolP1P2P32022/12/328你现在浏览的是第二十八页,共45页8 计算圆周率的样本程序计算圆周率的样本程序2022/12/329你现在浏览的是第二十九页,共45页计算圆周率的c语言代码段#define define define define N 1000000 N 1000000main()main()doubledoubledoubledouble local,pi=
21、0.0,w;local,pi=0.0,w;longlonglonglong i;i;w=1.0/N;w=1.0/N;for for for for(i=0;iN;i+)(i=0;iN;i+)local=(i+0.5)*w;local=(i+0.5)*w;pi=pi+4.0/(1.0+local*local);pi=pi+4.0/(1.0+local*local);printf(printf(“pi is%f npi is%f n”,pi*w);,pi*w);2022/12/330你现在浏览的是第三十页,共45页并行程序设计基础 12.1 12.1 并行程序设计概述并行程序设计概述 12.2 1
22、2.2 进程进程 12.3 12.3 线程线程 12.4 12.4 同步同步 12.5 12.5 通信通信 12.6 12.6 并行程序设计模型并行程序设计模型2022/12/331你现在浏览的是第三十一页,共45页进程1 1进程的基本概念进程的基本概念进程的基本概念进程的基本概念2进程的并行执行进程的并行执行进程的并行执行进程的并行执行3进程的相互作用进程的相互作用2022/12/332你现在浏览的是第三十二页,共45页并行程序设计基础 12.1 12.1 并行程序设计概述并行程序设计概述 12.2 12.2 进程进程 12.3 12.3 线程线程 12.4 12.4 同步同步 12.5 1
23、2.5 通信通信 12.6 12.6 并行程序设计模型并行程序设计模型2022/12/333你现在浏览的是第三十三页,共45页线程1线程的基本概念线程的基本概念线程的基本概念线程的基本概念2线程的管理线程的管理3线程的同步线程的同步线程的同步线程的同步2022/12/334你现在浏览的是第三十四页,共45页并行程序设计基础 12.1 12.1 并行程序设计概述并行程序设计概述 12.2 12.2 进程进程 12.3 12.3 线程线程 12.4 12.4 同步同步 12.5 12.5 通信通信 12.6 12.6 并行程序设计模型并行程序设计模型2022/12/335你现在浏览的是第三十五页,
24、共45页同步1原子和互斥原子和互斥2高级同步结构高级同步结构3低级同步原语低级同步原语低级同步原语低级同步原语2022/12/336你现在浏览的是第三十六页,共45页并行程序设计基础 12.1 12.1 并行程序设计概述并行程序设计概述 12.2 12.2 进程进程 12.3 12.3 线程线程 12.4 12.4 同步同步 12.5 12.5 通信通信 12.6 12.6 并行程序设计模型并行程序设计模型2022/12/337你现在浏览的是第三十七页,共45页通信1 1影响通信系统性能的因素影响通信系统性能的因素影响通信系统性能的因素影响通信系统性能的因素2低级通信支持低级通信支持3 3TC
25、P/IPTCP/IP通信协议组简介通信协议组简介通信协议组简介通信协议组简介2022/12/338你现在浏览的是第三十八页,共45页并行程序设计基础 12.1 12.1 并行程序设计概述并行程序设计概述 12.2 12.2 进程进程 12.3 12.3 线程线程 12.4 12.4 同步同步 12.5 12.5 通信通信 12.6 12.6 并行程序设计模型并行程序设计模型2022/12/339你现在浏览的是第三十九页,共45页并行程序设计模型1隐式并行模型隐式并行模型2 2数据并行模型数据并行模型数据并行模型数据并行模型3 3消息传递模型消息传递模型消息传递模型消息传递模型4共享变量模型共享
26、变量模型2022/12/340你现在浏览的是第四十页,共45页并行程序设计模型 隐式并行(隐式并行(Implicit ParallelImplicit Parallel)数据并行(数据并行(Data ParallelData Parallel)共享变量(共享变量(Shared VariableShared Variable)消息传递(消息传递(Message PassingMessage Passing)2022/12/341你现在浏览的是第四十一页,共45页隐式并行(Implicit Parallel)概况:概况:程序员用熟悉的串行语言编程程序员用熟悉的串行语言编程 编译器或运行支持系统自动
27、转化为并行代码编译器或运行支持系统自动转化为并行代码 特点:特点:语义简单语义简单 可移植性好可移植性好 单线程,易于调试和验证正确性单线程,易于调试和验证正确性 效率很低效率很低2022/12/342你现在浏览的是第四十二页,共45页数据并行(Data Parallel)概况:概况:SIMDSIMD的自然模型的自然模型 局部计算和数据选路操作局部计算和数据选路操作 特点:特点:单线程单线程 并行操作于聚合数据结构(数组)并行操作于聚合数据结构(数组)松散同步松散同步 单一地址空间单一地址空间 隐式交互作用隐式交互作用 显式显式数据分布数据分布2022/12/343你现在浏览的是第四十三页,共
28、45页共享变量(Shared Variable)概况:概况:PVP,SMP,DSMPVP,SMP,DSM的自然模型的自然模型 特点:特点:多线程:多线程:SPMD,MPMDSPMD,MPMD 异步异步 单一地址空间单一地址空间 显式同步显式同步 隐式数据分布隐式数据分布 隐式通信隐式通信2022/12/344你现在浏览的是第四十四页,共45页消息传递(Message Passing)概况:概况:MPP,COWMPP,COW的自然模型的自然模型 特点:特点:多线程多线程 异步异步 多地址空间多地址空间 显式同步显式同步 显式数据映射和负载分配显式数据映射和负载分配 显式通信显式通信2022/12/345你现在浏览的是第四十五页,共45页