《轨道交通RAMS介绍和计算白皮书.docx》由会员分享,可在线阅读,更多相关《轨道交通RAMS介绍和计算白皮书.docx(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、轨道交通RAMS介绍和计算白皮书华为企业业务-企业行业标准部张胤/00195048文档版本V1.0发布日期2013-09-12HUAWGI华为技术有限公司运营可靠性计算的重点是系统模型的建立和制定“业务失效”的标准。系统模型可以通过RBD、FTA 和FMECA等方法建立;而“业务失效”的标准一般需要和集成商协商,比如“列车延误5分钟以 上”。NOTE有些项目里会把MTBF和MTBSF统一使用MTBF表达,只是表达不同,其实本质是一样的。1.2 可用性(Availability)可用性是产品在任意一个随机时刻处于可用状态的能力。与可靠性相似,也分为固有可用性(Ai) 和运行可用性(As),计算的
2、依据和可靠性计算相同。可用性的定量计算的一般公式是:A = MUT/(MUT+MDT);其中:MUT是平均工作时间,MDT是平均失效时间;对应的固有可靠性可用如下公式计算:A i= MTBF/(MTBF+MTTR);运行可靠性(As)可用如下公式计算:A s= MTBSF/(MTBSF+MTTR);I NOTE运行可靠性和固有可靠性的MTTR需要包含的时间不同,因此在计算可用性时使用不同的可维护性 指标计算结果差距很大,比如对于固有可靠性一般只需要计算更换单板的时间即可,但运行可靠性 计算就需要从业务角度出发把维修流程时间和物流时间都计算在内,当然具体数据的获得需要和上 级单位进行沟通。可靠性
3、(A)的单位是百分比(业界通常称x个9),越接近1代表可用性越高。计算对应的可用性 指标时,使用对应的MUT和MDT数值代入即可。1.3 可维护性(Maintainability )可维修性是产品在规定的条件下和规定的时间内,按规定的程序方法进行维修时,保持或恢复到其 规定状态的能力。可维护性的定量衡量参数为平均维修时间(Mean Time To Repair, MTTR),单位 是小时(h)oMTTR值根据不同场景需要包换的时间也不同,比如在计算固有可靠性时一般只包含更换单板的时 间(0.5h)而在计算运行可可靠性时需要加入物流和管理流程时间(一般lh)。在铁路项目的可维修性还体现在对维保和
4、维修的规范化,一般需要维护文档提供如下信息: 预防性维修(Preventive Maintenance):即计划性日常保养,需要列出保养的内容和每项内容 消耗的人力和时间;如下图所示:表格1保养模板维保项目MTBMMTTMR0R1MTBM: Mean Time Between Maintenance (hours, years or km);MTTM:Mean Time To Maintain (mean duration of revision in hours or days); 修复性维修(Corrective Maintenance):即维修,是非计划性的,在维护文档要列出每项维修的内
5、容,消耗的人力和维修时间;如下图所示:表格2维修模板维修模块名维修时间维修地点(站点,厂房)维修人力1.4 安全性(Safety)安全性是指产品不发生系统危险事件(Hazard Event,也称为事故)的能力,在铁路行业定义就是不 产生重大财产和生命损失。铁路行业设备主要分为安全相关和非安全相关系统。我司的通信产品一 般是非安全相关,对于安全相关系统首先需要确定系统的安全完整性等级(Safety Integrity Level 0-4, SIL0-4),等级越高流程和产品的要求就越高、安全性评估技术很多,主要有FMECA, HAZOP等, 并由一整套流程和工具来配套,成本非常高。NOTE我司严
6、格限制安全条款的答复,无论结论是否是安全相关,原则上都应由集成商来进行操作,对于 相关条款也不绝能答复COMPLY,否则极有可能陷入流程和交付的陷阱中。3 RAMS铁路项目答标指导3.1 RAMS在全生命周期中的位置RAMS是一个贯穿全流程的活动,目前轨道交通通信集成项目常见RAMS交付件如下:表格3 RAMS交付件列表交付文档业主或总集成商集成商设备提供商RAM Assurance Requirements Specification负责不参与不参与RAM plan/RAM programme负责不参与RAM allocation report负责不参与FMECA report负责提供子系统
7、级别报告RAM analysis & prediction & report负责提供子系统级别报告RAM demonstration plan/report负责提供子系统级别报告Life Cycle Cost (LCC) analysis & report负责提供子系统级别报告RAM requirement Verification& Validation report负责提供子系统级别报告Defect Report Analysis & Corrective Action System (DRACAS)负责不参与Safety相关交付件负责一般不参与Q NOTE每个项目交付件会有所不同,但文档
8、的交付内容基本相似。3.2 总体策略RAMSRAMSafety可靠性部分:我司需重点关注安全性部分:尽量规避图表1 RAMS分解RAMS分为RAM和Safety两部分,基于我司通信设备提供商的定位,对这两部分的策略如下: Safety通信设备是非安全相关系统,原则上不需要提供安全分析文档。由于安全活动的重要性,我司尽 量不承担,交由集成商去完成。0 NOTE有些项目集成商或业主需要我司提供初步安全分析,以证明“为什么通信设备是非安全相关系统”。 目前我司还未出具过相关证明文件,主要通过沟通方式把这个活动交由集成商承担。 RAMRAM部分我司参与子系统级别交付活动;对于系统集成级别的交付件,如R
9、AM分配和RAM计划 等,按EN 50126规定由集成商负责。3.3 RAM Assurance Requirements Specification该文档描述项目的RAM的需求,并把RAM量化指标分配到各个子系统;另外,一般还指定项目交付件和交付时间点。分工界面:由业主或者总集成商编制,由通信集成商负责承接。CQ NOTE该部分内容可以是单独文档,也可以体现为标书的一部分。3.4 RAM plan/RAM programme该文档承接RAM需求,内容包括RAM交付计划、交付件、组织和人事、交付时间点和里程碑、 RAM分析采用的技术和软件、以及RAM指标在子系统中的分配等。分工界面:该文档由集
10、成商完成。3.5 RAM allocation report即RAM分配报告,描述如何把系统RAM指标分配至各个子系统,这里系统可以是指通信系统也可 以是指规模较大的子系统,如GSM-R子系统。RAM分配报告必须把可靠性计算的流程,使用的方 法呈现出来,不能只写结果。分工界面:由集成商完成,子系统提供商承接RAM分配结果。3.6 FMECA report即FMECA分析报告,通过FEMCA分析可以设备级的各种失效模式对实际业务的影响,识别的失 效模式按照危害高低进行分级,危害级别较高的需要指明规避措施。FMECA的另一个作用是作为 可靠性分析中故障树(FTA)的输入。FMECA的核心是建立故障
11、模式库,我司主要产品已经建立了 设备级别的故障模式库,我们需要把设备级的故障映射至系统级故障。分工界面:系统级FMECA报告由集成商出,子系统级别的FEMCA报告一般由设备提供商出。附件是来自无线可靠性能力中心的FMECA指导,该规范描述的是设备级FMECA规范,系统级可 以做参考:iZSI可靠性FMECA规范.doc3.7 RAM analysis & prediction & report即RAM预测报告,该报告计算各子系统的可靠性、可用性和可维护性,支撑集成商。我司虽然设 备级别的可靠性分析有丰富经验,但系统级别与设备级别有一定差别;在设备级一般使用马尔科夫 方法计算单板和设备级可靠性,
12、在子系统级别业界一般使用FTA、RBD等方法。本文档是RAM工 作的核心交付件。分工界面:集成商负责出解决方案级别报告,我司出具子系统级别报告或协助集成商完成报告。3.8 RAM demonstration plan & report即RAM演示计划和报告,在此文档之前所有交付件都是从理论角度计算解决方案可靠性,RAM演 示通过一段时间的现网运行验证前期RAM理论计算得到的数据,RAM演示时间一般是13年,测 试之前会有一段时间过渡期(“burn-in” period),在过渡期之内设备一定的失效是可以容忍的。分工界面:为保持独立性,一般不允许设备商测试自己的系统,由集成商做测试并与业主进行必
13、要的沟通,我 司做配合。3.9 Life Cycle Cost (LCC) analysis & report即生命周期分析,类似电信领域的TCO分析。LCC对解决方案的生命周期成本进行估算,目的是 证明解决方案通过提供高RAM使整个生命周期的成本达到了最优。其如下图所示,提供高可靠解 决方案会增加CAPEX,优点是减少了 OPEX, LCC分析要证明生命周期成本最优。图表2 LCC与RAMS关系分工界面:般由集成商提供整体LCC报告,我司有可能需要提供子系统级别报告。3.10 RAM requirement verification & validation report即需求响应和验证报告
14、,针对标书需求逐条答复满足方式和结果。分工界面:一般由集成商提供整体报告,我司有可能需要提供子系统级别报告。3.11 Defect Report Analysis & Corrective Action System (DR AC AS)DRACAS是一个故障搜集和修改系统的IT系统,类似于我司的问题单系统,对项目实施中的故障 进行记录以便进行问题跟踪和回归并统计RAM值。分工界面:由集成商提供统一系统,我司不提供。3.12 Safety 相关安全相关部分包含一系列安全相关文档,比如PHA、SHA等,我司无特殊情况不参与和做承诺,由 集成商做必要的安全分析。Q NOTE通常集成商已经把通信系统
15、列为非安全相关系统,不需要华为自证;但是部分项目中,业主希望华 为用安全分析证明通信系统是非安全相关。我司原则是不牵涉安全部分内容,因此这部分交付还在 评估中,建议引导集成商去做这部分工作。3.13 小结RAMS包含一系列流程和交付件,主要分为RAM部分和Safety部分。我司主要参与RAM部分需 要设备提供商完成的文档,Safety部分原则上不参与和承诺。4 RAM部分典型计算案列介绍4.1 计算流程介绍图表3典型RAMS计算流程上图是遵循EN 50126标准的RAM计算典型流程,虚线描述的交付件和流程为可选。首先进行系统 定义和分解,随后分别进行FMECA分析和可靠性分析。FMECA分析的
16、结果也可以作为FTA分析 输入进行可靠性计算,识别出的高危故障模式需要在Hazard Log里记录,最后形成FMECA reporto 可靠性计算先进行系统建模,然后使用特定方法(RBD, FTA, Markov等)计算RAM值,最后形 成报告。NOTE很多项目需要我司使用业界通常软件,如Isograph AWB,提交交付件,这样交付件格式和内容可以 和集成商对齐,目前企业无线已经建立该能力。其它产品线还未使用该软件,下文案例使用传统计 算方式,软件使用方法后续更新。版权所有华为技术有限公司2013o保留一切权利。非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不
17、得以任何形 式传播。商标声明Z切晶晶和其他华为商标均为华为技术有限公司的商标。本文档提及的其他所有商标或注册商标,由各自的所有人拥有。注意您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、 服务或特性可能不在您的购买或使用范围之内。除非合同另有约定,华为公司对本文档内容不做任何明 示或默示的声明或保证。由于产品版本升级或其他原因,本文档内容会不定期进行更新。除非另有约定,本文档仅作为使用指导, 本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。华为技术有限公司地址:深圳市龙岗区坂田华为总部办公楼 邮编:518129网土止:客户服务邮箱: 客户服务
18、电话: 0755-28560000 4008302118客户服务传真:0755-285601114.2 系统描述如上图所示,传输系统由station A, station B, station C和station D组成一个环,每个站配置一台 OSN 3500作为传输节点,节点间使用两条10G链路作为1 + 1备份,业务从A点接入,从C点下行, 为了简化计算4个站点都需配备了冗余业务板。每个节点的OSN 3500配置相同,如下图所示:表格4每个节点的设备配置表类型单板编码描述数量Power ModuleSSN1PIUAPower Module2System UnitSSN3PSXCSAOSN
19、3500-200G TDM and 100G PacketSwitching and Synchronous2SDH interfaceunitSSN2SL16ASTM-16 Optical Interface Board(L-16.1,LC)2Ethernetinterface unitSSN2EGT22 x GE Ethernet transparent transmission board2Monitor BoardSSN2SLD4Tandem connection monitor1Switch boardSSN2PEX11 GE Ethernet board2Switch boardS
20、SN1PEG88 GE Ethernet board1PDH BoardSSN2PQ1B63xEl Service Processing Board(120ohm)2Switch boardSSN1D75S32 x El electrical interface switching board4Q NOTE计算可靠性的衡量标准是“单板失效是否会导致业务失效”,因此计算之前必须对各个单板的作用进 行了解。4.3 系统分解系统分解是把各个子系统按照树状分解至单板级别,这样各个子系统的边界和子系统包含的设备配 置就能清晰表达出来,EN 50126-3也给出了系统分解模板。为了给下一步RAM分析做好准
21、备工作, 每个级别的项目都必须编号并写明数量。本例的系统分解如下:表格5系统分解表Telecommunication System BreakdownItem levelItem IDItem descriptionQty11MSTPTransmission121.1OSN3500Main Node33PIUPower Module63PSXCSAOSN 3500-200G TDM and 100G PacketSwitching and Synchronous63SL16STM-16 Optical Interface Board (L-16.1,LC)63EGT22 x GE Ethern
22、et transparent transmission board63SLD4Tandem connection monitor33L1.6PEX11 GE Ethernet board63PEG88 GE Ethernet board33PQ1B63xEl Service Processing Board(120ohm)63D75S32 x El electrical interface switching board124.4 可靠性框图(RBD)系统分解使整个系统的边界和配置比较清晰,下一步建立系统模型,这里我们使用常用的可靠性框 图(Reliability Block Diagram)
23、。注意可靠性只涉及“业务”可靠性,因此只要把和最终业务相关的 单板画上去即可,如维护单板等与最终业务不强相关的单板可以不加。同时要注意串联的单板不要 太多,否则会影响整体的可用度和可靠性指标。图表5子系统级RBD图上图所示的是传输系统的RBD图,A和C点是业务节点,它们的失效会导致业务失效,因此它们 是串联关系;B和D是中间节点,只有当B和D同时失效时业务才会失效,因此它们是并联关系。图表6设备级RBD图设备级RBD如上图所示,冗余单板使用并联状态描述,其余单板进行串联。QQ NOTE在分析RBD模型时一定要顺着业务主线,只计算与业务背景相关的单板,比如风扇和维护单板的失 效不影响整机业务就不
24、必加入。4.5 可靠性计算下面计算可靠性的三个指标:MTTR, A,和MTBFo MTTR是根据历史经验和客户需求制定的,如 只计算设备单板更换时间一般为0.5h,若包含设备运输和管理流程时间一般为L02h。在本例中所 有单板的MTTR都设定为1小时子系统级的MTTR也为1小时。设备级的MTBF和A可以从单板级别的可靠性和可用性数据算出,首先计算E1接口板的支路RAM 值,两条支路互为冗余,可以先计算单条支路。蓝色部分表格内容自动计算得出,白色部分需要手 动填入,所有单板失效数据可由产品线获取(一般随产品文档发布在3ms上)。C是倒换成功率,仅 对有冗余备份的单板有效,一般设置为0.9;n是单
25、板冗余数,在设备级计算时会用到。分支RAM 值中的DT (Down time)是指系统每年失效的时间。UnitFailure RateMTBF(hrs)MTBF(yrs)IVTTTR(h)Cn单元A冗余后的ASSN1P1QB1222.0818330.693.410. 910.999998780.99999878SSN1D75S355.32814522.9321.310.910.999999640.99999964SSN1D75S355.32814522.9321.310.910.999999640.99999964没有冗余 没有冗余 没有冗余表格6分支路径RAM计算分支RAM值AMTBF (y
26、rs)DT (min)0.99999806759. 071. 02接着计算设备级的RAM, 1 + 1冗余链路在设备级计算时体现。单站OSN 3500在次配置下的可用性 是5个9, MTBF是32年,MTTR与单板一样为1小时。对于铁路领域的传输产品来说,可用度5 个9几乎是最低要求,对应MTBF一般在20年以上。在本例中由于单节点上配置的业务很多,导 致单设备配置了较多业务单板,所以设备级的可靠性较低,可用度也刚刚在可接受范围内,建议每 个节点配置网元级冗余以提高网元可靠性。.表格7设备级RAM计算UnitFailure RateMTBF(hrs)MTBF(yrs)lATTR(h)Cn单元A
27、冗余后的ASSN1PIUA314.23182686.2363.310. 910.99999970.999999969SSN3PSXCSA1294.9772260.488.210. 910.99999870.999999871SSN2SL16A1288.8775915.688.610. 910.99999870.999999871SSN1PEX11630.7613233.670.010. 910.99999840.999999837SSN2EGT21333.0750187.585.610. 910.99999870.999999867SSN1P1QB+SS N1D75S1932.5517453.
28、759.110. 910.99999810.999999807SSN2SLD41338.4747160.885.310. 910.99999870.999998662SSN1PEG81440.6694155.279.210. 910.99999860.999998559n + 1主备用n + 1主备用n + 1主备用n + 1主备用n + 1主备用n + 1主备用没有冗余没有冗余设备RAM值:AMTBF (yrs)MTBF (hrs)MTTR(hrs)0.99999644232. 08281022.991. 00最后计算子系统级RAM,计算方法与设备级类似,可以看到计算结果为5个9可用度,MT
29、BF为 29年,还在可接受范围内。表格8子系统级RAM计算UnitFailure RateMTBF(hrs)MTBF(yrsMTTR(h)Cn单元A冗余后的AStation A3558.4281023.032.110.910.9999964420.999996442Station B+Station D3558.4281023.032.110.910.9999964420.999999644Station C3558.4281023.032.110.910.9999964420.999996442没有冗余n+1主备用没有冗余组网级RAM:AMTBF (yrs)MTBF(hrs)MTTR (hr
30、s)0.99999608629. 16255474. 691.00以上是RAM计算的主要流程和计算方法,需要注意的是一篇完整的交付件不仅仅是数字和公式的 堆砌,客户往往要求把计算过程、所做的假设和原始数据等重要中间过程一并列上,因此使用一套 专业的软件显的尤为必要;另外,如果计算结果达不到业主的需求你,必须对设计方案进行回归, 比如每个站点配置冗余设备等。设备可靠性指标预 计工具(模板).xls5参考标准5.1 常用外部标准1. EN 50126: Railway Applications - The Specification and Demonstration of Reliability
31、, Availability, Maintainability and Safety (RAMS).说明:EN 50126是铁路基础标准,涵盖了铁路行业RAMS的各个方面。2. MIL-HDBK-217F, Reliability Prediction Of Electronic Equipment.3. MIL-STD-1629A, Military Standard Procedures for Performing a Failure Mode Effects & Criticality Analysis4. IEC 61078:2006, Analysis techniques for
32、 dependability - Reliability block diagram and Boolean methods.5. IEC 61025:1990, Fault Tree Analysis (FTA)6. IEC 61165:2006, Application of Markov techniques 说明:上述几个标准是几种分析方法的标准7. Telcordia SR-332: Reliability Prediction Procedure for Electronic Equipment 说明:此标准是工业界电子设备可靠性预计的通用标准5.2 常用内部标准1. 可靠性FME
33、CA计算规范2. 设备可靠性预计方法规范3. 企业网可靠性答标FAQ V 1.04. 企业无线RAMS条款答复建议企业网络可靠性答标FAQ VI. 0. docx6附录6.1 EN 50126定义的责任矩阵Customer/OperatorApprovalAuthority(Main) ContractorSubcontractorSuppliersConcept PhaseXSystem Definition & Application ConditionsXRisk AnalysisXXSystem RequirementsX(X)Apportionment of System Requi
34、rements(X)XDesign and ImplementationX(X)ManufactureXXXInstallationX(X)System ValidationXXX(X)System acceptanceXXOperation and MaintenanceX(X)(X)Performance MonitoringX(X)(X)Modification and RetrofitXXXDe-commissioning and DisposalX(X)where,X full responsibility and participation(X) specific responsi
35、bility and/or partial participation (e.g. on sub-contract or on standby basis)图表7 EN 50126定义的RAMS责任矩阵上图是EN 50126定义的RAMS责任矩阵,我司作为设备提供商(Sub-contractor)需要支持和负责 输出的交付件请见上图。6.2可靠性定量分析方法可靠性可以通过定性和定量两种方式进行分析。定性分析的主要手段是FEMCA,本章不展开讨论。 定量分析的主要手段是故障树分析(fault tree analysis, FTA),可靠性框图(reliability block diagrams
36、, RBD),和马尔科夫分析(Markov analysis, MA)。不同方法适用于不同场景,每种方法都有自己的 优点和缺点,下面对三种方法进行介绍。621故障树(FTA)故障树分析(FTA)是一种自顶向下的识别系统故障的方法,用来帮助人们发现复杂系统中的设计问题。 它非常适合找出造成问题的多个故障,有助于一次分析一种类型的故障,且有助于发现系统的哪一 部分与特定的故障有关。故障树是一种“失效域”工作方法,而可靠性框图(RBD)工作在“成功 域。图表8故障树分析举例故障树是一种特殊的倒立树状逻辑因果关系图,它用事件符号、逻辑门符号和转移符号描述系统中 各种事件之间的因果关系。逻辑门的输入事件
37、是输出事件的“因“,逻辑门的输出事件是输入事件的” 故障树中的根节点称为“顶事件”,它是导致危害的直接原因,如上图中的“火灾”。 故障树中的叶子节点称为“基本事件它通常被认为是故障的根源,如上图中的“燃料泄漏” 和“燃料溢出”。图表9与门故障树计算案例以上图为例,与门当所有输入都存在时,输出才被激励。如果有多个输入A1,A2An,那么输出事 件发生概率为:P(A1 A A2 G n An)= P(A1) XP(A2)-X P(An)例如上图所示,假设电池系统故障概率为0.01,市电故障概率为0.0001,那么电源系统故障概率1 = 0.01X0.0001=0.000001实际系统的故障树原比例
38、子所庞大,可用工业软件进行计算和建模。故障树分析是基于故障模式的,因此FTA依赖于完整的故障模式库和失效数据;如果对故障模式遍 历不完整,那么计算所得的故障率也会与实际偏离较多,实际应用中FTA经常与FMECA一起使用, 由FMECA定性分析得出重要的故障模式,由FTA进行定量分析得出系统可靠性。但当系统较复杂 时,故障树也会非常庞大,必须借助软件执行。附件是对FTA方法的一些介绍:为故障树分析(FTA)介绍.ppt622可靠性框图(RBD)可靠性框图(RBD)把系统的各部件用图形形式表达出来,系统中各部件的冗余、串联、并联关 系都可以使用RBD表示。在模型建立之后,由各部件的可靠性、可维护性
39、值计算得出系统级的可 靠性数据。PARTPART 2dPART 斗图表10串联模型的RBD图以串联系统为例,由于部件与部件之间相互独立,部件n是否故障定不会影响其他的部件,假设n 个部件每一个部件的可用度都是a,则系统的可用度为:NNNas=riAi =ripi=ria=aNi=li=li=l图表11并联系统的RBD图考虑并联系统,由于根据并联模型的定义,只需要有一个部件正常,系统即可用,而N个部件是否 可用并不是互斥事件,因此不能用公式1计算,而必须用公式2或公式3进行计算,这样求解需要考 虑两个或多个事件同时发生的概率,非常麻烦。但换一个角度分析,从不可用度进行分析,并联 模型指的是当且仅
40、当所有的部件都不可用时,系统不可用,故相应的不可用度和可用度分别为:_ N _ NAs =_jAi =(1 - a) =(1 - a)” i=li=lAs =1-AS =l-(l-a)NRBD模型的优点是非常直观,通过简单理解就可以上手,在分析简单和中等规模的系统可靠性中 应用广泛。但是当系统组网非常复杂时,建立RBD模型非常复杂;另外,RBD在计算可靠性时不 考虑系统的可维护性,也不考虑失效系统的维修性,换句话说RBD只是针对部件的模型,而不考 虑部件所处的不同状态,因此通常在系统级的分析中使用,对设备级的分析一般使用FTA和Markov 方法更精确。RBD模型在冗余系统分析中的应用分析VR
41、BD在业界和我司应用非常广泛,参考资料非常多,附件是选取的一些资料:SP_2_4_CiscoExpol STN_High_Availabi O_Availability. pd lity. pdf6.2.3 Markov 分析Markov分析通过分析系统的各种状态,以及状态间相互迁移的概率得出系统的可靠性、可用性等 一系列指标(学过随机过程的同事可以联想下马尔科夫过程,本质是一样的)。如下图所示,马 尔可夫模型仅使用2种符号(圈和带目的箭头的转移弧),圈表示马尔可夫过程的状态,转移弧表 示状态迁移,从一个状态到另一个状态的迁移是按照一定概率(曲 来进行的,如下图所示。轨道交通RAMS介绍和计算
42、白皮书41RAMS 介绍61.1 RAMS 概念62 RAMS指标定义72.1 可靠性(Reliability) 72.2 可用性(Availability) 82.3 可维护性 (Maintainability) 92.4 安全性(Safety) 103 RAMS铁路项目答标指导113.1 RAMS在全生命周期中的位置113.2 总体策略123.3 RAM Assurance Requirements Specification123.4 RAM plan/RAM programme133.5 RAM allocation report133.6 FMECA report133.7 RAM
43、analysis & prediction & report143.8 RAM demonstration plan & report143.9 Life Cycle Cost (LCC) analysis & report143.10 RAM requirement verification& validation report153.11 Defect Report Analysis & Corrective Action System (DRACAS ) 153.12 Safety 相关163.13 小结164 RAM部分典型计算案列介绍174.1 计算流程介绍174.2 系统描述184
44、.3 系统分解194.4 可靠性框图(RBD) 204.5 可靠性计算215参考标准23图表12 Markov模型根据马尔可夫模型可以求出各种不同的可靠性与安全性指标,可以计算出一定时间内连续正常工 作的概率。另外,它还可以计算在t时刻的可用率,也就是系统正常工作的概率。系统正常工作的 其它指标,如,MTTF (系统故障前的平均工作时间),也可以在马尔可夫模型上使用某种求解技 术来得到。由于计算过程复杂,Markov分析一般使用软件进行,具体计算例子请见附件。Markov分析的优点是分析结果精确,并且能对系统的各种状态进行建模,比如设备的三块业务单 板进行非均衡业务分担,每个单板的失效率和单板承受业务成正比,这种情况下Markov分析只需 要对原有模型的迁移概率进行修改即可,而使用RBD和FTA分析非常麻烦。Markov的缺点是当系 统庞大的时候状态就变得非常多,模型建立很困难。在业界,Markov方法一般应用在设备级的可 靠性预计和一些特殊场景,如存储设备可靠性计算等场景。Fl冗余系统的可用性和安全性计算一一工我司在可靠性领域有深厚积累,设备级计算可参考:设备、可靠性指标预计方法介结.doc5常用外部标准235.2 常用内部标准236附录246.1 EN 50126定义的责任矩阵24