系统可靠性是系统在规定的时间内及规定的环境条件下完成规定功能的能力,也就是系统无故障运行的概率。这里的故障是系统行为与需求的不符,故障有等级之分。
系统故障模型
系统故障是指由于部件的失效、环境的物理干扰、操作错误或不正确的设计引起的硬件或软件中的错误状态。错误(差错)是指故障在程序或数据结构中的具体位置。错误与故障位置之间可能出现一定距离。故障或错误有如下几种表现形式:
(1)永久性。描述连续稳定的失效、故障或错误。在硬件中,永久性失效反映了不可恢复的物理改变。
(2)间歇性。描述那些由于不稳定的硬件或变化着的硬件或软件状态所引起的、仅仅是偶然出现的故障或错误。
(3)瞬时性。描述那些由于暂时的环境条件而引起的故障或错误。
故障模型是对故障的表现进行抽象,可以建立如下4个级别的故障模型。
(1)逻辑级的故障模型。逻辑级的故障有固定型故障、短路故障、开路故障和桥接故障。固定型故障是指电路中元器件的输入或输出等线的逻辑固定为0或固定为 1,如某线接地、电源短路或元件失效等都可能造成固定型故障;短路故障是指一个元件的输出线的逻辑值恒等于输入线的逻辑值,元件的开路故障是元件的输出线悬空,逻辑值可根据具体电路来决定;桥接故障是指两条不应相连的线连接在一起而发生的故障。
(2)数据结构级的故障。故障在数据结构上的表现称为差错。常见的差错有独立差错(一个故障的影响表现为使一个二进制位发生改变)、算术差错(一个故障的影响表现为使一个数据的值增加或减少 和单向差错(一个故障的影响表现为使一个二进制向量中的某些位朝一个方向改变)。
(3)软件故障和软件差错。软件故障是指软件设计过程造成的与设计说明的不一致软件故障在数据结构或程序输出中的表现称为软件差错。与硬件不同,软件不会因为环境应力而疲劳,也不会因为时间的推移而衰老。因此,软件故障只与设计有关。常见的软件差错有非法转移、误转移、死循环、空间溢出、数据执行和非法数据。
(4)系统级的故障模型。故障在系统级上的表现为功能错误,即系统输出与系统设计说明的不一致。如果系统输出无故障保护机构,则故障在系统级上的表现就会造成系统失效。
一般来说,故障模型建立的级别越低,进行故障处理的代价也越低,但故障模型覆盖的故障也越少。如果在某一级的故障模型不能包含故障的某些表现,则可以用更高-级的模型来概括。
系统可靠性模型
时间模型
时间模型基于这样一个假设:一个软件中的故障数目在 t=0时是常数,随着故障被纠正,故障数目逐渐减少。在此假设下,一个软件经过一段时间的调试后剩余故障的数目可用下式来估计
在并联系统中只有一个子系统是真正需要的,其余 n-1个子系统称为冗余子系统随着冗余子系统数量的增加,系统的平均无故障时间也增加了。