1.2 电子产品的可靠性

1.2.1 可靠性概述

1.可靠性的概念

可靠性是指产品在规定的时间内和规定的条件下,完成规定功能的能力。在这里,产品是一个非限定性的术语,既可以是一个装备系统,也可以是组成系统中的某个部件乃至元器件等。可靠性是产品质量的一个重要方面,通常所说的产品质量好,包含两层意思:一是达到预期的技术指标;二是在使用过程中很可靠。如果产品的技术指标先进,但可靠性差,就会失去实际使用价值。

1)规定的功能

产品的可靠性是以完成“规定的功能”来衡量的。一个产品往往具有若干项规定的功能,这里所说的完成规定的功能指全部,而不是其中一部分。产品只有完成规定的全部功能,才能被认为可靠。

2)规定的时间

规定的时间是可靠性定义的核心,因为离开时间就无可靠性可言,而规定时间的长短又随产品对象不同和使用目的不同而异。一般来说,产品经过老练后,有一个较长的稳定使用期,以后随着时间的延长可靠性下降,时间越长,可靠性越低。

3)规定的条件

规定的条件是产品完成规定功能的约束条件。它包括使用时的应力条件(电气的和机械的)、工作环境和维护条件、储存条件等。规定条件不同,产品的可靠性也不同。例如,同一个半导体器件,使用时的输出功率不同,其可靠性也不同。一般的规律是使用输出功率越小,其可靠性越高。又如,同一台电子产品在实验使用和在野外使用,其可靠性相差很大。一般来说,环境条件越恶劣,产品的可靠性越低。

产品在工作中常常因各种偶然因素,如元器件因突然损坏,应力(电负荷、温度、机械影响等)突然改变,维护或使用不当等的影响而失效。由于这些失效的原因具有偶然性,所以对某一个具体的产品,在规定的条件和时间内能否完成规定的功能,是无法预先知道的,这是一个随机事件。大量随机事件中,包含着一定的规律,随机事件发生的可能性大小可以用概率来表示,即我们虽无法准确地知道产品出现失效的时刻,但可以求出产品在规定的条件和时间内完成规定功能的概率,所以,产品的可靠性可以用概率的形式来表示。

2.可靠性的主要指标

1)可靠度(正常工作概率)

可靠度指产品在规定时间内,完成规定功能的概率,通常用Rt)表示。

式中 Rt)——产品在时间t内正常工作的概率;

N——试验样品数;

n——规定试验时间t内故障数。

试验样品按规定抽取,不可能无穷多,一般有足够的数量即可。其物理意义是:在试验总数中扣除产品故障数,亦即到某个试验期时,仍然完好的产品数与试验产品总数的比例,即完成产品(不失效)的概率。由于Rt)是一个概率,其值为

0≤Rt)≤1

在试验开始时,R(0)=1,产品全部完好,随着试验期的延长,Rt)<1,即出现了失效产品。试验一直延续下去,直到 R(∞)=0,产品全部到达寿命终止期。因此,Rt)越接近于1,表示可靠度越大。

2)故障率

故障率是指产品在规定条件下和规定时间内,失去规定功能的概率。通常用 Ft)表示。它与可靠度是对立事件。二者的关系是:

Ft)+Rt)=1

因此,Ft)越接近于1,表示产品故障率越高。

3)平均寿命

对于不可修复和可修复产品,其平均寿命有不同含义。对不可修复的产品,它是指产品失效前的工作或储存时间,记做MTTF(为Mean Time To Failure的缩写)。

式中 N——试验样品数;

ti——第i个产品无故障工作时间。

对可修复的产品而言,平均寿命是指相邻两次故障间隔的工作时间的平均值,即平均无故障工作时间,记做MTBF(为Mean Time Between Failure的缩写)。

式中 T——总运行时间;

n——故障的次数。

4)失效率(瞬时失效率)

失效率是指产品工作到t时刻后的一个单位时间(tt+1)内的失效数与在t时刻尚能正常工作的产品数之比,用λt)表示,即

式中 N——试验样品数;

nt)——到时刻t时的失效数;

ntt)——t时刻后,在Δt时间间隔内失效数。

失效率越低,产品的可靠性越高,λt)用单位时间的百分数表示。常用 100 万个元件工作1000小时后,出现一个失效元件,称为1菲特。

3.元器件可靠性

为了对电子产品或系统的可靠性进行分析研究,必须研究构成电子产品或系统的元器件的可靠性。

元器件的可靠性通常用经过大量试验而统计出来的失效率来表征。实践发现,普通元器件和半导体元器件的失效规律有相同之处,但也不完全相同。了解元器件失效规律,对于正确使用元器件,从而提高产品可靠性是很有益的。

1)普通元器件的失效规律

电阻器、电容器、继电器等普通元器件,在大量使用后,发现它们有相似的失效规律,如图1.2.1所示为典型普通元器件的失效率与工作时间的关系。这条关系曲线就是通常所说的船形或浴盆曲线。

图1.2.1 典型普通元器件失效曲线

早期失效期:由于设计、制造上的缺陷等原因,刚刚生产的产品在投入使用的前一段时间内,失效率比较高,这种失效称为早期失效,对应的这段时间叫早期失效期。通过对原材料和生产工艺加强检验和质量控制,可以大大减少早期失效比例。在生产中对元器件进行筛选老化,可使其早期失效大大降低,以保证筛选后的元器件有较低的失效率。

偶然失效期:产品因偶然因素发生的失效叫偶然失效。产品在经过早期失效期后,元器件将进入正常使用阶段,其失效率会显著地迅速降低,这个阶段失效主要表现为偶然失效的时期叫偶然失效期,也称随机失效期。其特点是失效率低而基本稳定,可以认为失效率是一个常数,与时间无关。偶然失效期时间较长,是元器件的使用寿命期。正规化的生产厂商都要采用各种试验手段,把元器件的早期失效消灭在产品出厂之前,并把它们在正常使用阶段的失效率作为向用户提供的一项主要指标。

耗损失效期:产品在使用的后期,由于老化、疲劳、耗损等原因引起的失效叫耗损失效。发生耗损失效的时间叫耗损失效期,又叫老化失效期,其特点是失效率随时间迅速增加。到了这个时期,大部分元器件都开始失效,产品迅速报废。在电子产品中,所有元器件和组件都不能工作于耗损失效期。

2)半导体器件的失效规律

半导体器件的寿命长、稳定可靠,所以其失效特性有特殊的地方,如图1.2.2所示。从图中可以看出半导体器件的早期失效期和普通元器件相同,失效率随时间增加而迅速下降。其失效原因通常由于原材料的缺陷和工艺因素所引起。在偶然失效期,其失效率低且有随时间递减的趋势,这一阶段的失效率近似为常数,这是半导体器件的稳定工作的时期。半导体器件没有耗损失效期,即没有失效率随时间而增大的耗损失效阶段,这是其特殊性所在。类似半导体器件的失效规律的元器件还有固体钽电解电容器。

图1.2.2 典型半导体器件失效曲线

3)元器件的可靠性计算

一般元器件的可靠性通常用经过大量试验统计得出的失效率来表征。由于元器件都工作在偶然失效期,其失效率为常数,即

λt)=λ=常数

则可靠性用可靠度Rt)表示为

上式说明了正常工作概率(可靠度)在时间上是按指数衰减的。

4)使用条件对元器件可靠性的影响

元器件的使用条件包括工作环境条件和负荷条件。工作环境条件不同元器件的失效率变化很大,有时可相差几百倍,一般地说,所处的条件越恶劣,其失效率越大。

4.产品或系统的可靠性

一个产品或复杂的系统可以看成是由若干个子系统或部件组成的,而每个子系统或部件又由许多元器件组成。我们可根据元器件的可靠性求得系统的可靠性,也可根据系统的可靠性要求分配各子系统的可靠性。

系统和子系统之间的可靠性关系可以分为串联系统和冗余系统(备份系统)两大类。

1)串联系统

串联系统是由所有的子系统串联而成的,如图1.2.3所示。它的特点是:只要其中一个失效,系统就失效。如果这些子系统是相互独立的,即某一子系统的失效对其它子系统没有影响,根据概率论的乘法定理,串联系统的可靠性等于各子系统可靠性的乘积。

图1.2.3 串联系统

2)冗余系统

冗余系统也称为备份系统,采用冗余系统可提高可靠性水平,但增加了系统的体积和重量,增加成本和复杂性,一般只在极端重要的场合才使用,或者在元器件可靠性满足不了系统的要求时采用。

冗余系统有三种形式:并联系统、待机系统和表决系统,如图1.2.4所示。

图1.2.4 冗余系统

并联系统是最常用的冗余系统,如图1.2.4(a)所示。由若干子系统(或元件)A1、A2、…、An 并联组成系统 C。它的特点是:只要系统中任一子系统(或元件)可靠,则系统可靠,只有所有子系统(或元件)全部失效时,系统才失效。

根据概率论的加法定理,可以得到两个子系统(或元件)并联的可靠度为:

R(C)=R(A1)+R(A2)-R(A1·A2)

待机系统如图1.2.4(b)所示,这种系统中的备份系统(或元件)在平时处于非工作状态,一旦主要子系统(或元件)出现故障后,备份子系统(或元件)才投入工作。这种系统一般要装有失效报告装置和开关转换装置,系统发生故障时才能自动转换备份子系统(或元件)。

表决系统如图1.2.4(c)所示,这是一种比较特殊的冗余系统。图示为 2/3 表决系统,三个相同的子系统或元件(A1、A2、A3)并接于 2/3 表决开关上,A1、A2、A3 同时将输出信号加给 2/3 表决开关,当表决开关接收两个或三个信号时,系统就能可靠地工作,因此,当任一个子系统(或元件)发生故障时,系统仍能可靠地工作。

5.可靠性与经济性关系

为了提高产品的可靠性,就要在材料、工艺、设备和管理等方面采取相应措施,这就导致生产和科研费用的增加,但使用维护费用却随着可靠性的提高而降低,因而总的费用却不一定增加。如果可靠性指标定得适当,总费用可达最低水平。反之,若可靠性指标低,就必须增大使用和维修费用,总费用可增加,使经济性变差。它们的相互关系可参见图 1.2.5所示。

图1.2.5 可靠性与经济性的关系曲线

1.2.2 提高电子产品可靠性的措施

1.从产品设计制造方面提高可靠性

1)简化设计方案

从系统可靠性的角度来看,系统愈复杂,所用的元器件愈多,则系统的可靠性就愈低。因此,在满足系统性能要求的前提下,应尽可能简化产品的设计方案。

2)正确选用元器件

电子产品的硬件故障大都直接以元器件的各种损坏或故障的方式表现出来。一方面是由于元器件本身的缺陷造成的,而另一方面是对元器件选用不当所致。因此产品在生产中要正确选用元器件,选用元器件时应充分注意下列原则:

(1)根据电路性能的要求和工作环境条件选用合适的元器件,使用条件不得超过元器件电参数的额定值和相应的环境条件并留有足够的富余量。

(2)尽可能压缩元器件的品种和规格数,提高它们的复用率。

(3)除特殊情况外,所有电子元器件都应经过筛选后,才能用到产品中去。

(4)仔细分析比较同类元器件在品种规格、型号和制造厂商之间的差异,择优选用。

3)合理使用元器件

只有合理使用元器件,才能保证固有可靠性。元器件的工作电压、电流不能超额使用,应按规范降额使用。尽量防止元器件受到电冲击,装配时严格执行工艺规程,免受损伤。

4)电子产品的合理设计

(1)合理设计电路,尽可能选用先进而成熟的电路,减少元器件的品种和数量,多用优选的和标准的元器件,少用可调元件。采用自动检测与保护电路。为便于排除故障与维修,在设计时可考虑适当的监测点,以利查找与修复。

(2)合理地进行结构设计和严格生产制造工艺。产品在进行结构设计时,要充分考虑当前电子工业发展中的新工艺、新材料、新技术,尽可能采用生产中较为成熟的结构形式,有良好的散热、屏蔽及三防措施,防振结构要牢靠,传动机构灵活、方便、可靠,整机布局合理,便于装配、调试和检修。

2.从使用方面提高可靠性

(1)合理储存和保管。产品的贮存和运输必须按照规定的条件执行,不然的话,会在贮存和运输的过程中受到损伤。保管也是如此,必须按照规定的范围保管,如温度、湿度等都要保持在一定范围之内。

(2)合理使用。在使用产品之前必须认真阅读说明书,按规定条件操作。

(3)定期检验和维修。定期检验可免除仪器在不正常或不符合技术指标时给使用造成差错,也可避免产品长期带病工作以致造成严重损伤。