《如何正确理解MTBF.docx》由会员分享,可在线阅读,更多相关《如何正确理解MTBF.docx(3页珍藏版)》请在第一文库网上搜索。
1、如何正确理解MTBF2023-04-2310:57MTBF(平均故障间隔时间)是可靠性领域最为常用的指标之一,但对这个指标的理解和使用尚存一些误区,本文就结合个人的一些经验粗略谈一下这个问题。一、将MTBF简单的等同于寿命虽然美军标338中将MTBF也称为平均寿命,但这个平均寿命与我们通常所理解的寿命不是一个概念。而对于”寿命,可以说又是一个让人头疼的指标。我在华为的时候专门写过一篇文章,论述寿命这个概念。之所以如此,是因为经常有客户会提寿命指标要求,如要求某个通讯网络设备寿命不得小于20年。每当此时,我们都非常为难,因为对于电子设备,尤其是可修的电子设备,寿命的定义是非常模糊的。简而言之,对
2、于处于浴盆曲线底部(偶然失效期)的电子产品,不宜采用寿命指标,而更倾向于采用MTBF;而对于处于耗损失效期的产品,更适合采用寿命指标。包括很多的机械结构类产品,以及具有耗损特性的电子产品,如一些类型的存储器、连接器等,有读写、插拔次数的要求。二、MTBF是统计意义的概念所谓统计意义,就是说它是基于一定数量的样本的,不能简单的归结于某个个体的指标。就好像说中国人的平均寿命是80岁,并不代表每个人都能活到80岁。再比如最近经常谈到的人均工资,很多人看了都喊自己拖了后腿,这种实际感觉与公布的指标间的巨大差异,实际上就是没有很好的理解统计意义上的样本母体与个体间的关系。三、MTBF的价值更多体现在它的
3、相对性尤其是我们在研发阶段预计得到的MTBF,最好不要拿它去与产品实际运行的可靠性相对应,两者存在很大的差异是非常正常的。一方面,现在的电子元器件,相对以前可靠性水平已经大幅提高,尤其是在遵循可靠性理论下正确选型、应用,采用筛选剔除早期失效而进入浴盆曲线偶然失效期以后,其失效率水平可以控制在极低的水平,即使很多非常复杂的芯片,其失效率水平也不超过几十FITs(IFIT=10-9/小时),对于一般复杂度的单板,这样算下来失效率顶多几千FITs,取倒数得到MTBF数十年甚至上百年很正常。但我们同时要认识至I1我们在做这个预计时,没有将现场运行中所能遇到的各种条件、应力都考虑进去,或者说我们的预计是
4、一种相对非常理想条件下计算得到的结果。更何况,我们的预计很多仅局限于硬件,还有其它的如软件、人为因素等导致的故障都没有考虑进去,预计得到的MTBF结果与现场实际的可靠性存在较大差异是必然的。那么既然不准为什么还要算它呢?其价值更多体现在它的相对性。比如两种设计方案的比较,我们不要忽视这种比较的价值,在现实工程当中其实是非常有意义的。有时没有一个具体的量值来支持,是很难做出合理决策的,因为很多的方案论证都是需要权衡取舍的,我增加了这种设计,可靠性能提高多少?从增加设计的复杂度和成本的角度,这样做到底值不值得,都需要有个数据来支撑,而不能只是含糊的说,这种方案的可靠性高,那种可靠性低。四、MTBF
5、指标是有前提条件的其实任何一个指标都是有其前提条件或假设的。比如汽车的油耗指标,通常我们都认为厂家公布的指标不准,过于乐观,有过度宣传甚至欺诈的嫌疑。比如厂家公布的某型号汽车油耗指标是6升/百公里,我们实际上开下来通常都会比这个要高,有的甚至高出很多,于是反过来质疑厂家。但其实我们忽略了这个指标的前提条件,即它是在怎样的路况、速度和驾驶行为下测得的数值,而我们实际驾驶过程中很难达到它设定的那种理想状况,指标存在差异再正常不过。但厂家为什么还要公布这种看似没有实际意义的指标呢,其实就是上面所提到的相对性,不同型号、厂家的汽车都采用相同的前提条件下的指标,于是指标就有了可上匕较性,消费者才能知道谁家的车更省油,哪个型号的车更费油。从而基于这种比较做出购买决策,就像上面提到的设计方案选择一样。总之,MTBF是表征产品可靠性的一个常用的重要指标,但需要我们正确的理解它,认识到它的应用场景和局限性。其实不仅是MTBF这一个指标,很多可靠性的概念、方法都是如此,只有这样才能正确的应用这些概念和方法,为提升我们产品的可靠性服务。