鸡毛蒜皮之五:可靠性设计 ( x. d# q9 W& j- P8 R* [1 ~ Z
现象一:这块单板已小批量生产了,经过长时间测试没发现任何问题。 2 Z+ ^0 h1 G! J) O9 W' l8 @
点评:硬件设计和芯片应用必须符合相关规范,尤其是芯片手册中提到的所有参数(耐压、I/O电平范围、电流、时序、温度PCB布线、电源质量等),不能光靠试验来验证。公司有不少产品都有过惨痛的教训,产品卖了一两年,IC厂家换了个生产线,咱们的板子就不转了,原因就是人家的芯片参数发生了点变化,但并没有超出手册的范围。如果你以手册为准,那他怎么变化都不怕,如果参数变得超出手册范围了还可找他索赔(假如这时你的板子还能转,那你的可靠性就更牛了)。 @( g( i, V6 R2 P
现象二:这部分电路只要要求软件这样设计就不会有问题 8 `* F/ ?, {0 X% }7 i
点评:硬件上很多电气特性直接受软件控制,但软件是经常发生意外的,程序跑飞了之后无法预料会有什么操作。设计者应确保不论软件做什么样的操作硬件都不应在短时间内发生永久性损坏。 n8 T4 s1 F: N
现象三:用户操作错误发生问题就不能怪我了。 : q5 i/ k5 f3 o0 l" {. ^) e
点评:要求用户严格按手册操作是没错的,但用户是人,就有犯错的时候,不能说碰错一个键就死机,插错一个插头就烧板子。所以对用户可能犯的各种错误必须加以保护。
! }5 N+ q& D0 f9 o$ _
$ R6 m; n9 ?7 Q; G) D8 \; _
现象四:这板子坏的原因是对端的板子出问题了,也不是我的责任。 ) W7 K, u& g! w/ Y7 t8 {* k
点评:对于各种对外的硬件接口应有足够的兼容性,不能因为对方信号不正常,你就歇着了。它不正常只应影响到与其有关的那部分功能,而其它功能应能正常工作,不应彻底罢工,甚至永久损坏,而且一旦接口恢复,你也应立即恢复正常。
( r) |- M- D+ N% _1 B |