找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

巢课
电巢直播8月计划
查看: 5|回复: 0
打印 上一主题 下一主题

[硬件] 一个硬件高手的设计经验分享

[复制链接]

551

主题

1470

帖子

3万

积分

EDA365管理团队

Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9

积分
39487
跳转到指定楼层
1#
发表于 2019-9-27 15:09 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您!

您需要 登录 才可以下载或查看,没有帐号?注册

x
一:成本节约5 T- u3 w6 L; g  J* X
% L& Y& f+ t4 s$ E3 P8 v

# W8 D# V! ?, N现象一:这些拉高/拉低的电阻用多大的阻值关系不大,就选个整数5K吧
4 Q" B/ q; m: ~0 J2 i! e
# I5 I+ r6 }3 y2 m& S& G) o9 b' g! j1 ^: b* M5 w: x
点评:市场上不存在5K的阻值,最接近的是 4.99K(精度1%),其次是5.1K(精度5%),其成本分别比精度为20%的4.7K高4倍和2倍。20%精度的电阻阻值只有1、1.5、2.2、 3.3、4.7、6.8几个类别(含10的整数倍);类似地,20%精度的电容也只有以上几种值,如果选了其它的值就必须使用更高的精度,成本就翻了几 倍,却不能带来任何好处。, q7 r& u3 s/ A+ t: b  n7 H/ \
' _0 @# M, o4 Y, }5 G( U' }
& s7 S6 [# I1 U& G; x" D2 ?& w
现象二:面板上的指示灯选什么颜色呢?我觉得蓝色比较特别,就选它吧& y. N. o( ^* [7 j

" j, L8 Q7 o  C
- a3 W9 V; S9 i+ q& x4 O1 H点评:其它红绿黄橙等颜色的不管大小(5MM以下)封装如何,都已成熟了几十年,价格一般都在5毛钱以下,而蓝色却是近三四年才发明的东西,技术成熟度和供货稳定度都较差,价格却要贵四五倍。目前蓝色指示灯只用在不能用其它颜色替代的场合,如显示视频信号等。
+ w8 z# @* o* s4 Y& t, C0 K7 F( v" A/ E; p( U: ?+ h7 Y3 k1 z

! q1 a3 T( @# d" T现象三:这点逻辑用74XX的门电路搭也行,但太土,还是用CPLD吧,显得高档多了
! @5 b* i/ ]3 Z$ v' e' }/ U/ W  v6 X

/ L( v! `+ [5 C: X点评:74XX的门电路只几毛钱,而CPLD至少也得几十块,(GAL/PAL虽然只几块钱,但公司不推荐使用)。成本提高了N倍不说,还给生产、文档等工作增添数倍的工作。
' Q7 Z- P# M% R. q$ k3 Q
+ u8 ^+ s, |# L, l" T6 B
9 Q$ z, ]) Y: t( y5 @现象四:我们的系统要求这么高,包括MEM、CPU、FPGA等所有的芯片都要选最快的
+ K2 D8 L% Q, k9 \
$ G+ Q0 k( m1 Q: J  r) g
9 [4 S$ H3 J+ h9 M( s2 i( r点评:在一个高速系统中并不是每一部分都工作在高速状态,而器件速度每提高一个等级,价格差不多要翻倍,另外还给信号完整性问题带来极大的负面影响。6 v8 i6 z+ I0 `" A9 w( Y

5 M& Q8 B" x7 z( [* _  B
! t7 Z! _3 I( F  n5 z现象五:这板子的PCB设计要求不高,就用细一点的线,自动布吧
) z3 G9 B9 U1 n0 G
6 j; z; b5 V3 E& Q8 S
: g6 V: x4 W; d1 D. \& ~点评:自动布线必然要占用更大的PCB面积,同时产生比手动布线多好多倍的过孔,在批量很大的产品中,PCB厂家降价所考虑的因素除了商务因素外,就是线宽和过孔数量,它们分别影响到PCB的成品率和钻头的消耗数量,节约了供应商的成本,也就给降价找到了理由。
8 F/ [% H2 E' ]/ R: o& R, o! T' a- I- I, R6 K

: O7 }$ M% Y; G) `现象六:程序只要稳定就可以了,代码长一点,效率低一点不是关键
1 o) z2 b: ?8 T6 z% m
4 ~4 Y+ z4 x4 j( {
; M! E8 K  ~( C! h1 O* _% E点评:CPU的速度和存储器的空间都是用钱买来的,如果写代码时多花几天时间提高一下程序效率,那么从降低CPU主频和减少存储器容量所节约的成本绝对是划算的。CPLD/FPGA设计也类似。" q  D  t8 `9 Q. g1 o

/ Z7 ?: v6 M1 u- t3 J% f
0 I9 z) U) b8 r2 U: T; o. Q二:低功耗设计+ B6 Q7 N* G+ Z; I9 ^: B/ l& e* {' N* K

9 Y3 [3 @4 {# s
" D' Y( c. t9 u! h! W现象一:我们这系统是220V供电,就不用在乎功耗问题了. G  Z, V, _& S

  a8 L9 [$ M1 b2 E% r! D+ `+ a; r* ?. u
点评:低功耗设计并不仅仅是为了省电,更多的好处在于降低了电源模块及散热系统的成本、由于电流的减小也减少了电磁辐射和热噪声的干扰。随着设备温度的降低,器件寿命则相应延长(半导体器件的工作温度每提高10度,寿命则缩短一半). J' A3 A, Z" K5 ~( _$ h1 y) y

/ `; t9 ~$ v( h$ Y6 r8 S2 d% f# B' L/ y/ E* m; |' ?% E
现象二:这些总线信号都用电阻拉一下,感觉放心些
3 l2 @  U% _9 _  A$ n$ ?
2 `3 y/ ^( Y; E2 q8 i8 ]+ r
+ L$ ~# B! M2 j' H1 o6 B点 评:信号需要上下拉的原因很多,但也不是个个都要拉。上下拉电阻拉一个单纯的输入信号,电流也就几十微安以下,但拉一个被驱动了的信号,其电流将达毫安 级,现在的系统常常是地址数据各32位,可能还有244/245隔离后的总线及其它信号,都上拉的话,几瓦的功耗就耗在这些电阻上了(不要用8毛钱一度电 的观念来对待这几瓦的功耗)。0 Y: Q3 q* w" S, _9 Z

! C7 I1 V/ ~$ R5 c; r: d- z+ F0 {  \* _, _/ |9 V+ a
现象三:CPU和FPGA的这些不用的I/O口怎么处理呢?先让它空着吧,以后再说( ~; ?: W- Q2 g. f: Z; o

; V; G' a) }6 a% w
% H/ U, v! y* q, D8 }点评:不用的I/O口如果悬空的话,受外界的一点点干扰就可能成为反复振荡的输入信号了,而MOS器件的功耗基本取决于门电路的翻转次数。如果把它上拉的话,每个引脚也会有微安级的电流,所以最好的办法是设成输出(当然外面不能接其它有驱动的信号)
( x, t0 M: k" F" L5 G9 n  A
% X% w2 Y6 U! E( d
2 m: G; f% w/ e) j: h( V0 G现象四:这款FPGA还剩这么多门用不完,可尽情发挥吧
, w; H  J! p0 N) G
( t( J: r( h* c- ?. t; _0 C5 S  O0 U2 _% Z( ^
点评:FGPA的功耗与被使用的触发器数量及其翻转次数成正比,所以同一型号的FPGA在不同电路不同时刻的功耗可能相差100倍。尽量减少高速翻转的触发器数量是降低FPGA功耗的根本方法。
2 @- _( h5 J6 E" Y& ~8 N' y. t3 x$ ?# n3 w% J! ?
* q$ H' l8 @: U0 I0 Q
现象五:这些小芯片的功耗都很低,不用考虑1 S/ F# V4 Y2 a, ?, u* l! M

2 ]+ g! h* n: ?) Y" I: U$ o4 Q+ R$ O' Q$ H2 \
点 评:对于内部不太复杂的芯片功耗是很难确定的,它主要由引脚上的电流确定,一个ABT16244,没有负载的话耗电大概不到1毫安,但它的指标是每个脚可 驱动60毫安的负载(如匹配几十欧姆的电阻),即满负荷的功耗最大可达60*16=960mA,当然只是电源电流这么大,热量都落到负载身上了。
( R2 Q5 J" c, }0 m' B+ B0 a
2 q( v% f' d( W/ l
- N; _. L9 j4 W8 l6 L现象六:存储器有这么多控制信号,我这块板子只需要用OE和WE信号就可以了,片选就接地吧,这样读操作时数据出来得快多了。
( W5 d/ ~: J* _5 t, @+ M
) D, \  p- a% n) ~2 |* l: U$ Y; }; b' \( Y7 |
点评:大部分存储器的功耗在片选有效时(不论OE和WE如何)将比片选无效时大100倍以上,所以应尽可能使用CS来控制芯片,并且在满足其它要求的情况下尽可能缩短片选脉冲的宽度。0 w  d, Y$ Y6 E' m! W! c* l* E+ U
4 h9 I# b9 f6 |- y6 Q/ p( |

0 j3 J& U2 S9 S现象七:这些信号怎么都有过冲啊?只要匹配得好,就可消除了( [$ o' x0 l! i3 `
% u9 H2 L0 N) L
5 L1 N4 ^. o* @; H% ~  L
点 评:除了少数特定信号外(如100BASE-T、CML),都是有过冲的,只要不是很大,并不一定都需要匹配,即使匹配也并非要匹配得最好。象TTL的输 出阻抗不到50欧姆,有的甚至20欧姆,如果也用这么大的匹配电阻的话,那电流就非常大了,功耗是无法接受的,另外信号幅度也将小得不能用,再说一般信号 在输出高电平和输出低电平时的输出阻抗并不相同,也没办法做到完全匹配。所以对TTL、LVDS、422等信号的匹配只要做到过冲可以接受即可。
4 C) [0 L7 r" D. V
% e1 l' \! X- g+ f- V" }& i8 _. K8 j) T
现象八:降低功耗都是硬件人员的事,与软件没关系( R7 l7 |. M! c9 _
: Z* b' B% [/ _( F& a

9 s* v: X4 M% f7 ^+ j点 评:硬件只是搭个舞台,唱戏的却是软件,总线上几乎每一个芯片的访问、每一个信号的翻转差不多都由软件控制的,如果软件能减少外存的访问次数(多使用寄存 器变量、多使用内部CACHE等)、及时响应中断(中断往往是低电平有效并带有上拉电阻)及其它争对具体单板的特定措施都将对降低功耗作出很大的献。
9 H) Y; U# e: e/ u
" k( X. r. |7 p  G* P2 X8 |: \$ @4 g* A% |: w' z
三:系统效率
/ h7 O! s4 K  B$ i, v
& @4 j) J" ]4 C4 J* c' A- _* y9 `+ l4 I, s
现象一:这主频100M的CPU只能处理70%,换200M主频的就没事了
7 e0 s0 z7 c' i; A3 v8 Q3 n! c7 ~: \6 W1 D* c9 h

  h: D+ R# w  ]% W. T点评:系统的处理能力牵涉到多种多样的因素,在通信业务中其瓶颈一般都在存储器上,CPU再快,外部访问快不起来也是徒劳。  U+ P9 S  H; \9 L" W: x: C. ?& |
' N2 @6 P, i% S0 I, ^9 B' e4 r6 r" N

7 j0 t! A- Q, w- ?; J, T现象二:CPU用大一点的CACHE,就应该快了# d. {) J8 j  {- m' a8 e
$ H0 c- y, f& R% x, E

9 j1 z. T0 ]5 f% E* L9 c7 T1 x点 评:CACHE的增大,并不一定就导致系统性能的提高,在某些情况下关闭CACHE反而比使用CACHE还快。原因是搬到CACHE中的数据必须得到多次 重复使用才会提高系统效率。所以在通信系统中一般只打开指令CACHE,数据CACHE即使打开也只局限在部分存储空间,如堆栈部分。同时也要求程序设计 要兼顾CACHE的容量及块大小,这涉及到关键代码循环体的长度及跳转范围,如果一个循环刚好比CACHE大那么一点点,又在反复循环的话,那就惨了。; n  h9 S  ~$ w( d: ^
6 Q7 F$ O/ A/ F  ^/ s8 r0 b
; G& F5 }( [# v* L; G0 K% H
现象三:这么多任务到底是用中断还是用查询呢?还是中断快些吧. r  P, W+ ]1 u! q

1 ]* ]* r3 f, p
3 O; O" o) n; b; w" O2 ]点 评:中断的实时性强,但不一定快。如果中断任务特别多的话,这个没退出来,后面又接踵而至,一会儿系统就将崩溃了。如果任务数量多但很频繁的话,CPU的 很大精力都用在进出中断的开销上,系统效率极为低下,如果改用查询方式反而可极大提高效率,但查询有时不能满足实时性要求,所以最好的办法是在中断中查 询,即进一次中断就把积累的所有任务都处理完再退出。' W  s+ ~0 g% H  m5 J

% M( v, v8 c3 ~  I
+ ^: I+ Q, s3 P现象四:存储器接口的时序都是厂家默认的配置,不用修改的' z  }7 K1 I) v% ^& v" h1 x+ @
1 A& e) U1 I* K$ M" j6 x
/ h; g4 {9 L# [& ]' ?( C2 U
点评:BSP对存储 器接口设置的默认值都是按最保守的参数设置的,在实际应用中应结合总线工作频率和等待周期等参数进行合理调配。有时把频率降低反而可提高效率,如RAM的 存取周期是70ns,总线频率为40M时,设3个周期的存取时间,即75ns即可;若总线频率为50M时,必须设为4个周期,实际存取时间却放慢到了 80ns。
, y$ m( {# A4 O4 ~5 `2 m
8 p' Q. T8 ]- J
% r6 x1 y" I/ T4 A% _) i1 q现象五:一个CPU处理不过来,就用两个分布处理,处理能力可提高一倍9 F" Q8 |+ H; A( i+ V- |+ N, I
( }0 L. }: E! o) E
0 B7 H. r' s0 M+ N' ?7 i/ u  `( U% ]
点评:对于搬砖头来说,两个人应该比一个人的效率高一倍;对于作画来说,多一个人只能帮倒忙。使用几个CPU需对业务有较多的了解后才能确定,尽量减少两个CPU间协调的代价,使1+1尽可能接近2,千万别小于1。
; ^; O" u) a2 Y" `
# k  s3 ?4 D1 R- F. Z# x: R( M9 Y( z- t2 ]4 Q! p
现象六:这个CPU带有DMA模块,用它来搬数据肯定快! L$ H4 _* f& _, t& Q' d

4 f: z+ H) I% t3 k, P7 F2 r+ {  v; u0 v6 D4 ]: [! \! w
点 评:真正的DMA是由硬件抢占总线后同时启动两端设备,在一个周期内这边读,那边些。但很多嵌入CPU内的DMA只是模拟而已,启动每一次DMA之前要做 不少准备工作(设起始地址和长度等),在传输时往往是先读到芯片内暂存,然后再写出去,即搬一次数据需两个时钟周期,比软件来搬要快一些(不需要取指令, 没有循环跳转等额外工作),但如果一次只搬几个字节,还要做一堆准备工作,一般还涉及函数调用,效率并不高。所以这种DMA只对大数据块才适用。
# ~! o' Q) z4 x7 r* ?6 f0 b; b0 G6 U) J8 @

% X& i- R. `9 X0 f四:信号完整性
/ l7 h' n( I1 T) j* S5 O1 j8 L! i$ n& L

/ |( d9 m% X  }现象一:这些信号都经过仿真了,绝对没问题
. S4 B1 ^! ^8 C& M/ V8 O/ k6 Y
5 V6 H& e3 j+ ~, S$ ]4 M* s3 [0 o( {  M# ]5 \: C
点 评:仿真模型不可能与实物一模一样,连不同批次加工的实物都有差别,就更别说模型了。再说实际情况千差万别,仿真也不可能穷举所有可能,尤其是串扰。曾经 有一教训是某单板只有特定长度的包极易丢包,最后的原因是长度域的值是0xFF,当这个数据出现在总线上时,干扰了相邻的WE信号,导致写不进RAM。其 它数据也会对WE产生干扰,但干扰在可接受的范围内,可是当8位总线同时由0边1时,附近的信号就招架不住了。结论是仿真结果仅供参考,还应留有足够的余 量。
5 R0 e& @, a5 C9 q
  }7 ^- W0 d9 h. k' U' n0 ?4 Q; R2 X) `
现象二:100M的数据总线应该算高频信号,至于这个时钟信号频率才8K,问题不大8 {6 E6 Q5 K$ |$ R  a, }
& t- I$ [% V7 }0 T% y

7 s, e9 g" J2 ^. h2 E点评:数据总线的值一般是由控制信号或时钟 信号的某个边沿来采样的,只要争对这个边沿保持足够的建立时间和保持时间即可,此范围之外有干扰也罢过冲也罢都不会有多大影响(当然过冲最好不要超过芯片 所能承受的最大电压值),但时钟信号不管频率多低(其实频谱范围是很宽的),它的边沿才是关键的,必须保证其单调性,并且跳变时间需在一定范围内。
0 t9 L  G( V- \9 r, _2 P
& K* |$ ?+ Z! I4 m! ^: n# S6 v: Y5 G: e/ o) l
现象三:既然是数字信号,边沿当然是越陡越好
. I- b3 H+ }+ ^* ?5 R1 X' \9 w) d, M" }, [3 p0 w8 @. u. Z* C
9 y3 ?0 }" o, C7 ?3 `
点评:边沿越陡,其频谱范围就越宽,高频部分的能量就越大;频率越高的信号就越容易辐射(如微波电台可做成手机,而长波电台很多国家都做不出来),也就越容易干扰别的信号,而自身在导线上的传输质量却变得越差,因此能用低速芯片的尽量使用低速芯片。, ~! Z: k) W1 ^. P! `0 U
- |2 }% [* R2 p0 N

' x4 P- @, P' m; T+ f3 T现象四:为保证干净的电源,去偶电容是多多益善
8 l4 E* Y- P3 B" Q8 W; h# H% a! ?6 H' `# Y" e% h1 u0 y2 M7 g

: D- ]& e: _* m, C$ O点评:总的来说去偶电容越多电源当然会更平稳,但太多了也有不利因素:浪费成本、布线困难、上电冲击电流太大等。去偶电容的设计关键是要选对容量并且放对地方,一般的芯片手册都有争对去偶电容的设计参考,最好按手册去做。
4 q- L9 \! a3 f/ p! n" v5 b9 S; ]; m7 r6 D: z, c' H' u! F

: p- r- [! Y) r" y现象五:信号匹配真麻烦,如何才能匹配好呢?% M1 e6 Y. y2 \! O/ z$ l/ c
! O! V! P# _5 n6 B( h

1 `% \. u6 t0 m点 评:总的原则是当信号在导线上的传输时间超过其跳变时间时,信号的反射问题才显得重要。信号产生反射的原因是线路阻抗的不均匀造成的,匹配的目的就是为了 使驱动端、负载端及传输线的阻抗变得接近,但能否匹配得好,与信号线在PCB上的拓扑结构也有很大关系,传输线上的一条分支、一个过孔、一个拐角、一个接 插件、不同位置与地线距离的改变等都将使阻抗产生变化,而且这些因素将使反射波形变得异常复杂,很难匹配,因此高速信号仅使用点到点的方式,尽可能地减少 过孔、拐角等问题。
  G% ^: @+ |$ x& d! ^! S+ F  ]  u% c9 _: o3 _
1 x% i' ]; C) l8 y1 @) x0 i7 q
五:可靠性设计
1 c4 X  b; g) C+ T( ^$ D4 Y+ B6 W+ z& e  A9 Y* k* A: ]& X  m

/ X' \) K! w6 N3 h6 y7 q" i5 R+ R现象一:这块单板已小批量生产了,经过长时间测试没发现任何问题$ k. t5 r2 q- t9 J
4 k6 v2 d, F- j! m3 I

: l) }  i9 e- ^点评:硬件设计和芯片应 用必须符合相关规范,尤其是芯片手册中提到的所有参数(耐压、I/O电平范围、电流、时序、温度PCB布线、电源质量等),不能光靠试验来验证。公司有不 少产品都有过惨痛的教训,产品卖了一两年,IC厂家换了个生产线,咱们的板子就不转了,原因就是人家的芯片参数发生了点变化,但并没有超出手册的范围。如 果你以手册为准,那他怎么变化都不怕,如果参数变得超出手册范围了还可找他索赔(假如这时你的板子还能转,那你的可靠性就更牛了)。
8 k- H4 @# h! Z2 p7 O' v2 t1 m. T+ @' ?7 {
; ?; t2 A& k. a( C/ R
现象二:这部分电路只要要求软件这样设计就不会有问题; R$ z$ S1 p$ \0 [, ^

9 x$ p3 G) @$ p. \1 k$ B$ g0 [# K! V  r. K+ x
点评:硬件上很多电气特性直接受软件控制,但软件是经常发生意外的,程序跑飞了之后无法预料会有什么操作。设计者应确保不论软件做什么样的操作硬件都不应在短时间内发生永久性损坏。" K& @, W  E" s

' W, ]* @6 @$ R8 y2 o; Q2 u" g/ Y0 ]0 v" M! E6 X
现象三:用户操作错误发生问题就不能怪我了
4 B! v) C  @' C) J6 V/ _$ B& m$ v, F- R0 x, h* f; o$ M. G

; L0 d$ D* {4 Z9 D点评:要求用户严格按手册操作是没错的,但用户是人,就有犯错的时候,不能说碰错一个键就死机,插错一个插头就烧板子。所以对用户可能犯的各种错误必须加以保护。
4 g9 H$ J, z- M$ w7 K6 \) `9 r2 Y# I2 |

% L3 L* ?# E! y5 [- z: b现象四:这板子坏的原因是对端的板子出问题了,也不是我的责任0 \" w: |8 b) r( V! g/ I
' T6 k5 E; c. Y% v

- k/ ~; K/ B+ K9 S4 i点评:对于各种对外的硬件接口应有足够的兼容性,不能因为对方信号不正常,你就歇着了。它不正常只应影响到与其有关的那部分功能,而其它功能应能正常工作,不应彻底**,甚至永久损坏,而且一旦接口恢复,你也应立即恢复正常。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏 支持!支持! 反对!反对!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

巢课

技术风云榜

关于我们|手机版|EDA365 ( 粤ICP备18020198号 )

GMT+8, 2025-4-9 17:16 , Processed in 0.059808 second(s), 32 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表