EDA365电子工程师网

标题: 国产自主最新兆芯CPU深度揭秘!性能终于追上七代i3 [打印本页]

作者: admin    时间: 2019-9-27 15:10
标题: 国产自主最新兆芯CPU深度揭秘!性能终于追上七代i3
2017年12月28日,上海兆芯集成电路有限公司正式发布了最新一代兆芯处理器,近日又在日本举办专门会议,对全新兆芯做了深度解读。
5 w0 l' t! L  ^! M& ?# x# ^5 ?3 K
3 O' J# g, A0 u& K1 @/ P( H7 ]4 w9 Y. x8 [: y4 F. r3 c; M
! G  d2 |$ [+ x0 u7 m$ x) `3 H
' T7 v" A  J* n' N' u

5 j) p, c/ V, l% D
0 C3 g5 B- H7 o" {- d+ m5 {
3 {$ _  C! C# i" L3 s3 G1 f. k- D7 T. y( S9 [. U# U# u, S
新一代兆芯分为开先KX-5000、开胜KH-20000、ZX-200三大系列,最多拥有8个核心。% h  s: I# f/ w1 D' b

* h* Q7 p% E8 Y! I! F
% A' P3 |1 P# i8 s: r% x0 L* W新兆芯处理器的代号为“五道口”,采用全新内核,IPC性能比上代提升25%,单芯片性能提升140%,内存带宽提升120%。9 p/ X$ R" a& p0 z3 k4 x

% u7 x1 Z/ ]% b/ X' a, ]' f9 D8 D; _
9 q  p( s7 f; E

6 H% I# G  G) L! T
7 _# N; \7 U0 d& e+ J2 |& iKX-5000、KH-20000系列均采用28nm工艺制造,基于业界先进的SoC架构,整合高性能集成显卡,完全兼容x86 32/64位指令集、SSE4.2/AVX指令集,支持双通道DDR4内存、CPU虚拟化、SM3/SM4国密算法、24条PCI-E 3.0通道、9个PCI-E 3.0端口。1 r7 ~8 G% k2 V8 @' a
2 F( `' p( M2 m6 o: ~

1 f: p: n: z. k! I9 {- O/ O8 z' S% ~  `; A: G: y# y+ b
% `9 q& v4 f0 s6 o0 F' {& n
/ K' v" R( [8 i4 K! G' P) _
- q7 _' }. G4 J/ D# L
' Z' N. w5 C8 ]3 ?

# k& Z+ n, }3 N  h4 R' S" a: jKX-5000系列面向桌面、便携终端、嵌入式领域,其中KX5540/5640均为四核心四线程,主频1.8/2.0GHz,二级缓存4MB,内存最大容量64GB。: \3 Q7 `' y, H

* }# |% _: Q' D& D6 R
" c) o4 P: n$ Z# a6 _' l: aKX-U5580M/U5580/U5680则都是八核心八线程,主频分别为1.8GHz或更低、1.8GHz、2.0GHz,其中KX-U5580M还支持适应性超频,二级缓存均为8MB,内存容量最大也是64GB。8 v! S7 {9 e6 X9 Z* K! N6 L9 I1 Z

5 e; F9 K% w1 e  g7 |9 ~1 W
/ [; K) g( B( [6 O  N" @% n: P) T& z7 T& X

1 _& d" _1 M3 W1 I/ y$ x3 y
( q: q4 z3 P! {; p; w; w) a/ R& L' I: H0 ]
; |6 a4 K3 ~7 ~% w: l
, W0 s( @( t  a0 g! R9 ~3 M
KH-2000系列则面向服务器、存储,基本架构设计和KX-5000系列一致,不过加入了对RDIMM/ECC内存的支持,最大容量128GB。8 p* h$ o/ d% F( @( q- Y
: w7 W$ G& d. Y% M3 `% J
3 N& X! F* R) u/ a6 p; u  x
2 ?* B1 h/ q% l  r9 M2 F
* L8 o5 {* a1 Q5 {
) m  K, X8 G3 T9 ]
, S% @- X9 U: F- m/ E4 j  \
KX-5000/KH-20000
6 Y6 ?) a9 k# m4 S6 m
  k, s) Y! \2 q2 _6 p+ H
8 _: v6 d0 O' V
ZX-200系列适用于桌面、便捷终端、服务器、嵌入式,更加精巧,支持四条PCI-E 3.0总线、九条PCI-E 2.0总线、两个USB 3.1 Gen.2/三个USB 3.1 Gen.1/六个USB 2.0接口、四个SATA 6Gbps接口,并有来那个号的IO扩展,可满足多种市场应用需求。
  o) Q* D) _$ y5 x8 Q9 z  w9 B7 s$ L; K% C; u8 V

/ e0 F, v& C) W6 J; W# b# Q% P- Z+ }6 [+ k& i, C# |. k

( ]! I8 _5 S. Z
% e2 X( b( F; w9 J/ D* y
$ A6 K7 z9 c% j; ?/ r0 n/ W" w6 F3 [; h9 b6 G/ Y9 [

* i( L" C/ a5 ?# f说了半天参数,那么性能如何呢?
7 G1 X$ ?' f$ Y2 ~2 l3 g, j" I& x0 \$ {% F* ~, B$ k
8 V8 F- y1 a+ \. C# e
兆芯方面也公布了多项实测数据,包括Stream内存带宽、SPEC CPU2016、FritzChess、7-Zip、CineBench R11.5,比较起来基本相当于七代酷睿Core i3-7100或者Core i3-7350K的水准。4 V7 h/ O) N" O+ p2 @

( G! x4 x3 f# D
0 v) b6 @6 M; {0 H3 A
  a4 }  ^8 l1 e
9 J! g( ^: U& m1 w
3 ~" [" E8 `( i8 V; w! A. ~, a) W4 e, U# M5 P# o# Y

6 }1 x4 v& F  h2 i' e3 i- r
7 |: v' q+ b4 H# N1 S! B/ P8 ~7 z3 l% g$ [
4 h. G# P, j) E( o& [/ {
很多人可能对国产自主处理器不屑一顾,觉得性能不济,不过是为了经费罢了,但其实除了当年声名狼藉的“汉芯”事件,国产自主处理器确确实实也是在努力的,比如龙芯就已经完全市场化运作,不拿国家一分钱。2 p, g' J9 f9 S

5 n1 h" u2 u" d; z
( G0 y3 c2 `$ l" e( z兆芯走了一条不太一样的路,但也是历尽艰辛。KX-5000系列从2013年8月就启动了,2014年6月完成架构设计,之后历经基本设计、硬件设计、全掩模流片、系统调试,一直到2017年10月才投入量产,历时超过4年。
$ `+ A, ?3 x& h
: w" Y) \& J' r4 Y8 U" F$ R" i) D
6 ~& x% G/ I4 r' H) O整个研发过程,兆芯投入了9000个人月的研发资源,花费4000个计算核心、200TB硬盘容量,使用了10台最先进的硬件仿真器和验证平台。
+ ^$ I7 P( {. X* X: S+ j
  R% ~& N2 w2 E4 v
: H0 J5 {# I0 d) L8 p1 i9 k# m& e' [. f# l6 ~4 ^; U2 f
5 z& I) P- ~& b# ]

0 @- A: G, s3 \! U9 o+ h1 @当然还有各种前端验证,包括软件仿真指令、原型验证系统等,在300多种软件上进行了测试,测试时间超过4000小时。
5 b/ H& y4 R$ v: U9 T
5 z- d, H& ~* I1 N9 Y" {& ^
* d7 \! J" X# [$ P5 l
' X; h) ~5 K6 T5 g& g% n; T8 U5 @2 v4 R* t6 t4 k3 t

  p: ]5 T8 k2 M' f0 P2 N兆芯的下一步是代号“陆家嘴”的KX-6000系列,依然是四核心/八核心设计,但会转入16nm工艺,主频提高到3.0GHz。
& E: S1 ]8 W2 h5 o( r$ U) P+ c4 v9 \; R

# m, |* F+ y/ |4 T) T. ]再往后的KX-7000系列,更是会启用全新的微架构,支持DDR5内存、PCI-E 4.0总线。
; H# c& T& _9 R: x
: h1 E; V: s: F$ c! v$ @+ \6 g$ h' M) }

5 ?  B$ v& _3 z: d6 U% T
- |" U# |2 E, o! C8 F6 G" `/ _7 l8 f# l9 s
兆芯也罗列了CPU研发的种种困难,包括起步晚、差距大、市场壁垒、研发成本高等等。
+ B( R% x. U/ \9 p0 j/ N
# J+ d; v0 \* A, ^- d1 U( B8 |% u* {% q1 t

; V2 U3 |; [& ^! L4 Q& t. D  k4 }3 `5 |; d% Y5 M% z( ~4 @9 D
! }. o& r# u9 C( v. m
+ g" [' c5 G/ N  F

& j6 t) O. Y& g9 x6 C  j( L. t3 `) {  a
6 R& P, c# ^7 I% Y8 |+ i

: p) j# O/ J9 k! V: o. Y% Q兆芯没有透露自己的研发投入,不过列举了行业巨头的一些数据。只做设计和方案的ARM相对最轻松,2016年也花了3.5亿英镑。Intel最为慷慨,每年都会砸100多亿美元,AMD也在10亿美元左右。
# `: e% P3 g4 U/ ^! P1 w" J6 Y! ?- g; x7 p! b( H- {

" z: w: P8 B* ?% ^IBM每年投入60疫苗可以左右,苹果则是越来越阔绰,已经超过100亿美元,华为也手笔越来越大,已经基本和Intel、苹果并驾齐驱了。# k3 L; y5 t$ @9 M. V3 k; }

) Q, V; ?7 S5 }9 O) _* j2 Q7 J. e
: G" r. O4 w1 e* P, c+ R
3 l' {5 y% v; T8 v+ \( o7 p. v
7 X& E# w" @/ `& K% R) C' N
具体架构上,AMD Zen花费了31.26亿美元,历时五年Intel每一代都是一年,但更费钱,最近几代已经超过70亿美元了;ARM A73一年花了超过4000万美元。
2 M" Q* e; R' D, c3 h! k* w) v. h9 d$ m6 ~  f

0 P4 `/ v+ L4 g. \) d
5 P0 v1 }* R+ y" r$ N2 S) |1 k/ j* Y( P
- M; L. H0 Q1 y
除了硬件设计,还有系统和软件,同样困难重重,包括工作量大、人才匮乏、软件生态难构筑、研发成本高等等,比如为了研发Windows Vista,微软投入的费用堪比美国阿波罗登月计划。
7 r. d; n1 Y" J0 }/ g0 V/ A1 _/ R# S: i# d
1 E9 y& Q# I' q; J$ j7 q

6 R$ {' [* C' r
3 R/ u  N. c* V0 q( {3 g
& j, V# _6 n: j1 L; V+ F$ M3 ?2 C: k7 ?
7 T* {) ~( l* m+ }
/ X# @( m1 h: U8 J. f6 z2 S

, I2 r$ L: d9 J$ Q7 C# k
( D8 R; H1 u4 [. ^' d, ^
$ F4 S1 f6 o0 h) s




欢迎光临 EDA365电子工程师网 (http://bbs.elecnest.cn/) Powered by Discuz! X3.2