著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
原创: 铁流 铁君 9月27日
最近,国产CPU进入“收获期”,先是华为高调发布鲲鹏920,兆芯发布了KX6000,然后是龙芯3A4000成功流片,最近飞腾发布了FT2000/4,加上海光的X86 CPU和申威的SW3232,国内各家CPU公司已经推出或即将推出各自的新产品。由于国产CPU众多,比较是再所难免的,铁流简单做一个盘点。由于各家CPU的核心数不一样,有的64核,有的4核、8核,因而如果比多核性能就有一点不太公平,因而铁流就以对用户体验影响最大的单核性能为标尺进行对比。本篇文章只谈性能,至于技术路线和自主可控等不在盘点之列。
龙芯
龙芯最新一代的CPU是3A4000,这款处理器使用28nm工艺,是本文中盘点的处理器中,制造工艺最差的一款。虽然制造工艺相对落后,但3A4000的单核性能却并不比其他几家逊色。采用GCC编译器,SPEC20006定点和浮点成绩都在20左右(@2G主频)。
近些年,龙芯专注于微结构的提升,在制造工艺上普遍落后于同时期其他国产CPU,比如2015年前后问世的龙芯3A2000,工艺为40nm,而在此时,国内同行CPU的工艺大多为28nm。2019年问世的龙芯3A4000,制造工艺为28nm,国内同行的工艺普遍为7/16nm。
在制造工艺落后国内同行1至2代的情况下,龙芯能够把CPU性能做到同一档次水平,实属不易。从龙芯3B1500至龙芯3A4000,龙芯在制造工艺处于同一水平的情况下,通过自身设计能力,把CPU的性能翻了6倍,SPEC20006测试每G主频性能达到10分,在微结构设计水平上是国内数一数二的存在。
这充分体现了龙芯的CPU设计能力,折射出能力建设和培养比引进国外技术更重要,与一些高度依赖台积电先进工艺的厂商形成鲜明对比。
龙芯的桌面CPU做的非常不错,但在服务器CPU上由于核数较少,暂时落后于国产X86和ARM CPU。由于3A/B4000多路性能提升较大,龙芯将主推4路服务器。
申威SW由相关单位设计,在超算上非常成功,神威太湖之光曾经多次在TOP500上名列第一,即便现在依然位居第三。在超算上取得成功后,SW开始把服务器作为发力的方向,2019年会有SW3231问世,2020年SW3232会问世,比PPT上的规划时间晚一年。
就单核性能来说,SW3232采用14/16nm工艺,并且有极大概率单核性能达到25分(SPECint2006),多核性能600+是起步水平,实际性能会明显高于这个水平。
SW3232在单核与多核性能上着实不俗,申威用实践证明,独立自主与CPU高性能可以兼得,没必要一定依附于X86和ARM,中国人自主定义指令集完全走的通。
飞腾9月19日,飞腾发布了新一代桌面处理器FT-2000/4。
根据飞腾的官方介绍,FT-2000/4集成4个FTC663,16nm制程,主频2.6至3.0GHz,最大功耗10W,单核1GHz下芯片功耗降为3.8W。在专业CPU性能测试软件SPEC2006中,FT-2000/4全芯片实测整数计算得分61.1,浮点计算得分62.5,相比飞腾上一代桌面CPUFT-1500A/4提升近1倍,访存带宽提升3倍。
就单核性能来说,从FT1500A到FT2000,再到FT2000plus性能提升有限,因而无法判断FTC663相对于FTC662有多大的提升。根据测试成绩来看,FT2000的单核性能(定点)为12+(飞腾的PPT也有13分的),假设FT-2000/4与FT2000同主频性能处于同一水平,那么,2.6G至3G主频的FT-2000/4单核性能大约为16.5至19。据悉,FT-2000/4在主频2.6GHZ下,单核定点16到17之间,多核整数55到57之间。
从定点成绩看,飞腾的FTC662和FTC663在同主频性能上差距微乎其微,基本上FTC663可以视为FTC662的“微小改动版”。
因此,FT-2000/4单核性能最好成绩(@3G主频)应该是18+,接近19分,或19出头一点,但到不了20分。
兆芯
兆芯最新的KX6000,把主频做到2.7G至3.0G。根据兆芯公布的PPT,SPECint2006有29分(ICC编译器),如果采用GCC编译器的话,成绩要打一个折扣,3G主频下估计20+的成绩应该还是有的。KX6000的单核性能基本达到了老一代AMD处理器(推土机、挖掘机)的水平。
海光海光是AMD和曙光成立的合资公司,一直非常低调。海光站在AMD的肩膀上,消化吸收AMD的技术,加入了自研技术和安全机制,其CPU性能目前在国产CPU中应是最强的,也是生态兼容性、通用性最好的,具备很强的市场竞争力。这一点从AMD市场份额大幅提升,股价在过去几年上涨800%就能体现出来。海光CPU的单核性能估算可达到35以上。
华为
最近,华为非常高调的再次亮相鲲鹏系列处理器。根据华为官方的PPT,鲲鹏920的多核性能非常强悍,搞到900+分。不过,华为没有公布鲲鹏920的单核性能,从华为的PPT上48核战平英特尔28核的情况看(主频相差不大的情况下),单核性能和微结构设计上与英特尔还是存在明显差距的。鲲鹏920在国产CPU中的优势有2个,一是核心数众多,高达64个核心,而目前国产CPU中核心数达到64个的只有飞腾。第二个是采用7nm工艺,在工艺上领先其他国产CPU。
上图中有英特尔,并非指英特尔是国产CPU,而只是用于参照。
从上图可以看出,国产CPU单核性能基本都达到了20分这道坎,而这个成绩是AMD老一代处理器(推土机、挖掘机)的性能水平。可以说,国产CPU的进步是显而易见的。
在看到成绩的同时,也要看到差距。就单核性能来说,目前英特尔主流CPU普遍在40分以上,英特尔4G主频的CPU单核性能超过50分,追赶之路任重道远。
就性能来说,单核性能最强的是海光,多核性能最强的应该是华为。
申威3232的单核性能和多核性能都很不错,不知是否受E级超算任务的影响,分散了精力,导致SW3232进度延期。铁流非常期待申威E级超算和SW3232。
据小道消息,3A5000将采用12/14/16nm工艺,并小改CPU核,单核成绩有望达到25至27分。如果将来采用7nm工艺,单核性能有望突破30分。参照龙芯3A2000到3A3000的研发进度,3A5000有望在2020年上半年流片。届时,龙芯又能获得一次性能提升。
总的来说,国产CPU进步明显,海光单核性能最强,华为多核最强,龙芯潜力很大,SPEC20006测试每G主频性能达到10分,在微结构设计水平上是国内数一数二的存在,其自主研发能力获得实践证实。申威3232虽然跳票,但性能值得期待。