TUhjnbcbe - 2024/9/16 1:03:00
在高性能处理器领域,英特尔是天花顶一般的存在(先不算地位特殊的IBM公司),国内发展CPU处理器的公司很多,绝大多数实力跟英特尔相比都差很远,但是大家都非常想看到国内这些小公司跟英特尔比拼处理器性能。在国产CPU领域,龙芯是起步较早的公司之一,不过龙芯处理器走的是MIPS指令集体系,目前已经发展出了多款龙芯处理器,其中针对桌面市场的最新产品是龙芯3A,它的性能到底如何呢?有龙芯爱好者做了实际性能测试,测试下来单核性能相当于inteli5-U的30%~40%,不过下一代龙芯3A处理器同频性能将从i5-U的60%~70%提升到80%~90%,不过总体差距还是非常大的,龙芯要走的路还很长。有关龙芯处理器的测试这几年来零零散散在网上出现过多次,前不久有龙芯爱好者在龙芯社区发表过龙芯3A处理器的全面性能测试,只是这篇文章的图片挂了,他最近在知乎上也发了一次,发表在龙芯往事专栏中,知乎ID是第一千零一人。这套平台是去年9月份龙芯俱乐部的龙芯3A主板团购时买的,由作者自行搭建好一套平台,使用phronix-test-suite对龙芯3A处理器做了一个尽可能理性、中立、客观、全面的评测,不吹不黑,不夸大成绩也不回避问题。这里节选龙芯3A处理器的测试及总结部分,首先来看看龙芯3A平台的样子。龙芯3A主板照片,风扇下面是龙芯的CPU。另外两块散热片下面分别是南桥和北桥。拆下风扇后,龙芯3ACPU的近照,其中的LS3AD-LP意思是说这是一个低功耗版本的龙芯3ACPU。开机后BIOS中的信息,可以看到CPU的主频是MHZ,一级指令缓存64KB,一级数据缓存64KB,二级缓存4MB。主板上的国产Unilc(西安紫光国芯半导体)内存条。补充一下龙芯官方的龙芯3A处理器的架构及规格上图是龙芯3A的主要规格,频率最高1.5GHz,不过原文作者拿到的这块龙芯3A处理器不是性能最高的1.5GHz主频版本,而是性能略低的1.4GHz版本。因此,在估算龙芯3A(1.5GHz)的性能时,应该将我的测试结果乘以1.07。此外,需要说明的是龙芯3A笔记本里带的龙芯3A的主频被限制在了1.2GHZ。规格对比性能测试基本环境龙芯3A处理器性能测试测试是在Linux系统上进行的,很多测试内容都偏重CPU理论性能测试,跟大家熟悉的Windows下CPU性能测试不同,原作者对每个测试项目有详细的解释,感兴趣的可以仔细看下,这里就不对测试性能一一介绍了,觉得长的直接看最后的结论。对比的CPU除了英特尔酷睿i5-U、赛扬J之外还加入了国内另外的处理器FT-A、FT-+的。作者的结论:从纵向上看龙芯的发展,相比龙芯2F,龙芯3A的性能有了很大的进步。工艺上,从龙芯2F的90nm,提高到了龙芯3A处理器的28nm;主频从龙芯2F的MHZ提高到了1.5GHz。在用户实际应用上,基本可以达到流畅使用的程度。与Intel处理器相比,龙芯3A综合性能相当于IntelJ处理器,单核性能相当于inteli5-U的30%~40%。通过本文中所进行的34项测试,我们发现龙芯3A在性能不好的根源有以下几个:同主频性能较弱从同主频性能来看,龙芯3A已经超过了J,但只有inteli5-U的60%~70%。预计年流片的龙芯3A同主频性能至少有30%的性能提升。主频太低这是龙芯处理器让众多爱好者耿耿于怀的的一个难以回避的弱点。诚然,主频不代表所有性能,但主频太低是万万不行的。J的同主频性能弱于龙芯3A,但由于它的主频可以到1.99GHz,并且还可以睿频到2.4GHz,在多项测试中一样超过了龙芯3A。Inteli5-U基础主频达到2.5GHz,睿频可以到3.1GHz。飞腾+主频可以到2.2GHz,而兆芯的KX-主频甚至可以到3.0GHz。飞腾、兆芯处理器可能在同主频性能上弱于龙芯,但还是可以靠着较高的主频击败龙芯3A。龙芯主频较低的原因之一是落后的工艺制程,目前还在使用28nm工艺,而Intel、飞腾、兆芯等已经在使用14nm工艺。根据龙芯的发展规划,到年龙芯将使用14nm工艺对了龙芯3C进行流片,主频能够达到2.5GHz。系统软件优化不够在测试中,我们发现的问题有三角函数等数学函数运算速度过慢,看起来部分硬件浮点运算的没有得到应用,而且龙芯缺少一个优化的数学函数库。在加密解密指令上,缺少AES硬件实现。在测试中,我们发现使用Debian操作系统、GCC7.3和1.4GHz的龙芯3A进行的各项测试基本优于使用Loongnix操作系统、GCC4.9编译器和1.5GHz龙芯3A的组合。我们认为编译器的优化对发挥龙芯的性能非常重要。在测试中,我们也发现使用4.14的Linux内核会比3.10的Linux内核上有相当程度的性能提升,龙芯依然缺少优化的Linux内核。应用软件优化不够由于MIPS架构缺少软件生态,各种应用软件缺少针对MIPS架构的优化。具体表现就是在很多软件有针对X86系统的汇编优化。要建立龙芯的生态,发挥龙芯处理器的性能,相同级别的优化不可缺少。随着龙芯未来架构的优化、主频的提升,影响龙芯发展的瓶颈将不是处理器的性能,而是软件生态的建设,也就是系统软件优化以及应用软件优化。其中,各种应用软件的优化将是提升龙芯用户体验的捷径。实际上,龙芯也已经意识到了这些问题,提出了要学习苹果,”appbyapp,featurebyfeature,pixelbypixel”的进行优化。龙芯下一代处理器龙芯3A的展望原作者对龙芯3A处理器的评价确实做到了不吹不黑,龙芯3A处理器有进步有优点,不过不足之处也非常多,除了架构方面的原因之外,落后的制造工艺也限制了龙芯3A处理器的性能,这些问题想解决也不是一蹴而就的,好在龙芯3A已经是问世几年的产品了,下一代龙芯3A处理器也箭在弦上,预计年初问世,第一千零一人也对此作了性能预测:当下,龙芯3A的流片工作正在开展,预计到年初就能看到芯片了。在3A出现之前,我们对3A的性能进行一下预测。基于我们的评测,我们认为,3A的同主频性能将从i5-U的60%~70%,提升到80%~90%,2.0GHz下单核性能达到i5-U的2/3,多线程性能超过i5-U。和国内其他CPU相比,龙芯3A的同主频性能将超过飞腾以及兆芯,单核性能也将超过飞腾+,但由于3A落后的28nm工艺、依旧较低的主频(2.0GHz),龙芯3A的综合性能将可能依旧无法超过采用14nm工艺,主频3.0GHz的兆芯KX-。但鉴于KX-并没有看大规模量产出货的迹象,龙芯3A依然可能会是年国内可以买到的单核性能最强的国产自主处理器。龙芯处理器和Intel、AMD的高性能处理器差距还是非常巨大,龙芯要走的路还很长。期待龙芯在未来采用更好的工艺,更优化的微架构,也期待龙芯能够在编译器、数学库、操作系统等系统软件支持上有更好的表现,构建更好的应用软件生态系统,期待着龙芯3A、3B、龙芯3C早日流片成功。