作者
程茜编辑
Panken
芯东西11月28日报道,今日,国产CPU企业龙芯中科自主研发的新一代CPUA发布,这也是我国国产CPU领域的最新里程碑成果。
龙芯A采用龙芯自主指令系统龙架构(LoongArch),是龙芯第四代64位高性能微架构LA的首款产品,且主要IP核均自主研发,采用成熟工艺生产,主频达到2.5GHz,支持多线程技术,全芯片共8个逻辑内核。
该CPU采用全自研高性能DDR4接口,访存效率超过80%,动态频率电压调节能效提升,相比于上一代龙芯A,相同频率下整数通用性能提升60%以上,多核性能翻番。
龙芯中科技术股份有限公司董事长胡伟武称,A的性能已经达到十代酷睿四核处理器水平。
他谈道,龙芯中科要构建独立于x86和Arm的第三套新型信息技术体系和产业生态。
在第三季度业绩说明会上,胡伟武还提到:“我们正在努力提高每GHz性能接近或达到苹果CPU的水平。”他还透露,“B将争取每GHz的性能再提高20%-0%,在此基础上用先进工艺提高主频。”
▲龙芯中科技术股份有限公司董事长胡伟武
同时,龙芯中科推出了打印机主控芯片龙芯2P,这是国内首款基于自主指令系统的打印机主控芯片。一、将自主化优势转化成技术优势,性能追上十代酷睿四核处理器当下全球的信息产业构建在西方主导的x86体系之上。胡伟武谈道,年我国硅上工业企业利润率为6.8%,其中电子工业利润率为5.9%。年我国电子工业的利润总额为亿元,苹果一个公司就达到亿美元。
胡伟武谈道,CPU和操作系统是信息产业的底座,但还有更底层的根技术被卡脖子,比如指令系统、芯片生产工艺和设备材料等。
国内很多CPU都是基于Arm,操作系统都是基于安卓等,胡伟武认为,我们要将自主经营到底,把底层的根技术做起来,不依赖国外授权和供应链,只依赖人力资源和矿产资源。
因此,龙芯中科要构建独立于x86和Arm的第三套新型信息技术体系和产业生态,其自研的指令集架构龙架构就是第三套体系的基础。
龙芯中科有三大系列CPU产品,龙芯号CPU系列是面向桌面、服务器应用,龙芯2号SOC系列,面向工控和终端应用,龙芯1号面向的是嵌入式专门应用。
胡伟武称,龙芯的主要IP核均自主研发,目前龙芯的软硬IP核数量已经有上百种。下图中,龙芯A结构图中4个方块就是4个核,标红的就是A用到的IP。其中,PCIe的IP为自主研发,可以做得很小并且成本更低,这也是自己做IP的好处。
A有4个物理核和8个逻辑核,主频2.0GHz到2.5GHz,还有片内集成安全可信模块,支持安全启动和国密算法。
首先,A采用龙芯第四代64位高性能微架构LA,这一架构有两个特点,首先是大幅提升性能,其次是实现了同时多线程技术。胡伟武透露,龙芯的芯片是一个套壳加Tock+Tick,基于第二代GSE,A性能提升1.6倍。
龙芯号系列芯片按照Tick-Tock路线发展,Tick指的是工艺节点的增强,Tock指的是微体系结构的增强。
第三代架构是GSV、LA,与A相比,A4工艺没变,通过结构优化性能提高了两倍,A采用更先进工艺性能提升了1.5倍。
A采用的是第四代架构,使得CPU在相同工艺下性能比上一代产品大幅提高。根据电子四院的报告,A单线程通用处理性能提升60%,多进程通用处理性能提升%。
定点单线程的性能分数是4分,CPU的单线程性能是5分。
CPU执行指令的过程中,由于指令供给不及时等,存在空闲指令。同时多线程就使得CPU核心“一心二用”,也就是在单位时间内执行多个线程的更多指令,A性能在相同工艺下相比上一代产品大幅提高。
A的性能达到十代酷睿四核处理器水平,2.5GHz的龙芯A和.6GHz的酷睿i比较数据如下:
胡伟武称,龙芯中科走出了一条基于成熟工艺,通过设计优化提高性能的道路,标志着在弱一点的工艺条件下,与英特尔、AMD等的产品性能可比。下一步龙芯中科将继续基于成熟制程研发,达到英特尔先进工艺的性能。
年,胡伟武就在反思,中国CPU和国外先进水平的主要性能差距在什么地方?是通用处理能力不行、还是专业处理能力不行?是单核性能不足还是核数不够?是设计能力不行还是工艺不行?
他认为,刚刚提到的4分,就相当于A“研究生毕业”。并且当时龙芯A1主频差距在2-倍,每GHz性能差距为4-6倍。
目前,龙芯中科已经完成了通用处理性能技术补课,十代酷睿是年的产品,胡伟武称,现在很多人电脑上还用的是八代、九代酷睿,今年龙芯中科推出的A已经达到市场主流水准。
龙芯中科已经完*芯C设计,龙芯C采用单硅片16核2线程,通用处理性能成倍提升,内存采用DDR4-×4,访存带宽比上一代C成倍提高。
此外,C通过龙链技术实现了片间互联,实现LSD双硅片2核64线程、LSE四硅片64核线程,支持GPGPU、各类加速器扩展。
胡伟武认为,龙架构指令系统是龙芯的一个贡献,片间互联就是龙芯的第二个贡献,未来,龙芯中科都会开放。
龙芯中科突破片间高速互联技术,对标的是nVLink、CXL,这也是破解Chiplet技术的关键。片间互联可以大幅降低延迟提高带宽效率。
在GPGPU方面,龙芯第二代自研图形处理器LG有图形加速、科学计算加速、AI加速三个功能,右边是GPGPU的结构图。
龙芯中科将基于2K的GPGPU技术及C的龙链技术,研制专用GPGPU芯片。
胡伟武认为,由本次发布的桌面处理器龙芯A、在研服务器处理器龙芯C和移动桌面终端处理器2K构成的龙芯“三剑客”已具有一定开放市场竞争力。
二、自主化优势转化为软件生态优势,三大阶段完成生态建设指令系统是软件生态的基础,年,龙芯中科推出龙芯指令系统结构LoongArch,简称龙架构或LA架构,完成了自主知识产权评估。
胡伟武透露,构建龙架构软件生态分三个阶段。
首先是夯实基础,龙芯中科的架构已经得到国际开源软件认可,开发者可以完全基于龙架构的国际开源软件直接构建出完整的操作系统。其次,该框架得到了国内操作系统和基础应用的认可和支持,目前支持统信、麒麟、欧拉、龙蜥、开源鸿蒙等操作系统,支持WPS、