作者|韦世玮
**
6氪获悉,1月11日下午,英特尔在中国市场正式推出第四代至强可扩展处理器(代号“SapphireRapids”)、英特尔至强CPUMax系列(代号“SapphireRapidsHBM”),这是英特尔迄今为止最“绿色”、最具可持续性的数据中心处理器,其至强CPUMax亦是首款集成高带宽内存(HBM)的x86处理器。
英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰展示第四代英特尔至强可扩展处理器晶圆
除此之外,英特尔还发布了数据中心GPUMax系列(代号“PonteVecchio”),采用D封装的Chiplet技术,集成超过亿个晶体管,其中集成的47块裸片来自不同的代工厂,涵盖5种以上的差异化工艺节点,异构集成技术大幅提升,能够为物理、金融服务、生命科学等领域的工作负载带来更高的吞吐量。
整体来看,英特尔Max系列产品采用可扩展、平衡的架构,整合了CPU、GPU和oneAPI开放软件生态系统,适用于高性能计算和AI领域要求严苛的各种工作负载。
与前一代相比,第四代英特尔至强可扩展处理器针对现代工作负载优化加速,面向人工智能、网络/5G、存储、科学计算、数据分析、安全等领域,其目标工作负载的平均每瓦性能提升了2.9倍,在优化电源模式下,每个CPU节能达70瓦,总体拥有成本降低52%至66%。
第四代英特尔至强可扩展处理器为真实工作负载打造差异化性能
值得一提的是,第四代英特尔至强处理器在一个封装上可集成多达4个采用Intel7制程工艺的单元,并通过英特尔嵌入式多芯片互连桥接(EMIB)封装技术连接。其最大的特点是内置了7大加速器,覆盖人工智能、数据分析、网络、存储和科学计算等众多领域,也被称为“七大算力神器”:
高级矩阵拓展(英特尔AMX),作为一款内置加速器,AMX能够大幅提高深度学习训练和推理性能,适用于自然语言处理、推荐系统和图像识别等工作负载,如今AMX集成了调优功能,并支持中小型深度学习训练模型,能够进一步提升CPU上的深度学习与训练性能,其中将PyTorch实时推理和训练性能提升了10倍,将大型语言模型的处理速度提升多达20倍。动态负载均衡器(英特尔DLB),能根据系统负载的变化,动态地在多个CPU内核上高效分配网络数据以进行处理,大幅提升多核平台的网络数据处理性能。数据流加速器(英特尔DSA),专为卸载常见的、会导致数据中心规模部署开销的数据移动任务而设计,能帮助加速CPU、内存和缓存。通过优化数据移动和转换操作,英特尔DSA提高了存储、网络与数据密集型工作负载,实现更优性能。存内分析加速器(英特尔IAA),适用于内存数据库、开源数据库以及RocksDB和ClickHouse等数据存储工作,可更快地运行数据库和分析工作负载,提升能效。数据保护与压缩加速技术(英特尔QAT),可通过卸载加密、解密和压缩释放处理器内核,降低系统资源消耗,让系统能支持更多客户端运行。基于此,第四代英特尔至强处理器也成为单一数据流压缩并加密数据性能最高的CPU。英特尔安全引擎(SecurityEngines),包含英特尔软件防护扩展(SGX)、英特尔TDX、英特尔控制流强制技术(CET)等,可提供工作负载保护、加密运算加速、预测性安全保护和平台安全启动,加强隔离敏感数据,实现数据中心更小信任边界。至强CPUMax系列,集成64GB的高带宽内存(HBM2e),为更多内存敏感型工作负载带来显著性能加速,让关键数据更靠近算力。与第三代英特尔至强可扩展处理器的高端SKU相比,至强CPUMax系列可为能源、地球系统建模等一系列实际应用提供高达.7倍的性能提升。
英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰现场展示
从发布第一代至强可扩展处理器以来,英特尔已经向全球客户交付了超过万颗至强可扩展处理器,支持着全世界的数据中心。其中,近两年第三代英特尔至强可扩展处理器出货近万颗。
目前,第四代英特尔至强可扩展处理器也已实现出货,客户订单超过个,且获得了阿里云、AWS、百度智能云、东软、谷歌、火山引擎、红帽、IBM云、腾讯云、微软Azure、新华三、英伟达等多家生态合作伙伴的支持。
实际上,在本次发布前,6氪等媒体与英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立,围绕第四代英特尔至强可扩展处理器的产品特点,以及未来落地规划进行了一场深入沟通。
以下为6氪等媒体与英特尔专访的对话,经编辑:
Q:新一代至强处理器在碳中和方面有哪些新的特性和参数?
陈葆立:第四代至强处理器是我们最可持续的CPU。可持续发展不只是碳中和本身,它有比较丰富的概念,一个是运营减碳,一个是制造减碳。制造减碳是指在制造过程当中,无论是手机还是芯片,英特尔的工厂本身用了多少绿色能源,这是我们