英特尔公司加速计算系统和图形部门高级副总裁兼总经理
日前,2021英特尔架构日,英特尔公司高级副总裁兼加速计算系统与图形事业部总经理Raja Koduri携手几位英特尔架构师,全面介绍两款全新x86内核架构的细节。以下是拉贾科杜里的演讲记录:
架构是硬件和软件的现状,炼金术它集成特定计算引擎所需的先进晶体管,通过领先的封装技术将它们连接起来,集成高带宽,低功耗的缓存,为封装中的混合计算集群提供高容量,高带宽的内存和低延迟,可扩展的互联,确保所有软件的无缝加速披露新产品的架构创新是英特尔架构师每年架构日的期待,今年举办的第三届英特尔架构日非常精彩
今天,我们宣布了英特尔架构最近几年来的重大变化和创新这包括:首次深入介绍英特尔首款性能混合架构Alder Lake,该架构配备了两个新一代x86内核和智能英特尔硬件线程调度器,英特尔全新的行业领先数据中心架构Sapphire Rapids配备了全新的性能内核和多种加速器引擎,英特尔全新独立游戏图形处理器架构,英特尔的新基础架构处理器和非凡的数据中心GPU架构Ponte Vecchio拥有英特尔迄今为止最高的计算密度
架构突破为英特尔下一波领先产品奠定基础,阿尔德湖率先推出伴随着从桌面到数据中心的工作负载变得更大,更复杂和更多样化,我们在架构日的突破展示了架构将如何满足对更高计算性能的需求
架构师努力构建混合计算架构,将英特尔独特而丰富的标量,矢量,矩阵和空间计算引擎相结合,为客户苛刻的工作负载提供非线性处理能力。
我将为您总结以下内容:
能效核心:高度可扩展的x86微架构,可满足客户从低功耗移动应用到多核微服务的全方位计算需求比较英特尔最高效的CPU微体系结构mdashmdashSkylake,能效核心在同等功耗下可以将单线程性能提升40%,或者在提供同等性能时功耗低于Skylake的40%1在吞吐量性能方面,与运行四个线程的两个Skylake内核相比,这四个高能效内核在消耗更少功耗的同时将性能提高了80%,或者在提供相同吞吐量性能的情况下将功耗降低了80%
性能核心:它不仅是英特尔迄今为止性能最高的CPU核心,而且在CPU架构性能上实现了一步一步的提升,这将推动未来十年计算的发展它是一种更宽,更深,更智能的体系结构,表现出更高的并行性,提高执行并行性,减少延迟,提高总体性能它还帮助支持大数据集和大代码量的应用程序与第11代Core架构相比,性能核心在一系列相同频率的工作负载中平均提升了约19%
根据数据中心处理器和机器学习的发展趋势,性能核心提供了特殊的硬件,包括全新的英特尔高级矩阵扩展执行矩阵乘法运算以获得数量级的性能mdashmdashAI加速约8倍这是为使用x86编程模型的软件的易用性而设计的
英特尔硬件线程调度器:这是英特尔开发的独特调度方法,旨在确保能效核心和性能核心无缝连接,从一开始就动态智能地分配工作负载,从而优化系统,在真实场景中实现更高的性能和效率智能直接放在内核中,英特尔硬件线程调度器与操作系统无缝协作,在正确的时间将正确的线程分配给正确的内核
阿尔德湖:它重构了多核架构,是第一个配备全新英特尔硬件线程调度器的性能混合架构它是英特尔最智能的客户端SoC架构,融合了能效核心和性能核心,适用于从移动到桌面的产品,通过各种行业领先的I/O和内存引领行业变革阿尔德湖的产品将于今年开始发货
Xe HPG和炼金术士SoC:一种新的独立显卡微体系结构,旨在为游戏和创意工作负载提供发烧友级别的性能XeHPG微架构采用全新Xe内核,专注计算,可编程,可扩展,全面支持DirectX 12 UltimateXe内核中的Xe Matrix Extensions 可以加速AI工作负载,比如XeSS,这是一种新的上规模技术,可以实现高性能,高保真的游戏体验基于XeHPG的炼金术士SoC将于2022年第一季度上市,并采用全新品牌英特尔睿轩
蓝宝石急流:它将英特尔的性能核心与新的加速器引擎相结合,并为下一代数据中心处理器树立了标准蓝宝石急流的核心是模块化分区片上系统架构得益于英特尔的EMIB多芯片互联封装技术和先进的网格架构,在保持单芯片CPU接口优势的同时,具有显著的可扩展性
基础设施处理器: Mount Evans是英特尔首款专用ASIC IPU,基于FPGA mdash的全新IPU参考平台,mdash橡树泉峡谷.通过基于英特尔IPU的架构,云服务提供商可以将基础设施任务从中央处理器转移到IPU,从而最大限度地增加数据中心的收入将基础设施任务转移到IPU使云服务提供商能够将所有服务器CPU出租给客户
庞特维奇奥:庞特维奇奥
o是英特尔迄今为止最复杂的SoC,也是我们践行IDM 2.0战略的绝佳示例,它采用多种先进的半导体制程工艺,英特尔变革性的EMIB技术以及Foveros 3D封装技术这是我们实现堪比登月难度创新后的一款产品,它包含1000亿个晶体管,提供业界领先的浮点运算和计算密度,以加速人工智能,高性能计算和高级分析工作负载在架构日上,英特尔展示了早期的Ponte Vecchio芯片就已经显示出领先的性能,在一个流行的AI基准测试上创造了推理和训练吞吐量的行业纪录1我们的A0芯片已经实现了超过每秒45万亿次浮点运算的FP32吞吐量,超过5 TBps的持续内存结构带宽以及超过 2 TBps的连接带宽如Xe架构一样,Ponte Vecchio将由oneAPI支持,后者是英特尔一个开放,基于标准,跨架构,跨供应商的统一软件堆栈
回望过去一年,科技处于所有人如何沟通,工作,娱乐和应对新冠肺炎疫情的核心事实证明,强大的计算能力至关重要展望未来,我们面临庞大的算力需求,预计到2025年将是1000x的提升,而四年内增加1,000倍相当于摩尔定律的5次方
英特尔CEO帕特middot,基辛格也是一位架构师,他说:,我们面临艰巨的计算挑战,一定要通过变革性的架构和平台来解决hellip,hellip,正是英特尔才华横溢的架构师和工程师们,让这些技术lsquo,魔法rsquo,得以成真。,