Don Soltis在向妻子描述自己的工作时,把自己定位为“一名CPU狂热者”。当然,他的实际职称会更为正式一些——他是英特尔至强能效核(E-core)的高级首席工程师兼首席架构师。如果你问他本人,他会告诉你他在38年的职业生涯里,致力于开发一些“最酷、最好的处理器”,其中包括英特尔安腾处理器,彼时英特尔与惠普通力合作,旨在提供超高效的64位处理器,不过在安腾输给x86后,Soltis便转向了至强。
目前,他正在领导代号为Sierra Forest的下一代至强处理器的开发。
Sierra Forest将于2024年上半年推出,这将是英特尔首次同时推出两款至强处理器。对于Soltis来说,这是一个熟悉的领域,他已在其中耕耘多年。Soltis参与过大约20款处理器的开发,每一款都用于数据中心,在Sierra Forest之前,他曾参与打造英特尔凌动C3000系列处理器。此前研发代号为Denverton的基于凌动处理器的服务器解决方案,最高可提供16核,具有行业领先的每瓦性能、热设计功耗(TDP)以及大量可配置的高I/O吞吐性能。Denverton所面向的,是网络、存储、物联网(IoT)、可扩展解决方案,以及边缘领域。
Soltis表示:“这是我们这段时间以来一直在努力做的事情。”面对市场既有需求和激烈的竞争态势,秉承不断创新的理念,Sierra Forest将与Granite Rapids一起‘并肩’于至强路线图中,其中,Granite Rapids是英特尔即将推出的成熟性能核产品。“数据中心市场对于性能要求的广度在不断增长。”Soltis展示了一张他于Hot Chips活动上演示的幻灯片,可以看出,并非每个客户都追求所有工作负载的原始性能,相反,它是一个XY轴,其中,核心性能位于垂直的Y轴,而核心密度则位于水平的X轴上。
英特尔计划于2024年推出的下一代服务器平台,为关键工作负载提供强大的性能和能效
“Taylor Swift是向大家解释这一点的最佳方式,”他解释道。
在性能和能效之间找到平衡
Soltis表示,这是用来解释为什么客户可能需要大量更小、节能的内核而不是最强大的解决方案的最简单的例子。
去年年底,数百万人涌入Ticketmaster购买Taylor Swift "Eras"世界巡回演唱会的门票,而该公司的系统却难以跟上。总共有150万预先注册的粉丝,还有成群结队的机器人和未注册的粉丝,他们都在争夺同样的东西。Ticketmaster表示,它收到了35亿个系统请求,是之前峰值的四倍。
通量计算(例如为数百万绝望的粉丝提供同一页面)需要大量的核心,并且这些核心需要尽可能地节能,以防止成本失控。人工智能等更复杂的工作负载可以通过更少、更强大但运行成本更高的核心来更好地提供服务。Sierra Forest和更强大的Granite Rapids使用相同的平台,这不仅使其具备更强的灵活性,也将为客户带来更多益处。
平衡性能和能效并不是一个新概念。这就是为什么每一代英特尔至强都包含针对不同工作负载(从电话通信到人工智能)的多种选项,也是为什么您会在从办公室柜子里的IT服务器到世界上最强大的超级计算机等诸多产品中都能找到至强芯片。但Sierra Forest和Granite Rapids的不同之处主要在于以下几个方面。
首先,基于能效核的Sierra Forest和基于性能核的Granite Rapids之间有共通性。这为客户在选择合适的芯片时提供了额外的选项——根据工作负载,他们可能想要Granite Rapids芯片或Sierra Forest芯片。两者支持相同的软件堆栈,并且是平台兼容的,可以为每个客户提供正确的组合。与之前的至强处理器相比,Sierra Forest的吞吐量计算性能更好。上个月,英特尔透露,Sierra Forest的机架密度和每瓦性能分别是Sapphire Rapids的2.5倍和2.4倍,其TDP低至205瓦1。
“当面对诸多不同的SKU时,客户时常会做出与过去相同的决定,但我们的能效核解决方案在性能和每瓦性能方面均优于我们之前用于通量计算的SKU。”Soltis解释道。“对于云服务提供商等客户来说,更高的性能和更好的每瓦性能非常重要——他们为此支付的电费是总体拥有成本中的很大一部分。”
眼见为实
Soltis表示,“与英特尔的客户端处理器不同,英特尔不计划在混合芯片上整合能效核和性能核的部分原因:能效核和性能核的配比组合很多,各种组合要求都有可能被客户要求。设计时过量配置某一种计算资源是不明智的,尤其是芯片资源如此珍贵的情况下。要满足客户的多元化需求。相比在SoC层级上进行配置,在服务器上进行配置会更加灵活。如果客户A想要80/20的分配,而客户B想要60/40的分配,很容易实现。”
在8月的Hot Chips活动上,Soltis在演讲中详细介绍了英特尔至强能效核,以及能让Sierra Forest和Granite Rapids成为极具动态性组合的通用平台。其中,共享的知识产权(IP)、固件和操作系统软件堆栈从多维度带来了诸多优势。Soltis指出,“我们在设计和验证方面节省了诸多成本。拥有相同的I/O晶片使我们具备了相同的硬件兼容性和与平台的软件兼容性,而这也有助于我们获得那些需要亲自见证的客户的信心。”
他说:“我始终铭记密苏里州非官方的州座右铭——展示之州。在很大程度上,我认为我们所有的客户都需要亲眼见证,展示给他们看到底有什么不同。客户也并非不相信,他们只是更相信眼见为实。而我们不仅可以做到与众不同,也有能力向客户展示出来,让客户亲自见证并相信。”
Soltis指出,“听起来很简单,但要达到这一点则需要很多事情都顺利进行。而能做到这一点真的非常复杂。我们必须拼尽全力,才能确保1000亿个晶体管连接得完美无缺。”
打造Sierra Forest的团队并不是由经验丰富的至强“老兵”组成。然而,尽管团队面临Soltis所称的实现“英特尔最重要的路线图”的巨大挑战,但他们依然兴致勃勃。但同时,也正因为团队并不完全了解过往的决策,所以他们可以“轻装上阵”。
“在我参与过的20个处理器的工作过程中,这是其中一个最令人愉快的经历,因为每个人都对着手打造下一个酷炫的事物充满热情。我们所做的每一件事都是一种挑战,但挑战也是乐趣的一部分。”
1 基于截至 2023 年 8 月 21 日的架构预测,相对于第四代英特尔至强处理器。 结果可能会有所不同。