英特尔开发低功耗AI推理GPU #
据报道,英特尔正在研发一款面向 AI推理工作负载 的 低功耗GPU,预计将在明年发布。与一味追求峰值性能的高端加速卡不同,这款GPU将强调 能效 和 轻量化部署,与高通的 Cloud AI 100 战略理念相似。
这款芯片预计将与英特尔即将推出的高性能AI训练平台 Jaguar Shores 一同亮相。Jaguar Shores面向大规模训练任务,而这款低功耗GPU则聚焦于 边缘AI 和 数据中心推理,为英特尔打造 双层AI硬件布局。
目前具体规格仍不明朗,但业内猜测它可能基于 Battlemage架构,或是源自传闻中的 BMG-G31芯片,该芯片可配备高达24GB显存,能够支撑推理任务。无论最终架构如何,其设计目标都很明确:降低系统成本和能耗,同时保持足够的推理性能,从而适配更轻量级的部署场景。
与NVIDIA和高通的竞争 #
此举正值 NVIDIA凭借H100和Blackwell架构 在训练与推理市场全面占据主导地位之际。要想突围,英特尔不仅需要高效硬件,还必须提供完善的 软件生态 和 开发者支持。目前英特尔正在加大对AI软件堆栈的投入,以增强其竞争力。
意义何在 #
如果成功,这款低功耗GPU将帮助英特尔从训练扩展到 不断增长的推理和边缘AI市场。随着语音识别、推荐系统和计算机视觉等场景对高效可扩展AI加速的需求上升,这款新产品的发布将成为英特尔AI战略中的重要一步。