在长达24年的沉寂之后,英特尔终于在独立显卡领域迎来了新的突破。全新发布的Arc锐炫系列显卡,代号为“Alchemist”(炼金术师),正式登场。
英特尔独立显卡的历史回顾
追溯到1998年,那时候的显卡市场被3dfx、ATI、NVIDIA、S3、Trident和Matrox等竞争者占据,英特尔也不甘示弱地推出了他们的第一款独立显卡——Intel i740。这款GPU是英特尔通过购买Real3D公司20%股权,合作定制的产品,使得英特尔迅速进入了3D图形市场。
之后,i740在经过优化后被整合进了810/815芯片组中(改名为i752),这一集成在芯片组内的GPU核心从此被正式称为“集成显卡”。
遗憾的是,Real3D公司在1999年倒闭,这直接影响了英特尔后续的独立显卡计划。面对NVIDIA和ATI(后来被AMD收购)的强大竞争压力,英特尔被迫将主要精力投入到整合集成显卡的性能提升上,i740也因此成为了英特尔独立显卡的绝唱。
自此之后,英特尔在集成显卡的道路上一路走来,直到Arc锐炫系列的回归。
锐炬Xe Max独显的口碑崩塌
实际上,英特尔在2020年推出过一款独显——锐炬Xe Max,该显卡首发于宏碁非凡S3x轻薄本。
锐炬Xe Max本质上是将i7-1165G7、i5-11320H等处理器中集成的锐炬Xe 96核显以独立封装的形式呈现。它们拥有96个EU单元(768个流处理器)、48个纹理单元和24个ROP光栅单元。
由于采用了独立封装设计,锐炬Xe Max可以配备最高4GB的LPDDR4X显存,TDP为25W。这使得其核心频率得以从Iris Xe核显的1350MHz提升至1650MHz,从而在性能上有所增强。
在宏碁非凡S3x轻薄本上,锐炬Xe Max的实际表现却不尽如人意,其性能甚至低于搭载LPDDR4X-4267的锐炬Xe 96核显。
锐炬Xe 96核显和处理器集成在一起,无需额外的功耗开销,而锐炬Xe Max在搭配处理器时,需要笔记本同时为CPU和独显供电,这不仅未能带来性能提升,反而导致续航时间大幅缩短。
英特尔对于锐炬Xe Max似乎也并不再多提,未来的关注点将更多集中在Arc锐炫系列上。
Arc锐炫独显的三大系列
英特尔的Arc锐炫系列显卡,展现了其雄心壮志。该系列包括Arc 3、Arc 5和Arc 7三个不同层级,分别针对主流游戏、性能游戏和高端游戏市场。
其中,Arc 3系列将在下月开始量产,包含Arc A350M和Arc A370M,主要针对第12代酷睿P系列处理器,与AMD Radeon RX 6300M独显、锐龙6000系列集成的Radeon 680M核显以及NVIDIA GeForce MX550级别的显卡展开竞争。
而Arc 5和Arc 7系列则预计在今年初夏发布。Arc 5系列主要与RTX 2050/RTX 3050Ti系列竞争,而Arc 7系列则主要面对RTX 3060及以上级别的显卡。
从今天起,除了传统的“3A”笔记本外,市场上还将出现“3i”笔记本供消费者选择。
Arc锐炫独显的基本构造
英特尔现有的锐炬Xe核显采用的是高效能的Xe LP架构,而Arc锐炫独显则采用了更高性能的Xe HPG架构。
Xe LP架构的核心模块是“EU执行单元”,例如锐炬Xe 80和锐炬Xe 96分别代表集成80个和96个执行单元。更多的EU单元意味着更强的性能。
而Arc锐炫独显的Xe HPG架构则以“Xe内核”(Xe Core)为基本模块。每个Xe内核包括16个256位矢量引擎(XVE)、16个1024位矩阵引擎(XMX)、192KB共享缓存和载入存储单元,缓存能够根据工作负载在一级缓存和共享本地内存(SLM)之间动态分配。
每4个Xe内核组成一组“渲染切片”(Render Slice),除了包含4个Xe核心,还集成了4个光追单元、4个纹理采样器、几何前端、光栅前端、HiZ单元以及2个像素后端。它们不仅支持DX12 Ultimate和Vulkan,还支持DXR光追和Vulkan光追技术。
Arc锐炫独显最多可以集成8组渲染切片。
Arc锐炫独显的型号解析
Arc锐炫系列显卡的不同型号主要由渲染切片的数量决定。Arc锐炫系列有两种封装版本,其中的满血版“超大杯”芯片编号为“ACM-G10”,最多集成8组渲染切片,即32个Xe内核(512个执行单元)、32个光追单元和16MB二级缓存,搭配256bit GDDR6显存,并支持PCIe 4.0 x16连接通道。
另一种封装为“小杯”,芯片编号为“ACM-G11”,集成最多2组渲染切片,包含8个Xe内核(128个执行单元)、8个光追单元和4MB二级缓存,搭配96bit GDDR6显存,并支持PCIe 4.0 x8连接通道。
无论是“超大杯”还是“小杯”,Arc锐炫独显均配备2个Xe媒体编解码引擎和4个显示通道。
在Arc 3系列中,Arc A370M使用的就是“ACM-G11”封装芯片,拥有完整的8个Xe内核(等效128个执行单元)和8个光追单元,但其显存位宽为64bit,核心频率1550MHz,功耗范围在35W~50W之间。
Arc A350M则在A370M的基础上屏蔽了2个Xe内核,仅剩6个Xe内核(等效96个执行单元)和6个光追单元,显存位宽为64bit,核心频率降至1150MHz,功耗范围在25W~35W之间。
Arc 5系列和Arc 7系列均采用了“ACM-G10”封装芯片。Arc 5系列目前仅有Arc A550M一款型号,内置4个渲染切片,包括16个Xe内核(等效256个执行单元)和16个光追单元,核心频率为900MHz,搭配128bit位宽的8GB GDDR6显存,功耗为60W~80W。
Arc 7系列中的顶级型号为Arc A770M,拥有8组渲染切片,32个Xe内核(等效512个执行单元)和32个光追单元,核心频率高达1650MHz,搭配256bit位宽的16GB GDDR6显存,功耗范围达到120W~150W。
Arc A730M则在A770基础上屏
蔽了2组渲染切片,配备24个Xe核心(等效384个执行单元)和24个光追单元,核心频率为1100MHz,显存为192bit位宽和12GB,功耗范围在80W~120W之间。
Arc锐炫独显的独特功能
需要特别指出的是,Arc锐炫系列独显的核心频率能够根据实际负载自动调整,前面提到的频率值仅为平均值。
鉴于Arc锐炫显卡将与英特尔第12代酷睿处理器搭配使用,英特尔为此引入了Deep Link技术,这使得CPU与GPU之间的协同工作更加高效,从而释放出更多潜力。
Deep Link技术支持动态功率共享,根据不同的负载情况动态调整CPU和GPU的功耗分配。例如,在游戏场景中,系统会将更多的功耗分配给GPU,这与AMD的SmartShift技术具有类似的原理。
Deep Link技术还支持超级编码,通过oneVPL API,Arc锐炫显卡和锐炬Xe核显可以共同进行视频编码,将不同的帧画面分别处理后再进行合成。
Deep Link技术还具备超级算力,基于机器学习的MLS框架,结合XMX引擎加速,可以智能地将计算任务分配到Arc锐炫独显及锐炬Xe核显的计算引擎上。例如,可以让它们分别处理视频画面的不同区域,然后再合成输出。
官方数据显示,在内容创作应用场景中,第12代酷睿处理器配合Arc锐炫独显,通过动态功率共享、超级编码、超级算力的加持,可以分别实现最多30%、60%和24%的性能提升。
利用XMX矩阵引擎,Arc锐炫显卡原生支持高效的XeSS超级采样技术,其工作原理类似于NVIDIA的DLSS和AMD的FSR。XeSS通过低分辨率渲染结合高分辨率缩放输出,提高游戏帧率,同时提供类似或超越原生画质的游戏体验。
Arc锐炫独显还内置了强大的Xe媒体引擎,支持最高8K6