英特我数据中间GPU Flex深度掀秘:低浑老片子秒变超浑8K!
Intel Xe GPU家族枝繁叶茂,可以说只要是能用到GPU的地方,几乎都能找到它的身影:笔记本和台式机核显、独立游戏显卡、服务器和数据中心、超级计算机……
今年8月底,Intel发布了全新的数据中心Flex系列GPU(曾用代号Arctic Sound-M),基于与游戏显卡Arc A系列同款的Xe HPG微架构,主要面向视频转码与传输、视觉AI推理、云游戏、桌面虚拟化等应用场景。
乍一看,这种产品似乎和普通消费者非常遥远,但事实上我们用到的很多服务,都是它在幕后默默提供。
Intel市场营销集团副总裁、中国区云与行业解决方案部总经理梁雅莉指出:“当今的数据中心基础设施,承担着计算、编码、解码、传输、存储和显示视觉信息的巨大压力。与此同时,GPU的应用场景正在快速增长,除了绘制像素,GPU在人工智能、深度学习和科学计算等领域的应用,也正在帮助人类解决复杂的计算挑战。”
“放眼于日益增长的算力需求,Intel基于 XPU战略,打造了跨CPU、GPU、FPGA、IPU等多种架构的算力资源。特别地,面向云计算,我们最新的Intel Flex 系列 GPU,采用了突破性设计,能够更有针对性地满足现阶段的相关计算需求,助力广泛生态伙伴创新。”
今天,我们就来研究一下Intel Flex系列GPU到底能干什么,并了解一下具体的应用实例。
一、Intel GPU Flex实力解析
该系列有两款型号:
Flex 170:32个Xe核心、32个光追核心、256-bit 16GB GDDR6显存、150W功耗。
Flex 140:16个Xe核心、16个光追核心、192-bit 12GB GDDR6显存、75W功耗。
按照Intel市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰的解读,Intel Flex系列GPU最大的亮点之一就是在视频媒体上的强劲实力。
它集成4个Xe媒体引擎、XMX AI 加速单元AV1硬件编解码器,也是Intel在数据中心领域首款支持AV1编解码的独立GPU,基于开源编码器可节约30%以上的带宽,同时也支持AVC(H.264)、HEVC(H.265)编解码,以及VP9解码等。
单卡可以支持多达36路视频流的1080p60转码吞吐量,或者8路视频流的4K60转码吞吐量,能在4U服务器中扩展到10卡并行,而且相比竞品能效更高。
搭配Intel独家的Deep Link超级编码功能,Flex 140可在单卡上配备两套编解码设备,满足“一秒时延”要求,同时提供AV1、H.265 HDR格式的8K60实时转码。
按照Intel官方提供的数据,GPU Flex 140对比NVIDIA A10,经过Intel oneAPl优化之后,8-bit HEVC、AVC、VP9、AV1视频解码吞吐量可分别领先2.6倍、3.5倍、3.5倍、4.4倍之多。
HEVC转码性能,1080p60、4K60格式下可分别领先4.1倍、7倍之多,还支持竞品所不具备的8K60转码。
Intel亚洲AI及视觉计算销售技术高级总监伊红卫指出,AV1作为Intel、Google等共同倡导的新标准,已经成为很多客户的需求,比如广电类客户强烈要求就要AV1,而目前只有Intel一家能提供相关的AV1服务。
云游戏方面,GPU Flex 170/140支持渲染最多68/46路720p30数据流、最多60/20路720p60数据流,而且可以最多6卡并行。
XeSS超采样也没有缺席,这种基于AI模型的图像超分辨率技术,可以大幅缩短画面渲染时间、提高运行帧率,简单地说就是可以在低分辨率下渲染出非常接近高分辨率下的画质。
此外还支持硬件SR-IOV技术,不需要软件授权费用,可大大节约开发与应用成本。
根据官方实测,在《王者荣耀》、《狂野飙车9》、《荒野行动》、《死亡岛:激流》等游戏中,GPU Flex 170 720p分辨率下可提供29-68FPS的帧率,GPU Flex 140也能跑出24-46FPS的帧率,甚至1080p分辨率下也能一战。
庄秉翰指出,从之前Intel发布首款面向服务器数据中心的独立GPU SG1开始,就已经对云游戏做了很多推广,有了很多的技术积累,和云游戏服务商有很多合作。
伊红卫则披露,在全球范围内,Intel已经在Google Play的游戏中验证了错过90款,都是没有问题的。
(图注:720p60、1080p60均在60FPS下渲染、30FPS下编码)
AI推理方面,得益于内置的XMX矩阵扩展计算单元,INT8整数格式下可提供高达256TOPS(每秒256万亿次计算)的算力。
结合OpenVINO框架,AI视觉推力性能可比竞品领先35-55%之多。
为方便挖掘硬件潜力、简化开发流程,Intel还提供了一整套开放式的软件堆栈(Open Software Stack),包括丰富的开源组件和工具。
有了它,可以在oneAPI、openVINO的基础上进行跨架构的统一编程,实现从GPU到GPU、覆盖中间件框架和应用的全平台扩展。
优秀的产品和技术,自然需要广泛ODM/OEM、软件、硬件生态的全力支持,才能真正落到实处,服务大众。
迄今为止,Intel Flex系列GPU已经拥有了超过15款系统设计产品,来自思科、戴尔、慧与(HPE)、新华三、浪潮、联想、宁畅、宝德、超微、超聚变(αfusion)等品牌。
在中国市场上,GPU Flex更是迅速得到了广泛的生态支持,带来了不同领域的解决方案,包括当虹科技、中科大洋、大神科技、字节跳动火山引擎、威尔视觉、亿联网络等等,并得到了中国联通、天翼云(中国电信)、中国移动三大运营商的鼎力支持。
庄秉翰表示:“由像素爆炸带来的大量图形视频类数据,亟需功能强大的数据中心GPU来进行处理。基于全方位的硬件和软件创新,Intel数据中心GPU Flex系列可以灵活处理媒体处理与传输、云游戏、AI推理、VDI多种云工作负载,有效优化使用者的总体拥有成本。”