,2020 年,赛灵思发布了其首款“一体化 SmartNIC平台”——AlveoU25 的数据中心加速卡,在单颗器件上实现了网络、存储和计算加速功能的融合。
作为 Xilinx Alveo系列的后继产品,AMD 今天推出了一款新的数据中心专用加速卡 ——Alveo MA35D。与 Alveo U30 一样,MA35D 是专为数据中心设计的纯视频编码卡,目前已经向其合作伙伴提供了样品。
简单来说,最新一代的 Alveo 加速卡有着比其前身更显著的性能优势,它可实现四倍的最大同时视频流,同时还增加了 AV1 和 8K 分辨率编码支持。
这款加速卡主要客户是直播媒体服务和其他交互式视频服务 ,所有这些都需要在服务器环境中实时同时对大量视频流进行编码。
该公司预计新品将在今年第三季度开始出货,参考价 1595 美元。
说回到 Alveo MA35D 硬件本身,上一代 Alveo U30 仅支持 H.264 和 H.265 编码,最多可以编码 8 个 1080p 流,而 Alveo MA35D 则扩展到 32 个 1080p 流,同时加入了对最新一代 AV1 编解码器的支持,而且最大分辨率已从 4K 提升到 8K。
该卡的核心是 AMD 未命名的视频编码 ASIC,他们称其为视频处理单元 。
据悉,MA35D 包含两个 vpu 部分,每个 vpu 都有一颗 8GB LPDDR5 芯片,并通过 PCIe 5.0 x4 连接到处理器。值得一提的是,这里的 VPU 基于 5nm 工艺制造,但奇怪的是 AMD 没有透露代工厂,所以我们认为可能是三星 5nm 工艺。
每个 VPU 部分包含 4 个视频编码块,并增加了使其成为一个全功能芯片所需的各种附件块,其中两个全功能编码块支持 H.264, H.265 和 AV1,而另外两个仅适用于AV1。
此外,VPU 上还包括用于转码的视频解码器模块、内存控制器、管理控制器、比特率缩放器、组合引擎和 22 TOPS 吞吐量 AI 处理器,以进一步提高卡的视频编码质量。
与旧的 U30 卡相比,能源效率是另一个主要的优势,AMD 认为这也是他们在竞争中的一个重要优势。该卡的正式 TDP 是 50 瓦,但实际上 AMD 发现该卡的典型功耗接近 35 瓦,或者在 1080p60 的情况下每流略高于 1W。与 U30 相比,这一数据流的能耗降低了 66%,而 U30 对于单个 1080p 数据流的能耗略高于 3W。
同时,新的肺泡 MA35D 及其 VPU 是一个 AI 加速块。与基于 GPU 的产品不同,这不是用于图像识别等准相关的人工智能任务; 相反,AMD 正在使用 AI 加速器将额外的数据输入他们的视频编码器,以进一步提高编码质量,它采用了RISC-V 设计,AI 处理器的性能额定为 22 TOPS。
与上一代 U30 相比,能效是这款加速卡的另一个优势。该卡 TDP 仅有 50 瓦,但实际上典型功耗约为 35 瓦,而在 1080p 60 帧的情况下略高于 1W。与 U30 相比,这一数据足足降低了 66%。
这款卡可完全通过 PCIe 插槽实现供电,只需要使用 PCIe x8 连接器 即可,而且 MA35D 采用了被动散热。
与基于 GPU 的产品不同,AMD 正在使用 AI 加速器将额外的数据输入他们的视频编码器,以进一步提高编码质量。这里的 AI 处理器的性能为 22 TOPS,可以逐帧评估流,然后使用该分析来调整芯片其余部分使用的编码参数。
此外,AMD Alveo MA35D 有着相对激进的图像质量要求。AMD 表示,MA35D 可以在 H.264 模式下以 55% 的比特率 提供与 Alveo U30 相同的图像质量。