英特尔 AVX10 放弃可选 512-bit:未来 E-Core 将仅支持 AVX10 256-bit
英特尔 AVX10 放弃可选 512-bit:未来 E-Core 将仅支持 AVX10 256-bit
作者:Michael Larabel 于 2025 年 3 月 19 日美国东部时间 06:48 在 Intel 发表。11 条评论
英特尔更新了他们的 AVX10 白皮书以及与这个下一代高级向量扩展标准相关的开源编译器补丁…… 虽然 AVX10 原本计划允许 256-bit 或 512-bit 模式,具体取决于处理器的能力,但英特尔已经放弃了仅使用 256-bit 的方案,转而全面采用 512-bit。 这似乎表明,未来的英特尔 E-core 将能正确支持 AVX 512-bit 操作! 看起来 AMD 自 Zen 4 以来对 AVX-512 的广泛支持,以及之前英特尔追求的相当混乱的 AVX10 实现现在已经结束。 随着今天发布的更新的 GCC 编译器补丁,为未来 AVX10 版本提出的 256-bit 混乱方案正在被移除。
英特尔今天发布了一份新的 AVX10 白皮书,其中他们删除了对 256-bit 的引用:
"删除了对 256-bit 最大向量寄存器大小、向量长度支持的枚举以及支持嵌入式舍入的 256-bit 指令的引用。"
该白皮书此前指出,到目前为止 "可选的 512-bit FP/int" 支持以及其他 256-bit 引用:
但在今天发布的 AVX10 白皮书 v3.0 修订版中,AVX10.2 上的 "可选的 512-bit" 引用已被明确删除:
它还表明,这种 AVX10.2 支持将在 P-core 和 E-core 上都能找到。 在今天发布的 GCC 补丁 中也明确指出:
"在这份新的白皮书中,所有平台都将支持 512 bit 向量宽度(之前,E-core 最高支持 256 bit,导致混合客户端和 Atom Server 仅支持 256 bit)。 此外,256 bit 舍入不是那么有用,因为我们目前在 E-core 上直接具有舍入功能,并且不需要使用 256-bit 舍入作为某种变通方法。 硬件将删除该支持。 因此,无需将 avx10.x-256/512 添加到编译器选项中。 我们只需要一个简单的 avx10.x,它支持所有向量长度。 此更改还使 -mno-evex512 不那么有用。 它是通过 avx10.1-256 引入的,用于在传统平台上编译仅 256 bit 的二进制文件,以便对 avx10.x-256 进行部分试验。 我们还需要做的是删除 256 bit 舍入。"
对于英特尔来说,这是一个相当晚的转变。 自 2023 年宣布 AVX10 以来,存在这种 256-bit 最大向量宽度的可能性。 但现在看来,AVX10 硬件都将具有 512-bit 向量宽度支持。 这对于桌面和密集型 Xeon E-core 服务器平台上的未来 E-core 处理器来说是个好消息。
由于这是一个较晚的更改,英特尔编译器工程师正在对 GNU Compiler Collection 进行这些最后一刻的修改,为即将发布的 GCC 15.1 稳定版本做准备…… 确实是在最后一刻挤时间,以便将这些 AVX10 修改落实到 GCC 15 中。 GCC 15 提供了 初始的 AVX10.2 支持,并且去年合并时添加了 256-bit 和 512-bit 两种模式。 很高兴看到发生这种合乎逻辑的改变,但不幸的是,这个决定是在宣布 AVX10 两年后做出的。 全面采用 512-bit 希望能够清理 x86_64 微架构特征级别处理,而无需现在处理这种 256-bit 与 512-bit 的限制。 这也将使未来的英特尔 Xeon E-core 处理器能够更好地与 AMD 的密集型 EPYC 核心设计竞争,自从引入 Bergamo (Zen 4C) 以来,该设计已在所有地方支持 AVX-512。