Intel: 胜与败
Intel: 胜与败
巅峰时期的空转
2025年4月6日
本文是系列文章的延续。您可能对 硅谷的开端、Fairchild、Intel 的创立、x86 架构的开端、Intel 向处理器公司的转型、i960 和 i486、Intel Inside 营销活动、FDIV 错误和 Pentium Pro、MMX、Pentium II 和 Pentium III、Pentium M 以及 Intel Core 的发布感兴趣。
需要快速说明的是,到目前为止,我一直避免使用 Intel 的微架构名称,因为该公司的整体产品品牌和制程节点尺寸就足够了。从现在开始,我将不得不开始使用 Intel 的命名来区分产品,因为他们的产品品牌变得......过于数字化了。此外,为了将事物置于历史视角中,正如之前提到的,Pentium 将是 i586,Pentium Pro (也即 Pentium M) 将是 i686,Pentium 4 将是 i786,64 位 Intel Core 系列将是 i886。
在 2008 年初,Intel 处于强势地位。虽然他们不再拥有掌上设备领域,但他们是桌面和笔记本电脑 CPU 市场的王者。没有人能与他们硬件的性能相媲美,也没有人能与他们的制造能力相媲美。然而,该公司在产品方面确实存在一个缺口。
Intel Atom Bonnell 芯片照片,图片来自 Intel
2008 年 3 月 2 日,Intel 推出了采用 Bonnell 微架构的 Atom CPU 系列,该架构采用公司 45nm High-K Metal Gate 工艺制造。在这里,Intel 重新引入了经典的 32 位 x86 设计。第一代 Intel Atom CPU 是按顺序执行的,大多数指令_没有_被翻译成 RISC 微指令,并且没有片上内存控制器。Intel 确实通过 Atom 带回了超线程技术,并且还为它配备了 SSE。有趣的是,Bonnell Atom 缺少专用的整数乘法/除法单元,这些任务被移交给 SIMD 浮点单元。由于按顺序执行,内存延迟是一个严重的问题,因此 Atom 获得了 32K L1 指令缓存、24K L1 数据缓存和 512K L2 缓存。Atom 还有两个硬件预取器,一个从 L2 到 L1,另一个从系统内存拉取到 L2。这些芯片与采用 130nm 工艺制造的 Intel Poulsbo 芯片组配对。Poulsbo 提供了北桥和南桥,具有 2 个 PCIe、8 个 USB2 主机端口、1 个 USB2 客户端端口、3 个 SDIO/MMC、高达 1GB 的 DDR2、IDE、Azalia 音频和 Intel GMA 500 显卡(获得 Imagination Technologies PowerVR SGX 显卡核心和 VXD HD 视频引擎的许可)。这种显卡的情况有点尴尬。该芯片能够解码 1080p 视频,但只能输出 1366x768。然而,它只需 120mW 即可完成解码。
首批发布的 Atom 部件代号为 Silverthorne,这些是单核部件。功耗最低的是 Z500,空闲时为 80mW(平均 160mW,TDP 为 0.65W),时钟频率为 800MHz,FSB 为 533MHz。功能最强大的是 Z540,频率为 1.86GHz,FSB 为 533MHz,空闲时功耗为 100mW(平均 220mW,TDP 为 2.4W)。这些可以与 Intel 无线芯片和电池控制器配对,然后成为 Intel Centrino Atom。第二个系列是 N230、N270 和 N330。前两个于 6 月下旬推出,第三个于 9 月推出。这些将 L1 缓存增加到 64K,将 Atom 带到 64 位,并且在 N330 的情况下,将核心数量增加到两个。虽然这些后来的 Diamondville 部件支持 EM64T,但它们使用的大多数系统都不支持。此外,尽管这些芯片效率高,大小大约相当于一粒米,并且在性能上通常优于当时的 ARM 芯片,但 Poulsbo 是一个物理上很大的封装,这使得 Atom 不适合用于掌上设备产品。总系统功耗通常也大于当时掌上设备所需的范围。
2008 年 11 月 11 日,Intel 推出了 Nehalem 微架构,首先是 Core i7 和 Xeon CPU 的 Bloomfield 系列。按照 Intel 的经典命名方案,这些应该是 i986 系列。这些处理器是为新的 LGA1366 插槽构建的,完全是 64 位的,同时保留了 32 位和 16 位的向后兼容性,并支持具有片上内存控制器的三通道 DDR3 RAM。这些芯片将 SSE4.2、TurboBoost 和带有扩展页表的 VT-x 带到了 Intel 的产品中。由于 PCIe 2 控制器、内存控制器和 DMI(直接媒体接口)都在芯片上,Intel 实际上放弃了以前 CPU 上使用的普通北桥/南桥芯片组的区别,他们实现了 QPI(QuickPath Interconnect)来连接 CPU、内存和 I/O 控制器。这些新 CPU 也是单个芯片上的多核,这需要更多的改变。缓存现在是每个核心 32K L1 指令缓存、32K L1 数据缓存和 256K L2 缓存,所有核心共享一个 8MB L3 缓存。超线程作为 SMT(同步多线程)在 Nehalem 上重新实现,并允许每个核心同时运行两个线程。Nehalem 的第一个迭代代号为 Bloomfield,第一个 Bloomfield CPU 采用 Intel 的 45nm 工艺制造,拥有 7.31 亿个晶体管。Bloomfield 系列最初有三个部件,它们都是 Intel Core i7 SKU:920、940、965。这些部件的 TDP 均为 130W,具有四个核心、八个线程、8MB 的 L3 缓存,它们的区别仅在于 QPI 带宽和时钟速度。920 的基本时钟为 2.66GHz,睿频为 2.93GHz,QPI 为 4.8GT/s,940 的基本时钟为 2.93GHz,睿频为 3.2GHz,QPI 为 4.8GT/s,965 的基本时钟为 3.2GHz,睿频为 3.46GHz,QPI 为 6.4GT/s。所有这些新技术以及 Nehalem 芯片的功耗比 Core 2 大约低 20%,同时仍然提供更好的性能。
在年底,Craig Barrett 宣布他将于 2009 年 5 月辞去董事长一职,由 Jane Shaw 接任。该公司公布了 2008 年的收入为 375 亿美元,利润为 52.9 亿美元,虽然低于上一年(这并不奇怪,因为 2008 年发生了经济动荡),但该公司的营业收入更高,研发支出大致相同,长期债务大约减少了 1 亿美元,资本支出大约增加了 10 亿美元,员工人数减少了约 3000 人。
在 2009 年第一季度内,Intel 发布了基于 Nehalem 的 Xeon。其中大多数是四核部件,但也有一些双核部件。TDP 的范围从 38W 到 130W,缓存从 4M 到 8M,QPI 速度从 4.8GT/s 到 6.4GT/s,基本时钟从 1.86GHz 到 3.33GHz。
该公司于 2 月份宣布了其 32nm 工艺。该工艺是先前使用过的 High-K Metal Gate 的延续,但它增加了自对准过孔图案化。光刻技术为 193nm,晶圆为 300mm,栅极长度为 30nm,栅极间距为 112.5nm。
正如预期的那样,Jane Shaw 于 5 月份成为董事长。她获得了英国伯明翰大学的生理学博士学位,最近担任 Aerogen 的董事长。虽然她自 1993 年以来一直是董事会成员,但她是自公司成立之初的 Arthur Rock 以来,第一位从 Intel 外部引入的董事长,而不是担任过公司的 CEO。
在今年晚些时候,主流 Nehalem/Bloomfield CPU 有了单核、双核和四核型号,并且移动 Nehalem/Clarksfield 部件有了四核型号。
Intel 在 2009 年结束时收入为 351 亿美元,利润为 43.6 亿美元。该公司的债务增加到 20 亿美元,但这并不是真正的威胁,因为 Intel 拥有 111 亿美元的现金储备。该公司的员工人数减少到 79,800 人。
Intel Westmere 芯片照片,图片来自 Anandtech
2010 年 1 月 7 日,Intel 宣布了使用 Intel 32nm 工艺的 Nehalem/Westmere 微架构。低端系列包括用于 Celeron 和 Pentium 的没有超线程的双核部件,以及用于 i3 和 i5 的具有超线程的双核部件。i7 部件现在是六核十二线程部件。插槽情况很糟糕,低端部件使用 LGA1156,而高端部件使用 LGA1366,多处理器 Xeon 使用 LGA1567。虽然每个细分市场的 Xeon 版本都与消费类变体使用相同的插槽,但多处理器部件(而不是单处理器或双处理器)使用它们自己的特殊插槽。Celeron、Pentium、i3、i5 和 i7 的移动变体在今年晚些时候推出。这一代具有关闭单个核心以节省功耗的能力,可以在所有核心上加速以提供性能,具有 AES 加密/解密加速,用于双核部件的封装 GPU,支持 16 位实模式的虚拟化,并支持 1GB 的_大页_。最后一点的基本前提是,CPU 以称为页面的块将 RAM 分配给进程。默认页面大小通常为 4K,当系统具有大量内存时,页面数量可能会变得很大。页面越多,定位内存的性能损失就越高。对于 4K 页面大小,使用 1GB RAM 的进程将有 262144 个条目。更大的页面大小将减少页表条目的数量。更大的页面大小与消费者相比,与服务器市场的相关性更高,部分原因是服务器通常具有更多的内存,但也由于软件兼容性。消费者倾向于在一台机器上运行各种软件,而服务器通常只运行一个或几个应用程序。并非所有软件都适用于大页面大小。
在 2010 年 12 月,Intel SSD 310 问世。这是一款使用 mPCIe 边缘的 mSATA SSD。它是一款 34nm MLC NAND 闪存驱动器,有 40GB 和 80GB 版本。40GB 驱动器在空闲时仅消耗 75mW,而 80GB 驱动器则将其加倍至 150mW。在性能方面,40GB 驱动器可以提供 170MB/s 的读取速度和 35MB/s 的写入速度,而 80GB 型号可以提供 200MB/s 的读取速度和 70MB/s 的写入速度。所有这些的物理尺寸仅为 50.8mm 长、29.85mm 宽和 4.85mm 厚。它的重量仅为 10 克。早期的采用者包括 Lenovo (ThinkPads) 和 DRS Technologies (平板电脑)。
在整个 2010 年,PC 的平均销量超过每天 100 万台,PC 市场在全球增长了 17%,互联网流量超过了以往所有年份的总和,而 Intel 从中受益匪浅。即使是不起眼的 Intel Atom 也很受欢迎(尤其是在上网本市场中),Intel 在 2010 年出货了第 8000 万颗 Atom。Intel 在 2010 年结束时收入为 436 亿美元,利润为 114 亿美元。他们的员工人数增加到 82,500 人,债务增加到 20 亿美元,该公司持有近 167 亿美元的现金。
在 2011 年初,Intel 意识到他们的霸权地位并没有得到保证,并且可能受到威胁。该公司将其在 PC 领域的竞争对手确定为 AMD、Qualcomm 和 VIA,在服务器领域,名单包括 AMD、IBM 和 Oracle (Sun),在嵌入式领域,名单包括 AMD、Broadcom、Freescale、MediaTek、Nvidia、Qualcomm、Samsung、STM 和 TI。Intel 曾经凭借 XScale 为 Blackberry 和 Palm 提供服务,从而统治了嵌入式市场,但现在该公司几乎完全退出了该市场。为了试图在低功耗市场中保持影响力,Intel 开始大力投资 Atom 及其周围的生态系统。该公司启动了一个名为 MeeGo 的 Linux 项目,启动了 Atom 开发者计划,宣布与 Google 围绕 Android 建立合作伙伴关系,与 Motorola Mobility 围绕手机和平板电脑建立合作伙伴关系,并开始与 ZTE 合作开发基于 Atom 的智能手机。
在 CPU 方面,Intel 于 1 月 9 日在其 32nm 工艺上推出了 Sandy Bridge。这些改进了 Nehalem,并提供了高级向量扩展、每个芯片最多 8 个物理核心、1536 个条目的微指令缓存、更大的调度器缓冲区、在具有集成 GPU 的单元上硬件加速视频编码和解码,并将集成的 GPU 移到芯片上(而不是封装上)。Sandy Bridge 在相同的时钟频率下比 Nehalem 大约提高了 11% 的性能,并且 iGPU 的性能大约是上一代的两倍。Sandy Bridge 芯片有大量的 SKU,涵盖 Celeron、Pentium、i3、i5、i7 和 i7 Extreme。这些是用于 LGA1155 插槽的 Core i3 2100T 到 Core i7 2700K。还制造了 Xeon 和移动部件。这些被认为是_第二代_ Core CPU,并且随着 AVX 的添加和 GPU 的集成,按照 Intel 最初的命名方案,这些将是 i801086 系列。因此,我们在这里看到 Intel 与 Intel Core Duo/Solo 和 Core 2 都决裂了,他们将 Nehalem (i986) 视为当前和未来几代 Core 的起点。
在 2009 年的 Intel 开发者论坛上,该公司推出了 Light Peak,一台原型 Mac Pro 通过一根大约 30 米长的光缆(端接于 USB 的变体)运行两个 1080p 视频流、LAN 和存储设备。这是由带有两个光总线的 PCI Express 卡驱动的,每个总线有两个 Light Peak 端口,每个端口提供 10Mbit/s。然后在 2010 年 5 月在布鲁塞尔举行的 Intel 欧洲研究展示会上看到了 Light Peak,它从一台笔记本电脑实现了大致相同的性能。在 2011 年 1 月,Light Peak 以 Thunderbolt 的身份走向世界,它通过两个串行信号将 PCI Express、DisplayPort 和直流电源组合到一个端口和电缆中。Thunderbolt 也可以菊花链连接。此标准的第一个版本使用与 Mini DisplayPort 相同的物理连接器,并使用铜缆而不是光缆。这种改变主要是为了实现电源传输。第一批采用 Thunderbolt 的设备是 2 月份发布的 Apple MacBook Pro,5 月份发布的 iMac,以及 7 月份发布的 Macs Mini 和 MacBook Air。
2011 年 4 月 28 日,Intel 以 76.8 亿美元完成了对 McAfee 的收购。这是 Intel 迄今为止最大的一笔收购,该公司的股价在消息发布后下跌了 3.5%。这次收购当时对很多人来说意义不大,但 McAfee 拥有大约 19.3 亿美元的订阅收入,Intel 试图实现多元化,试图围绕其产品构建一个软件生态系统,并且自 Web 出现以来,安全性一直是 PC 市场日益关注的问题。
2011 年 5 月 4 日,Intel 向世界宣布了其 22nm 工艺,在这里,Intel 再次引领了全新的晶体管技术。到目前为止,市场一直只使用平面晶体管。随着 Intel 的 22nm 工艺,世界进入了 FinFET 时代。在 FinFET 设计中,栅极从三面环绕沟道,从而减少了功耗并降低了传播延迟(信号通过晶体管所需的时间)。这是 Intel 的第三代高-k 金属栅极晶体管,称其为 22nm......是一个奇怪的选择。鳍片宽度为 8nm,鳍片高度为 34nm,鳍片间距为 60nm,栅极长度为 26nm,栅极间距为 90nm。这些规格都不是 22nm。
从历史上看,工艺节点的常用名称来自晶体管栅极的宽度和半间距(芯片上两个相同特征之间距离的一半)。因此,如果人们讨论的是 1 微米工艺,那么栅极宽度和半间距的尺寸都约为 1 微米。在之前的 32nm 工艺上,栅极长度接近 32nm,但实际上更小。Intel 的 45nm 工艺也是如此,栅极长度实际上约为 25nm。因此,如果 Intel 将规则更改为以栅极长度而不是宽度命名工艺,那么这些节点名称就表明了_某些东西_。在这里,栅极长度更大。那么,为什么叫这个名字呢?嗯,这些命名规则都失去了意义。首先,缩小栅极长度和宽度在大约 25nm(或 Intel 的 45nm 工艺)时停止对性能产生有意义的积极影响。借助 FinFET,即使几何形状有效冻结,晶体管密度也可以继续增加。随着时间的推移,互连和金属层的数量也随着制造技术的改进而增加。这允许更多的逻辑优化和性能提升。所以,这个名字?就 Intel 的工艺节点名称而言,人们实际上可以这样认为:鉴于早期 CPU 的原始性能和晶体管密度,工艺节点需要是什么才能产生现在显示的效果?
在 5 月 31 日的 Computex 上,Intel 推出了 Ultrabook 计划,取代了 Centrino。Apple 的 MacBook Air 几年前引起了轰动,它使用了 Intel 的 CPU。随着笔记本电脑和平板电脑变得越来越普遍,Intel 希望在整个行业推广类似的设计。Intel 在 1990 年代开始向 OEM 提供设计图,这是该过程的演变。超极本实际上是一款轻薄的笔记本电脑,仍然具有一定的性能。更具体地说,有问题的笔记本电脑的重量不得超过 3.1 磅,厚度不得超过 0.71 英寸,至少提供 5 小时的电池续航时间,并在最多 7 秒内从休眠状态恢复。第一批超极本在年底前发布。
Intel Xeon Phi,Knights Corner 芯片照片,图片来自 Intel
2011 年 6 月,SGI 宣布他们打算在即将推出的超级计算机中使用 Intel MIC(多集成核心)以及 Intel Xeon CPU。这款 Intel MIC 产品代号为 Knights Corner,将采用 Intel 的 22nm 工艺构建。Intel 已经在超级计算机市场中占据了极其强大的地位,为其提供约 80% 的动力,但 MIC 是新的。11 月,Intel 展示了能够达到 1TFLOPS 的 Knights Corner 协处理器。这是单个芯片首次能够达到这种性能水平。在 1997 年,这是世界上最好的超级计算机 ASCI Red 的性能,截至 2011 年,这种能力可以在 Intel 的单个芯片中获得。Knights Corner 的核心基于最初的 Pentium 设计,与 Intel Atom 非常相似,但增加了 4 路 SMT、512 位 SIMD(类似于 AVX-512)、64K L1、512K L2 和连接处理器和内存的环形总线。
12 月,该公司宣布完成了又一次重组。该公司现在分为几个主要部门:PC 客户端集团 (PCCG)、数据中心集团 (DCG)、移动通信、智能系统、上网本和平板电脑、超移动、McAfee、Wind River、软件和服务、非易失性存储解决方案。对于 2011 年,PCCG 约占 Intel 收入的三分之二,DCG 约占 19%。换句话说,高性能 CPU 约占 Intel 总收入的 85%。2011 年的总收入高达 539 亿美元,利润为 129 亿美元,现金为 209 亿美元,债务为 70 亿美元,资产为 711 亿美元,该公司拥有大约 100,100 名员工。
Intel Medfield 手机参考设计,来自 Intel
Intel 于 2012 年 1 月宣布了围绕 Intel Atom 构建的 Medfield 平台。此时的 Atom 继续是双发射、按顺序执行、超线程的,具有 16 级整数流水线,并且没有专用的整数乘法或除法(为此使用了 FP 单元)。它具有 24K L1 和 512K L2,以及一个 256K 的超低功耗 SRAM,当 CPU 处于最低功耗睡眠状态时,它保存 CPU 状态和缓存数据。Atom CPU 与时钟频率为 400MHz 的 PowerVR SGX 540 配对。对于视频解码和编码,Medfield 使用了 VDX385 和 VDE285。Medfield 采用 Intel 的 32nm 工艺制造,在 100MHz 时的功耗为 50mW,在 600MHz 时的功耗为 175mW,在 1.3GHz 时的功耗为 500mW,在 1.6GHz 时的功耗为 750mW。虽然 Intel 希望为其移动业务提供自己的 MeeGo Linux 发行版,但他们知道市场在哪里,Google 宣布了对 Medfield 的 Android 支持,并且正是 Intel 自己在修复错误并将更改提交给 AOSP,同时试图使 Intel 的 Android 端口成为一个真正不错的选择。为了达到这一点,Intel 聘请了 Mike Bell(以前在 Apple 和 Palm 工作),并给了他很大的自由来组建他的团队并完成工作。当 Gigabyte Orange Santa Clara 在 3 月份针对当时运行 Android 的 ARM 手机进行基准测试时,它排名第三。Medfield 输给了小米 Mi-One Plus 和 Asus Transformer Prime,但击败了 Samsung Galaxy Nexus。
Intel 的工作可能没有改变世界,但它确实给了该公司一些胜利。在 2012 年 4 月,在印度首次发布的 Lava Xolo X900 成为第一款可供消费者使用的 Intel Atom 驱动的智能手机。它使用了 Medfield SoC、1GB 的 RAM、16GB 的闪存存储、具有 NFC 功能、1024x600 LCD、8 兆像素摄像头,并在发布时运行 Android 2.3,但 Android 4 很快就推出了。2012 年 8 月,ZTE 在 Medfield 平台上发布了带有 Android 4.0 的 Grand X IN。它有一个 4.3 英寸的屏幕,分辨率为 960x540。Lenovo K800 于 2012 年 9 月发布,配备 4.5 英寸 1280x720 IPS 显示屏、1GB RAM、16GB 闪存、micoSDHC 扩展、8MP 摄像头、802.11n、GPS、Bluetooth 2.1 和 Android Gingerbread。从我能找到的所有信息来看,Lenovo K800 是第一轮 Intel 驱动的智能手机中最好的一款,并且普遍受到好评。
在 2012 年 4 月,Intel 的第三代 Core CPU Ivy Bridge 通过 Intel 的 22nm 工艺进入市场,适用于 LGA1155。这些再次跨越了 Celeron 到 Xeon 的产品线。这些主要缩小了 Sandy Bridge 芯片,但由于 22nm 工艺,功耗降低了近 50%。还添加了 RDRAND 指令。
5 月,Jane Shaw 退休,Andy Bryant 成为董事长。6 月,Knights Corner 成为 Intel Xeon Phi,并有 57、60 和 61 核的 SKU。Xeon Phi 确实为一些最好的超级计算机提供了动力。Ultrabook 计划的业绩并不如 Intel 希望的那样好。2012 年的销量约为 1000 万台。令人失望的 Ulrabook 销量根本没有损害公司,芯片巨头在 2012 年结束时收入为 533 亿美元,利润为 110 亿美元,员工人数为 105,000 人。
对于那些关注 Intel 的人来说,2013 年并不是非常令人兴奋。老实说,在 Intel 历史上的这个时刻......即使是 FinFET 也没有像 High-K Metal Gates 那么令人兴奋,而后者也没有像 1990 年代发生的任何事情那么令人兴奋。这篇文章的延迟可能更多地说明了我对这个时代的感受。最大的新闻是 Paul Otellini 的退休,Brian Krzanich 随后晋升为 CEO,Thunderbolt 2 的发布和 Haswell 的发布。
Krzanich 于 1960 年 5 月 9 日出生于 Santa Clara。他参加了 San Jose State University,并获得了化学学士学位。毕业后不久,他于 1982 年开始在新墨西哥州的 Intel 工厂工作。他在 1996 年晋升为亚利桑那州 Chandler 工厂的经理。他于 2007 年开始在 Intel 领导工厂和供应链管理,并于 20