Phoronix

AMD 发布完全开源的 "Instella" 3B 语言模型

作者:Michael Larabel 于 2025 年 3 月 5 日美国东部时间下午 07:13 发表在 AMD 分类下。14 条评论 AMD 今天,AMD 除了发布 Radeon RX 9070 系列的开源 Linux 驱动程序 之外,还宣布将其新的完全开源的 3B 参数语言模型 Instella 开源。AMD Instella 代表着 "完全开源的最先进的 30 亿参数语言模型 (LMs)"。这些模型在 AMD Instinct MI300X GPUs 上训练,根据 AMD 发布的数据,其性能与 Llama 3.2 3B、Gemma-2 2B 和 Qwen 2.5 3B 等模型相比具有竞争力。 AMD Instella AMD Instella 模型完全从头开始在 Instinct MI300X 硬件上训练,并且完全开源:

"完全开放和可访问:完全开源发布模型权重、训练超参数、数据集和代码,从而促进 AI 社区内的创新和协作。 ... 通过完全开源 Instella 模型,包括权重、训练配置、数据集和代码,我们的目标是促进 AI 社区内的创新和协作。 我们认为透明度、可重复性和可访问性是 AI 研究和开发进步的关键驱动因素。 我们邀请开发人员、研究人员和 AI 爱好者探索 Instella,为其持续改进做出贡献,并与我们一起推动语言模型可能实现的界限。" 想要了解更多关于 AMD Instella 语言模型的信息,请访问 rocm.blogs.amd.com。 AMD Instella 托管在 GitHub 上。 14 条评论 Tweet