你可能正在违反 Llama 社区许可协议
你可能正在违反 Llama 社区许可协议
2025-03-28 · 10分钟 · victorb
目录
- 我真的同意了任何许可协议吗?
- 为什么我需要在我的产品/服务上显著展示“Built with Llama”?
- 为什么我不能为我自己的 Llama 微调模型使用任何我想要的模型名称?
- “可接受使用政策” & 披露你的 AI 系统的危险
- 结论
如果你正在分发或重新分发受“Llama 3.3 Community License Agreement”约束的 LLM 模型,你可能至少违反了你明确/隐含同意的其中一项条款。所有的 Llama 模型及其衍生品(微调等)都受 Llama 社区许可协议的约束。
免责声明:我(作者)不是律师,甚至可能不在与你相同的国家/地区,而且所有这些都非常依赖于管辖权。这篇文章也没有试图概述如果你违反协议会发生什么,而是概述了 Meta 的主张。他们可能根本无法对你提出这些主张。如果你已经与 Meta/Llama 达成了自己的协议,该协议取代了公共许可协议,或者如果你只是任何 Llama 模型的使用者,这也同样不适用。
我现在从 ML/AI 社区得到的感受是,几乎没有人真正阅读并遵守他们在使用 Meta 的 Llama 等模型时同意遵守的各种许可协议。
Llama 被宣传为“开源”模型,但 Meta 本身也在许可协议文本中称其为“专有”,并且有很多与开源不兼容的条件。如果你相信营销是真实的,并且对“开源”有现有的理解,你可能对许可协议做出了不符合现实的假设。
我将尝试从许可协议中挑选出我认为最有可能被忽略的一些要点,以期传播一些我没有看到在社区中成为常识的新信息,因为许多人仍然将 Llama 系列模型称为“开源”。
完整的许可协议可以在这里找到:https://www.llama.com/llama3_3/license (在撰写本文时,修订版为 Llama 3.3 Version Release Date: December 6, 2024
,于 2025 年 3 月 27 日通过浏览器阅读)。
如果你对 Llama 社区许可协议及其使用政策在不同版本之间的变化感到好奇,我已经在另一篇文章中发布了一个快速摘要:How Llama’s Licenses Have Evolved Over Time
我真的同意了任何许可协议吗?
通过点击下面的“我接受”或使用或分发 Llama 材料的任何部分或元素,你同意受本协议的约束。
首先要记住的是,你是否被迫点击按钮/复选框并不重要1,Meta 认为,无论你是从 Huggingface(需要签署协议)、Ollama(不需要签署)还是 Torrents(显然不需要签署)获取 Llama,只要你基于 Llama 构建,该许可协议就适用于你。该许可协议还涵盖了你以任何方式重新分发 Llama,因此例如它也适用于 Ollama。
这让人想起,“Llama 材料”是什么?从许可协议中:
“Llama 材料”是指 Meta 根据本协议提供的 Meta 专有的 Llama 3.3 和文档(及其任何部分)的集合。
因此,该许可协议涵盖了“专有”模型/权重本身以及 llama.com/docs 上的所有文档。很简单。
有趣的是,Meta 在这里称 Llama 为“专有”,而 llama.com 上却称该模型为开源(“Llama is the leading open source model family”),但那是未来的帖子,所以我们现在不要深入探讨。
为什么我需要在我的产品/服务上显著展示“Built with Llama”?
仅适用于 Llama 3 License 及更高版本 Llama 2 License 完全没有此要求。Llama License 版本的更改摘要可以在here找到
下一个部分是我认为几乎每个人都错过的:
i. 如果你分发或提供 Llama 材料(或其任何衍生作品),或包含其中任何内容的产品或服务(包括另一个 AI 模型),你应 (A) 随任何此类 Llama 材料提供本协议的副本;并且 (B) 在相关网站、用户界面、博客文章、关于页面或产品文档上显著展示“Built with Llama”。如果你使用 Llama 材料或 Llama 材料的任何输出或结果来创建、训练、微调或以其他方式改进 AI 模型,该模型被分发或提供,你也应在任何此类 AI 模型名称的开头包含“Llama”。
进一步分解,
如果你分发或提供 Llama 材料 [...] 你应 (A) 在相关网站、用户界面、博客文章、关于页面或产品文档上显著展示“Built with Llama”。
这意味着,如果你分发 Llama 模型、权重或任何衍生品,你需要在某处显著显示“Built with Llama”。因此,例如,对于 Ollama,https://ollama.com/library/llama3.3 需要在该页面的某处显示“Built with Llama”。
或者另一个例子是 openrouter.ai,即使他们允许你使用 Llama 模型或其衍生品,它也没有在任何页面上显示“Built with Llama”。
这也适用于任何“提供 [...] 包含其中任何内容的产品或服务 [...] ”的人,这基本上意味着任何以允许其他人使用的方式使用 Llama 构建产品/公司的人。它基本上涵盖了使用 Llama 的大多数网站,或任何从 Llama 架构、权重、微调等衍生的模型。
缺乏对此条款的执行,使得 Meta/Facebook 似乎不希望强制人们显示此消息,但它仍然存在于你同意分发/使用他们的模型或任何衍生品时同意的条款和条件中。
build.nvidia.com 是一个没有违反此要求的示例:
为什么我不能为我自己的 Llama 微调模型使用任何我想要的模型名称?
上一节的结尾是:
[...] 如果你使用 Llama 材料或 Llama 材料的任何输出或结果来创建、训练、微调或以其他方式改进 AI 模型,该模型被分发或提供,你也应在任何此类 AI 模型名称的开头包含“Llama”。
这意味着,每个来自 Llama “血统”的模型都应该命名为“llama-”,然后是你的模型名称。据我所知,没有很多模型遵循这一点,并且如果存在一些他们不喜欢的衍生模型,这给了 Meta 额外的追究点。
以下是一些违反许可协议这一部分的模型示例:
Hermes 3 - Llama-3.2 3B
- 他们的声明是由 Llama 微调的,但“Llama”没有包含在 Llama 的开头。DeepSeek-R1-Distill-Llama-8B
- 该模型是通过使用 Llama 作为微调目标,使用来自 R1 的数据来“提炼” DeepSeek 的 R1。根据许可协议,也应该在名称的开头包含 Llama 部分。
还有无数其他的例子,可以通过 Hugging Face 上的简单搜索 找到许多。你在该搜索页面上看到的每个从 Llama 衍生的模型都_应该_在名称的开头包含“Llama”,以不违反他们同意的许可协议。
NVIDIA 的“Nemotron”模型是一些公司正确遵守许可协议的示例,因为该模型的完整名称为“Llama-3.3-Nemotron-Super-49B-v1”。
“可接受使用政策” & 披露你的 AI 系统的危险
最后,我们来看看“可接受使用政策”,可以在这里找到:https://www.llama.com/llama3_3/use-policy
其中大部分都是有道理的,他们希望防止 Llama 被用于暴力、欺诈、故意虚假信息和类似的明显不良情况。但是,你承诺不使用 Llama 的一些事情不太清楚。
- 未能向最终用户充分披露你的 AI 系统的任何已知危险
这意味着,在使用 Llama 之前/期间,你需要显示某种信息文本,其中讨论了你的 AI 系统的你已知的任何危险(如果有)。
基本上,如果你测试了你自己的使用 Llama 的产品,并且你注意到了任何偏差、事实不准确或其他可能因使用而发生的潜在危害,你必须向用户披露这一点。“充分披露”要求到底是什么意思,我并不是 100% 清楚。
这可能迫使你向你的用户披露你所知道的关于模型输出的任何已知偏差、事实不准确或潜在危害。对于商业或面向公众的项目,你需要弄清楚如何满足该“充分披露”要求,例如,关于模型可能产生虚假信息的免责声明或用户通知。
我并不是 100% 清楚这到底是什么意思,这意味着他们可能会临时提出理由来解释为什么你的项目通过/未通过此特定要求。
结论
我不完全确定该如何看待这一点。一方面,分发这些模型的公司肯定知道该条款,但可能会选择忽略它(冒着 Meta 未来可能采取的任何行动的风险),或者他们根本不知道这些条款,这意味着他们正在重新托管他们不知道完整许可协议的内容,或者最后;他们与 Meta 签订了自己的协议,该协议取代了公众使用的许可协议。
所有可能的选择都有点令人不舒服,因为 Llama 被宣传为开源 LLM 模型,有些人可能会认为他们可以像开源模型一样使用/分发它,但每个人都同意的许可协议实际上并不允许这样做。
如果分发 Llama 的大型网站与 Llama 签订了特殊的协议,允许他们跳过社区其他成员必须遵守的条款,那么这也歪曲了 Llama 在实践中的开源程度,与 Llama 营销想要给人的印象相反。
如果你目前处于通过自托管或通过任何第三方在任何你允许公众使用的产品或服务中使用 Llama 的情况,并且你还没有阅读完整的许可协议,我希望这能成为一个警钟,促使你这样做,并积极做出选择是否要遵守它。
请记住,虽然 Meta 现在似乎没有积极追究公司,但它仍然存在于许可协议文本中,这意味着他们仍在考虑此事,否则它根本不会出现在那里。
正如一开始提到的,我不是律师,而是软件开发人员,因此这里没有任何法律建议。这里的一切都基于我对 Meta 撰写并由我阅读的许可协议文本的个人解读。
- 1 Meta 至少是这么说的。同样,根据管辖权的不同,一些像这样的隐含“协议”在实践中是不可执行的,但由于我不知道你_在哪里_,你需要自己弄清楚这一点,或者聘请某人为你和你的情况弄清楚这一点。