介绍 Command A:极致性能,极简算力 了解更多

生成模型 (Generative Models) * CommandA 系列高性能、可扩展的语言模型 * Aya Expanse 领先的多语言模型,精通 23 种不同的语言

高级检索模型 (Advanced Retrieval Models) * Embed 领先的多模态搜索和检索工具 * Rerank 一个强大的模型,为搜索质量提供语义提升

工作场所系统 (Workplace Systems) * North 一个集成的 AI 平台,使现代员工能够完成更多工作 * Compass 一个智能搜索和发现系统,用于呈现业务见解

定制化 (Customization)定价 (Pricing)

行业 (Industries) * 金融服务 (Financial Services) * 医疗保健和生命科学 (Healthcare and Life Sciences) * 制造业 (Manufacturing) * 能源和公用事业 (Energy and Utilities) * 公共部门 (Public Sector)

安全 (Security):一流的 AI 安全和数据保护 部署选项 (Deployment Options)合作伙伴 (Partners)

Cohere For AI:Cohere 的研究实验室,致力于解决复杂的 ML 问题

模型 (Model) * Aya * 资源 (RESOURCES) * 论文 (Papers) * 视频 (Videos) * 博客 (Blog)

社区 (Community) * 开放科学社区 (Open Science Community) * 学者计划 (Scholars Program) * AI 研究资助计划 (AI Research Grant Program) * 活动 (Events)

资源 (Resources) * 博客 (Blog) * 开发者 (Developers) * 文档 (Docs) * LLM 大学 (LLM University) * Cookbooks

客户案例 (Customer Stories) * BambooHR * Notion * Oracle * Johnson Lambert * Atomicwork * Borderless AI * BlueDot * HyperWrite

社区 (Community) * Discord * 活动 (Events)

公司 (Company) * 关于 (About) * 职业 (Careers) * 新闻编辑室 (Newsroom)

注册 (Sign in) 请求演示 (Request a demo)

介绍 Command A:极致性能,极简算力

Image of Cohere TeamCohere 团队 2025 年 3 月 13 日

Command A 在企业代理任务方面与 GPT-4o 和 DeepSeek-V3 持平或更好,但效率显著更高。

公司 (Company)新闻编辑室 (Newsroom) 产品 (Product)

分享:

今天,我们推出 Command A,这是一种最先进的生成模型,针对需要快速、安全和高质量 AI 的高要求企业进行了优化。与领先的专有模型和开源权重模型(如 GPT-4o 和 DeepSeek-V3)相比,Command A 以最小的硬件成本提供最大的性能。 对于私有部署,Command A 在业务关键型代理和多语言任务方面表现出色,同时可以仅在两个 GPU 上部署,而其他模型通常需要多达 32 个。

在业务、STEM 和编码任务的直接人工评估中,Command A 与其更大、更慢的竞争对手相匹配或超越,同时提供卓越的吞吐量和更高的效率。 人工评估很重要,因为它们在真实世界的企业数据和情况下进行测试。

企业任务的直接人工评估获胜率。 所有示例均由经过专门培训的人工注释员进行盲注注释,评估以企业为中心的准确性、指令遵循和风格。 吞吐量比较是 Command A 在 Cohere 平台、GPT-4o 和 Deepseek-V3 (TogetherAI) 上的比较,由 Artificial Analysis 报告。

在各种标准基准测试中,Command A 在指令跟随、SQL、代理和工具任务方面提供强大的性能。

在学术基准测试(MMLU、MATH、IFEval)、代理基准测试(BFCL 和 Taubench)以及编码基准测试(MBPPPlus、SQL 和 RepoQA)中评估的性能。 方法和更多详细信息在底部的脚注 [1] 中提供。

可扩展的效率

我们专注于尽可能高效地构建 Command A,同时也使其在生产中尽可能高效地提供服务。 凭借仅两个 A100 或 H100 的服务占用空间,它比市场上其他同类模型需要的计算量少得多。 这对于私有部署尤其重要。

大而不切实际的模型会导致延迟不佳。 当您只是想快速获得正确的答案时,Command A 是最佳选择。 事实上,Command A 可以高达 156 个 tokens/秒 的速率传送 tokens,比 GPT-4o 高 1.75 倍,比 DeepSeek-V3 高 2.4 倍。 Command A 的私有部署比基于 API 的访问便宜多达 50%。

Command A 每秒 tokens 和首次 token 时间优于 GPT-4o 和 DeepSeek-V3,适用于长上下文和短上下文请求。

企业就绪的功能

我们在设计 Command A 时考虑了业务需求。 它的 256k 上下文长度(是大多数领先模型的 2 倍)可以处理更长的企业文档。 其他关键功能包括 Cohere 的高级检索增强生成 (RAG) 以及可验证的引用、代理工具使用、企业级安全性和强大的多语言性能。

在企业 RAG 用例中比较 Command A 和 GPT-4o 的直接人工评估获胜率。 所有示例均由经过专门培训的人工注释员进行至少 3 向盲注注释,评估流畅性、忠实性和响应实用性。

我们了解全球公司需要跨区域的能力。 Command A 为世界上大多数人口使用的 23 种语言提供扩展的企业级支持。 我们进行了一项广泛的人工评估,发现用户在各种业务用例中强烈偏好 Command A 而不是 DeepSeek-V3 在大多数语言上。

在 8 种语言的企业任务中的直接人工评估获胜率。 所有示例均由经过专门培训的人工注释员进行盲注注释,评估以企业为中心的准确性、指令遵循和风格。

特别是,Command A 比 GPT-4o 或 DeepSeek-V3 更好地始终以请求的语言回答内容,例如以用户的相关阿拉伯语方言回答。

Marchisio et al., 2024 中提示的阿拉伯语跨语言行级通过率 (LPR) 和 Robinson et al., 2024 中 4 种阿拉伯语方言(埃及语、沙特语、叙利亚语、摩洛哥语)的单语提示的平均 ADI2 分数。

大规模赋能 AI 代理‬

AI 的好坏取决于您提供的数据。 考虑到这一点,Command A 安全地提供准确的‬问题响应,基于您的内部公司信息。 实际上,客户使用此功能‬执行诸如按办公室位置采购相关 HR 政策、审查法律法规以及‬ ‭分析长篇财务报告等任务。

下一代 Cohere 模型将帮助为客户提供一系列 AI 应用程序‬ ‭跨越金融、医疗保健、制造、能源和公共部门等行业。 特别是,他们将与‬‭ North‬‭无缝集成,这是我们安全的 AI 代理平台,可释放您的公司数据和人员与 AI 代理的全部潜力。 我们完全集成的技术堆栈使客户能够完全‬ ‭自定义产品以满足其独特的业务需求。‬

North 安全地利用 CRM 和 ERP 软件等企业工具,并连接到内部公司数据库和外部 Web 搜索服务。 这使您能够构建代理,这些代理在您的企业系统的安全防火墙之后为您采取行动。

可用性

Command A 今天在 Cohere 平台上可用,用于 Hugging Face上的研究用途,并且即将登陆主要的云提供商。 如果您对私有或本地部署感兴趣,请联系我们的 销售团队

Cohere API 定价| 输入 Tokens| 输出 Tokens ---|---|--- Command A| $2.50 / 1M| $10.00 / 1M

[1]BFCL:2025 年 3 月 12 日在 BFCL-v3 基准测试上的表现。 如果可用,分数取自公共排行榜,否则使用官方代码库尽最大努力进行内部评估。 对于竞争对手,我们报告了他们的 BFCL“提示”或“函数调用”分数的较高者。 我们报告了总体分数,该分数测试了在多样化的现实世界环境中的工具使用。 Taubench:在 Taubench 基准测试上的表现。 如果可用,分数取自公共存储库排行榜,否则使用官方代码库尽最大努力进行内部评估。 我们报告了零售和航空公司任务的 pass@1 分数,这些分数评估了多轮客户支持用例中的工具使用代理。 学术:跨越一般知识 (MMLU)、数学表现 (MATH) 和指令跟随 (IFEval) 的学术基准测试的性能。 我们发现 Command-A 的表现大致处于 GPT-4o 和 DeepSeek-V3 的水平,或者超过了它们。 编码:我们注意到 Command-A 在 SQL 基准测试(BirdBench、Spider Dev 和 Spider Test 的平均值)上表现出特别强大的性能,并且在 MBPPlus(Python 编程)的用例中达到 GPT-4o 的水平。 最后,我们注意到它在较长上下文中存储库级别的问答方面的卓越表现 (RepoQA)。

准备好让 AI 工作了吗?

请求演示 (Request a demo) 尝试 Playground