加拿大初创公司推出 Command A 轻量级 AI 模型,号称仅需两块英伟达 A100 / H100 GPU 即可部署

加拿大 AI 初创公司 Cohere 发布了一款名为“Command A”的 AI模型,该模型主打轻量化应用,号称只需要两块英伟达 A100 或 H100 GPU 即可轻松部署,号称“表现能和 GPT-4o 相媲美”,实现“用最少的硬件发挥最大的性能”。

加拿大初创公司推出 Command A 轻量级 AI 模型,号称仅需两块英伟达 A100 / H100 GPU 即可部署

Cohere 表示,Command A 专门为中小型企业环境设计,其支持 256k 的上下文长度和 23 种语言,作为比较,其他竞争对手的“同类模型”需要 32 块 GPU 才能部署。

在性能测试中,Command A 最快每秒可以输出 156 个 Token,据称比 GPT-4o 快 1.75 倍。而在指令追踪、SQL、代理程序和工具任务的基准测试上,Command A 也表现出色。

Cohere 援引相应性能数据,声称业界的大语言模型如果“规模过大”,反而在输出结果时可能会出现严重的延迟问题;如果只是想快速得到正确答案,Command A 相对是个不错的选择。

目前,Cohere 已将相应 Command A 发布在 Hugging Face 平台(点此访问),对学术界开放使用,未来还会登陆其他云服务平台。

本站网站文章信息收集来自互联网,如有侵权联系我们删除。 邮箱:27782089@qq.com
THE END
分享
二维码
< <上一篇
下一篇>>