OpenAI今夏将推开源语言模型,目标:超越同类推理能力

   发布时间:2025-04-24 08:10 作者:钟景轩

近期,OpenAI 宣布了一项备受瞩目的计划,即在今年夏季初推出自 GPT-2 之后的首个开源语言模型。这一消息引发了业界的广泛关注,关于该模型的细节也逐渐被披露。

据知情人士透露,OpenAI 研究副总裁 Aidan Clark 正亲自挂帅,领导这一开源模型的开发工作。尽管仍处于早期阶段,但公司对该模型寄予厚望,期望其在推理能力上能够超越现有的开源推理模型。值得注意的是,该模型将采用极为宽松的许可协议,几乎不对使用或商业化设置任何限制,这一举措显然是为了避免像 Llama 和谷歌的 Gemma 等开源模型因限制过多而引发的社区争议。

OpenAI 此举的背景是,近年来面临着来自竞争对手的巨大压力。中国的 DeepSeek 等公司采用开源策略,迅速取得了显著成功。这些竞争对手将模型提供给 AI 社区进行实验,甚至允许商业化使用,这一策略已被证明极为有效。例如,meta 在其 Llama 系列开源 AI 模型上投入巨大,并宣布该系列模型的下载量已超过 10 亿次。DeepSeek 也迅速积累了大量全球用户,并吸引了国内投资者的广泛关注。

据了解,OpenAI 的开源模型将采用“输入文本,输出文本”的模式,并可能允许开发者自由开启或关闭其“推理”功能。虽然开启推理功能可以提高模型的准确性,但也会增加延迟。如果此次发布反响良好,OpenAI 可能会继续推出更多模型,包括更小型的版本,以满足不同用户的需求。

然而,OpenAI 首席执行官 Sam Altman 此前曾在公开场合表示,他认为 OpenAI 在开源技术方面“站在了历史的错误一边”。他在一次 Reddit 问答中坦言:“我个人认为我们需要制定不同的开源策略。但并非 OpenAI 的每个人都认同这一观点,这也不是我们当前的首要任务。”尽管如此,OpenAI 仍然决定推出这一开源模型,并计划对其进行严格的“红队测试”和安全评估。

为了确保模型的安全性和可靠性,OpenAI 计划为该模型发布一份详细的技术报告,即模型卡。这份报告将展示 OpenAI 内部和外部的基准测试及安全测试结果,以便用户了解模型的性能和潜在风险。Altman 在上个月的一篇帖子中表示:“在发布之前,我们将根据我们的准备框架评估这一模型,就像对待其他任何模型一样。鉴于我们知道该模型在发布后可能会被修改,我们还将进行额外的工作。”

然而,OpenAI 在模型安全测试方面的做法也引发了一些 AI 伦理学家的批评。有批评指出,OpenAI 在对近期模型进行安全测试时显得过于匆忙,且未公布其他模型的模型卡。Altman 还被指控在 2023 年 11 月短暂被解职之前,误导了 OpenAI 高管关于模型安全审查的情况。这些争议无疑给 OpenAI 的开源计划增添了一些不确定性。

 
 
更多>同类内容
全站最新
热门内容
本栏最新