DeepSeek实测：低成本AI大模型能否媲美行业巨头？-数码-沃资讯

DeepSeek实测：低成本AI大模型能否媲美行业巨头？

发布时间：2024-12-31 16:36 来源：ITBEAR 作者：杨凌霄

在人工智能领域，训练大型语言模型的费用一直是个引人关注的话题。OpenAI的首席执行官山姆·奥特曼曾透露，GPT-4的训练成本高达1亿美元，并预测未来这一数字将攀升至10亿美元以上。GPT-5的训练更是惊人，仅一轮训练就耗资约5亿美元。然而，在这个高成本的行业中，DeepSeek却以其极低的训练成本脱颖而出。

据悉，DeepSeek最新推出的V3大模型，训练成本仅为557.6万美元，约为GPT-4成本的二十分之一。这一低成本高效率的模型引发了业界的广泛关注。DeepSeek不仅训练成本低廉，其使用价格也十分亲民。官网显示，其缓存命中输入价格为0.1元/百万tokens，输出价格为2元/百万tokens，这在众多AI大模型中属于最低价位。

为了验证DeepSeek-V3的实际表现，我们进行了多轮测试。首先，在常规问答测试中，DeepSeek展现了其出色的问答能力。无论是联网状态还是非联网状态，它都能准确回答提出的问题，且回答内容简洁明了，可读性高。在收集新闻方面，DeepSeek不仅提供了清晰的新闻摘要，还附带了直达新闻源的链接，极大地方便了用户。

在内容总结测试中，DeepSeek虽然未能完全捕捉到原文的所有重点，但其表现依然可圈可点。与众多AI大模型一样，DeepSeek在总结内容时容易忽略一些细节，但总体上能够提炼出文章的核心观点。与一些知名AI大模型相比，DeepSeek的表现并不逊色。

接下来是数学题解答测试。DeepSeek在这一环节中表现尤为出色。它不仅迅速准确地回答了简单的小学数学题和经典的三门问题，还成功解答了一个曾击败多个AI大模型的复杂问题。在解答过程中，DeepSeek详细展示了思考步骤，并反复验证答案，确保了答案的准确性。这一表现无疑让人眼前一亮。

在金融问题答疑测试中，DeepSeek同样展现出了其强大的逻辑推理能力。它准确理解了市场利率变化对债券价格的影响，并给出了合理的投资建议。虽然未开启联网搜索功能，但DeepSeek的回答依然中规中矩，与其他AI大模型相比毫不逊色。

经过多轮测试，我们发现DeepSeek-V3在文字生成和逻辑推理方面表现出色，但功能相对单一。与豆包、文心一言等AI大模型相比，DeepSeek缺乏图片创作、PPT生成等多元化功能。然而，对于以文字生成为主要需求的用户来说，DeepSeek-V3无疑是一款性价比极高的AI大模型。

DeepSeek之所以能够以如此低的成本训练出如此优秀的模型，主要得益于其先进的MoE架构、多技术融合优化以及FP8混合精度训练框架等技术。DeepSeek还与开源社区紧密合作，共同推动AI技术的发展。这种开源节流的方式不仅降低了成本，还提高了模型的性能。

在AI行业成本高昂、竞争激烈的背景下，DeepSeek的成功经验无疑为其他AI公司提供了宝贵的借鉴。通过优化技术和加强合作，AI公司可以在降低成本的同时提高模型的性能，从而在这个充满挑战的领域中脱颖而出。

虽然DeepSeek在文字生成和逻辑推理方面表现出色，但它在创作图片、PPT等多元化功能方面仍有待加强。对于需要更多功能的用户来说，豆包、Kimi等AI大模型及其提供的智能体或许更为合适。然而，对于以文字生成为主要需求的用户来说，DeepSeek-V3无疑是一个极具性价比的选择。

更多>同类内容