在DeepSeek开源周的尾声,一条评论引起了广泛关注:“这将终结OpenAI。”此言并非空穴来风,因为DeepSeek在此次活动中公布了其成本与收入数据,揭示了其惊人的理论成本利润率——高达545%。
在公布这些数据的同时,DeepSeek保持了其谦逊的态度,表示希望本周的分享能为开源社区带来价值,共同推进通用人工智能(AGI)目标的实现。
回顾DeepSeek开源周发布的五大核心组件——FlashMLA、DeepEP、DeepGEMM、DualPipe和EPLB,这些技术并非孤立存在,而是共同构成了一套全新的算力系统。它们从软件层面出发,重新定义了硬件的性能极限。
FlashMLA通过动态分配算力,仅用300行代码就突破了硬件的限制,将H800的计算效率提升至极致。接着,DeepEP打通了数据“高铁”,解决了多专家协作中的通信瓶颈。最后,DualPipe和EPLB这两个流水线调度员确保了计算和通信的零闲置。
开源周的风暴席卷了整个行业,对基座模型厂商造成了巨大冲击。不开源意味着与时代脱节,而开源则可能颠覆现有的商业模式。连一直坚守闭源立场的百度也宣布,从4月1日起文心一言将全面免费,并即将开源。这一举动或许已经给出了问题的答案。
与此同时,应用公司、芯片公司以及电脑等终端厂商成为了这场风暴的受益者。随着DeepSeek开源周的结束,以全功能GPU为核心的摩尔线程成功实现了对DeepSeek各个开源项目的全面支持。DeepSeek的开源不仅让本土芯片公司和腰部AI公司尝到了甜头,更是一场技术开源的宣言,它用软件重写了摩尔定律,预示着当硬件进步趋缓时,软件将成为算力增长的新动力。
在“iOS或Android”的选择题中,DeepSeek坚定地站在了Android一边,致力于打造一个开放、共享的技术生态。
DeepSeek似乎打破了行业的“不可能三角”,即在低成本、高性能和环保之间找到了平衡点。在不升级硬件的前提下,其训练效率提升了40%至60%。同时,开源项目支持二次开发,这意味着基于FlashMLA优化国产GPU的性能完全有可能实现。
开源周启动首日,特斯拉、英伟达等美股科技巨头的市值蒸发超过1.4万亿。尽管英伟达CEO黄仁勋表示投资者误读了DeepSeek对AI的影响,但资本市场还是给出了自己的判断。
阿里云副总裁李飞飞在谈及DeepSeek开源周时表示,AI下半场的竞争已经回到了传统的系统领域,特别是分布式系统工程。当算法和框架的创新速度放缓时,系统层面的优化将成为关键。
DeepSeek的开源为更多中小厂商提供了以低成本接入顶级训练框架的机会。同时,对Hopper架构的深度优化也为未来GPU架构的标准化预埋了接口。未来,更多的国产GPU厂商可能与DeepSeek展开合作,用软件来弥补硬件的代差。而DeepSeek或许也可以借鉴RedHat的盈利模式,提供企业级支持服务。
这无疑是AI领域的“Android时刻”。当软件生态足够强大时,硬件将退化为可替换的容器,为整个行业带来新的发展机遇。