在人工智能(AI)浪潮的推动下,OpenAI凭借一次技术革命跃升为全球瞩目的科技巨头,估值飙升超过1500亿美元。然而,在探讨谁是AI时代最大赢家时,NVIDIA以其卓越表现成为无可争议的答案。
NVIDIA发布的2024年第三财季财报揭示了其惊人的增长态势:营收高达350.82亿美元,同比增长93.61%;归母净利润达到193.09亿美元,同比增长更是高达108.90%。其中,数据中心业务表现尤为亮眼,营收为308亿美元,同比增长112%。这一系列数据不仅将NVIDIA推上了市值超越微软的宝座,更使其成为仅次于另一科技巨头的全球第二大市值公司。
NVIDIA与AI企业的合作堪称双赢典范。AI企业依赖NVIDIA提供的GPU和专业AI计算卡进行大模型的训练和推理,这些需求为NVIDIA带来了持续增长的营收和利润。为了巩固这一合作关系,NVIDIA也积极投资AI初创企业,以扶持其成长并培养忠实客户群体。据英国《金融时报》报道,NVIDIA在2024年参与了超过50轮融资和多笔交易,向AI初创企业累计投资约10亿美元,相比前一年增长了约15%。
NVIDIA的成功并非孤例,国内外众多互联网公司也纷纷加大在AI领域的投入,一方面组建自己的AI团队,另一方面积极投资其他AI公司。这一趋势吸引了无数企业涌入AI行业,天眼查数据显示,2024年国内新增AI相关企业超过50万家。然而,随着AI技术的日益成熟,人们不禁要问:进军AI行业真的还有机会吗?
AI创业之路并不平坦,尤其是在人才、算力和数据三大成本方面。AI大模型的黑盒特性使其可解释性和可调试性较弱,对语义理解、数学逻辑和推理能力的要求极高,同时可能存在的AI“幻觉”问题也困扰着开发者。为了训练一款成熟可用的大模型,企业需要招募大量技术人才,而行业内的激烈竞争又导致人才成本不断飙升。例如,小米CEO雷军亲自招募的AI人才罗福莉,据传年薪高达千万级别,尽管这一数字可能有所夸张,但无疑反映了AI人才市场的火爆程度。
除了人才成本,GPU算力也是AI公司面临的一大挑战。以小米为例,该公司正在打造万卡算力集群,而百度智能云执行副总裁沈抖曾透露,一个1.6万张GPU的集群采购成本就高达数十亿元,还不包括搭建、运营和维护成本。NVIDIA CEO黄仁勋也曾表示,为了满足未来AI大模型的训练和推理需求,可能需要投入数千亿美元来重塑全球半导体行业。
数据方面,随着AI大模型参数量的不断增加,对训练数据的需求也呈指数级增长。然而,可用于训练大模型的高质量数据却越来越稀缺。OpenAI原计划于2024年中后期推出的GPT-5至今未能完成训练,主要原因之一就是数据不足。为了解决这个问题,OpenAI不得不招聘大量工程师、数学家和物理学家来编写数据。
然而,尽管面临诸多挑战,AI行业依然吸引着众多企业涌入。其中,一些企业通过创新技术降低了训练大模型的成本。例如,DeepSeek-V3模型以低至557.6万美元的训练成本,实现了与GPT-4等顶级大模型相当的性能。这一成功案例向其他AI公司展示了降低训练成本的可能性。
DeepSeek-V3的成功主要得益于其采用的MLA架构、MoE架构、FP8混合精度训练框架以及模型蒸馏技术。这些技术虽然在一定程度上牺牲了精度,但大幅降低了训练成本和时间。然而,蒸馏技术也存在一些缺陷,如“学生模型”的能力无法超过“教师”模型等。过度依赖数据蒸馏可能导致生成数据的偏差和丧失多样性等问题。
尽管如此,DeepSeek-V3的成功仍然为其他AI公司和考虑入场的企业指明了一条新的道路。通过创新技术和降低精度等方法,企业可以在不投入数亿美元高昂成本的情况下,训练出表现出色的AI大模型。AI行业依然是“野心家”的乐园,只是门槛比过去更高了一些,入场需要更加谨慎和理性。