以梦为马,不负韶华

搜索
查看: 15|回复: 1
收起左侧

DeepSeek 劝不了谷歌们

[复制链接]
 楼主| 发表于 3 小时前 显示全部楼层 |阅读模式
DeepSeek 劝不了谷歌们faker @ 2025年02月06日 人工智能

                               
登录/注册后可看大图
过去一个月,DeepSeek 以大约十分之一的训练成本,推出与 OpenAI o1 性能接近的开源模型 R1,"小力出奇迹" 的新范式震撼全球 AI 大模型行业。同时,外界对于大型科技公司动辄数百亿美元的 AI 研发开支,也产生了越来越多的质疑。
但被 "DeepSeek 冲击" 吓了一跳的科技巨头,并没有因此改弦更张。相反,他们正挥舞着支票簿,试图靠疯狂砸钱,重新夺取 AI 大模型的制高点。
2 月 5 日,谷歌母公司 Alphabet 发布 2024 年第四季度财报,营收和净利润均实现两位数百分比的同比增长。引人注目的是,Alphabet 宣布,2025 财年的资本支出将达到 750 亿美元(约合人民币 5454 亿元),以继续扩展其人工智能战略。
一年投入 750 个 "小目标" 研发 AI,远远超出了华尔街 599.4 亿美元的预期。不过,谷歌有实力如此烧钱:截至去年底,它持有现金、现金等价物及有价证券约 957 亿美元。
稍早时候,谷歌还向 AI 明星创业公司 Anthropic 追加投资 10 亿美元。2023 年至今,谷歌向这家公司累计投资 35.5 亿美元。
财大气粗的谷歌投身 AI 烧钱竞赛,其他科技巨头也不遑多让。
今年 1 月初,微软宣布将于 2025 财年投资 800 亿美元,建设 AI 数据中心。这笔投资创下了微软成立以来的单笔投资最高纪录。而在上一财年,微软的资本支出超 500 亿美元,大部分用于 AI 相关的基础设施。
社交网络巨头 Meta 在 1 月底宣布,公司将在今年投资 600 亿~650 亿美元,并大幅扩张 AI 团队,以期实现 Meta AI 服务 10 亿人、Llama 4 成为行业领先大模型的目标。Meta 创始人扎克伯格称,今年将是 "AI 决定性的一年"。
OpenAI 则拉上软银、甲骨文、微软、ARM、英伟达以及中东人工智能基金(MGX)等产业和投资巨头,预计投资 5000 亿美元,联手成立 "星际之门",这些资金将被用于数据中心等 AI 基础设施的建设与运营。
相比之下,国内科技巨头面向 AI 大模型的砸钱规模小了一个数量级,但也动辄数百亿元,且增长很快。
根据财报等公开信息,2024 年前三季度,百度、阿里、腾讯的总资本开支约为人民币 867 亿元。金融数据服务商 Visible Alpha 预计,到 2027 年,BAT 的资本支出将达到 1767 亿元,年复合增长率超 26%。考虑到 BAT 的重视程度,这些资本开支将有很大一部分流向 AI 大模型。
不难看出,科技巨头发展 AI 大模型,砸钱仍然是基本武器之一。尽管 DeepSeek 证明了 "小力出奇迹" 的可行性,但巨头们出于多种原因,仍然沿着 "大力出奇迹" 的路线前行。
这并非仅仅是大公司的惯性使然。OpenAI 刚刚发布的 o3-mini,已经在物理推理等多项指标上反超 R1,而更强大的 o3 标准版也已经箭在弦上。这也再次证明,"尺度定律" 仍然是 AI 大模型的基本规则之一,而 "小力出奇迹" 并非置之四海而皆准。
尚未找到 "金主爸爸" 的 DeepSeek,在算力、数据、资金和资源方面比不上巨头,正面临被后来者强行超车的危险。不过,R1 的成功,也证明了 "小力出奇迹" 的可行性。在 DeepSeek 震动全球 AI 圈后,巨头青睐的 "砸钱" 与 "小力出奇迹" 的路线之争仍在继续,远未分出胜负。
面对快速崛起的 DeepSeek,美国科技巨头表面上对其技术、产品和方法论赞叹不已,但在战略层面上,并没有对其 "小力出奇迹" 的策略亦步亦趋。
恰恰相反,在 DeepSeek 席卷全球 AI 大模型领域后,巨头们的砸钱迈向了新高度。
以 OpenAI 为例,奥特曼起初对于 DeepSeek 有所怀疑,称 "并不新颖,我们早已具备这一水平的模型",且 "被严重夸大了"。OpenAI 甚至在 1 月底表示,DeepSeek 涉嫌使用 OpenAI 专有模型训练自己的模型,违反了 OpenAI 的服务条款。
但在短短几天后,奥特曼宣布没有计划起诉 DeepSeek,同时称赞 "DeepSeek 是一个令人印象深刻的模型"。在推出最新的 o3-mini 模型后,奥特曼甚至表示,在开源方面,OpenAI 一直站在 "错误的一边"。
DeepSeek 大红大紫,逼得奥特曼前倨后恭、低头认错,此情此景让不少人感到惊讶和振奋。但事实上,OpenAI 无论是产品还是战略,都没有被 DeepSeek 这只 "黑天鹅" 所打乱。
1 月底,OpenAI 推出 o3-mini,并首次向免费用户开放推理模型。测试表明,o3-mini 相比上一代 o1 模型进步极大,多项基准测试表现优异;特别是面对高难度的物理模拟项目 —— 如球体碰撞等,展现出对于 R1 及其他模型的碾压实力。
几天后,OpenAI 又以 o3 模型为基础发布了 Deep Research 功能,号称可以在几十分钟内完成人类专家数小时的工作。在涵盖超 3000 道问题的综合测试 "人类最后一场考试" 中,Deep Research 实现了 26.6% 的正确率,远超 DeepSeek R1 的 9.4%。
o3-mini 采用了许多与 R1 相同的技术,比如强化学习(RL)、稀疏化 MoE、大量监督微调(SFT)等,最终成果也堪称惊艳。然而,Open 并没有在研发范式上向 DeepSeek 靠拢,而是继续沿着 "氪金" 的路线狂飙。
就在拿出 o3-mini 对阵 DeepSeek R1 的同时,OpenAI 高调宣布了 5000 亿美元的 "星际之门" 计划。该计划将在全美国打造 20 座超算中心;首期将投资 1000 亿美元,在得州建设 10 座数据中心。
尽管奥特曼的 "一生之敌" 马斯克火速赶来嘲讽,信誓旦旦地说 "他们没有钱",但星际之门的进展速度颇为惊人。计划公开几天后,奥特曼就晒出了 "1 号站点" 的照片,称之为 "宏伟而美丽的建筑"。
尽管星际之门得到了软银和甲骨文的鼎力支持,且去年营收已经高达 37 亿美元,OpenAI 仍在继续储备资金。
据报道,OpenAI 正寻求以 3400 亿美元估值融资 400 亿美元,软银有望领投。而在短短三个月前,OpenAI 刚刚以 1570 亿美元的估值,融到了 66 亿美元。
奥特曼仿佛患上 "资金短缺恐惧症",一边疯狂融资,一边大手笔花钱。与之正面 PK 的其他科技巨头,砸钱同样毫不手软。
今年,谷歌、微软、Meta 等均计划投入数百亿美元发展 AI,力度之大远超华尔街预期。以 Meta 为例,扎克伯格计划斥资至少 600 亿美元,建设一座拥有 130 万块 GPU 的 AI 数据中心。
作为对比,据科技咨询公司 Omdia 测算,字节去年买了 23 万块 GPU,且为性能较弱的英伟达特供版。即便如此,这一数字也远远超出了 DeepSeek 目前持有的芯片规模。
除了海外科技巨头,国内互联网公司也在 AI 大模型领域投入巨资。DeepSeek 的 "小力出奇迹",并没有改写这一局面。
一度在 AI 大模型领域落后的字节,近两年洒下重金。浙商证券在一份报告中称,2024 年字节资本开支约 800 亿元,接近 BAT 的总和。
另有报道称,字节 2025 年资本开支将超 1500 亿,大部分用于 AI。字节方面随后否认了这一说法。
此外,字节持续 "扫货" 国内 AI 领域的顶级人才。据 "财经天下" 报道,字节某些 AI 方向的业务团队在招募知名院校的博士应届生时,年薪可达两三百万元,远超其他大厂的 100 万元左右。此外,张一鸣还亲自从阿里等对手那里挖人。
除了研发费用和人才成本,过去一两年,字节在 B 端和 C 端同时为 AI 烧钱,力图争夺更多企业和个人用户。
在 B 端,豆包大模型自去年 5 月发布之后不断降价,堪称国内 AI 大模型圈子的 "价格屠夫"。据统计,豆包文字大模型比行业便宜 99.3%,去年 12 月发布的视觉理解模型比行业便宜 85%。
同时,在 C 端,豆包也在广泛投流拉新。据 AppGrowing 统计,去年 4~5 月,豆包投放金额预计为 1500 万~1750 万元。6 月上旬,豆包启动新一轮投放活动,投放金额高达 1.24 亿元。
在猛砸资金后,豆包的用户量猛增,成为国内用户最多的大模型应用。
阿里同样在 AI 大模型领域持续投入大笔资金。今年总台春晚,阿里云成为云计算 AI 独家合作伙伴。仅 2024 年上半年,阿里在 AI 基础设施上的资本支出就达到 230 亿元。此外,阿里花费超百亿元,投资 AI 创业公司 "六小虎"。
腾讯方面,过去六年其研发总投入超 2850 亿元,其中很大一部分投向了 AI。而在 AI "六小虎" 中,腾讯投资了其中五家。
仅就花钱力度而言,新 BAT 比不过谷歌、Meta、OpenAI,但依然是国内 AI 大模型圈独一档的存在。相比之下,一直没有融资的 DeepSeek,仍然靠母公司幻方量化输血;但国内量化投资近年来处于行业谷底,DeepSeek 能够得到的资金支持恐怕不会很多。
不过,面对 DeepSeek 的强势崛起,新 BAT 在继续大手笔投钱的同时,也试图伸出橄榄枝、构建 "双保险"。
1 月底、2 月初,国内主要云服务厂商均宣布接入 DeepSeek 大模型。阿里云宣布支持云上一键部署 V3 和 R1,百度智能云、腾讯云、字节旗下火山引擎等也先后宣布了类似功能。
众所周知,DeepSeek 采用了最 "慷慨" 的开源协议,并不限制第三方对于自家开源模型的商用。阿里云等厂商第一时间接入 DeepSeek 大模型,能够借着后者的泼天流量,为自己争取一波关注度和新用户。
另一方面,向 DeepSeek 伸出橄榄枝,也侧面表明了大厂的心态:即便 DeepSeek 与自家 AI 业务存在竞争,也不妨先为我所用,并从中获得技术、产品等方面的启发。这些主动示好的举动,也为双方未来更大规模的合作留下了想象空间。
DeepSeek 以 "小力出奇迹" 扬名天下,但目前为止,这一颇为性感的新范式并未得到国内外大厂的全面认可与接纳。砸钱、砸资源的 "大力出奇迹",依然是大厂参与 AI 大模型竞争的主要打法。
与此同时,随着竞争对手以新一代模型反击,叠加自身规模扩大导致的种种问题,DeepSeek 正面临被全面反超的危险。
从产品上看,越来越多的用户发觉,DeepSeek 的大模型幻觉频繁出现。无论是谈论从 A 到 B 的最佳路线,还是解析某一首歌曲,或分析某一专业话题,DeepSeek 都存在较为严重的 "一本正经地胡说八道" 问题。
大模型的幻觉问题一直广泛存在,也是整个 AI 圈子始终未能克服的难题。DeepSeek 在这方面并没有展现比其他模型更出色的性能,这折射出仅靠大模型工程层面的创新,并不足以攻克更基础的 AI 难题。
另一方面,短时间内疯狂涌入的全球用户,也让 DeepSeek 有些力不从心。
据统计,DeepSeek 自上线各大应用商店以来,短期内获得 1600 万次下载,登顶 140 个应用市场,最高日活跃用户突破 2200 万。由于用户太多,DeepSeek 的深度思考和联网搜索功能一度暂时停止服务。
这也表明,"小力出奇迹" 或许可以大幅节约模型训练的成本,但在模型投入使用后,必要的基础设施成本仍然无法压减。
从商业角度来看,AI 大模型注定是一门规模越大、能力越强、成本越高的生意。巨头们坚守 "尺度定律",其根基 —— 算力、算法和数据三角模型依然稳固。
在 DeepSeek 崛起的过程中,一个被不少人忽视的问题是,R1 的推理性能与 o1 不相上下,但在许多基准测试中不如 o1。而箭在弦上的 o3 "满血版",综合性能远超 o1。和同期其他对手相比,比如谷歌的 Gemini 2.0 Flash,R1 也并非全面领先,而是与对手各擅胜场。
在专业人士眼中,R1 的真正价值是,通过多种技术创新 —— 比如强化学习、GRPO 算法框架、DeepSeek MOE 等,再加上优秀的工程思想,以较低成本在部分指标接近或超越了行业最强大模型。DeepSeek 的 "小力出奇迹" 固然惊艳,但从来不是性能最强的大模型。
OpenAI 刚发布的 o3-mini,在许多测试中已经反超 R1,也让国外巨头继续狂砸钱有了更坚实的证明。这表明,除了优秀的人才、出色的算法外,强大的算力、丰富的数据,也是构建更强大模型,乃至通往 AGI 的必经之路。
DeepSeek "小力出奇迹" 证明了 AI 大模型的另一条发展路径,却并非唯一的路径。手握重金的科技巨头,依然是 AI 大模型的主要参与者,同时也是 DeepSeek 继续上攻的强大对手。
AI 大模型远未分出胜负,DeepSeek 及其拥趸不能 "半场开香槟"。而高性价比路线与 "大力出奇迹" 路线之争,也仍将持续下去,并在互相借鉴和融合中,推动 AI 大模型迈向下一个发展阶段。
来源:微信公众号:字母榜


[发帖际遇]: 一个袋子砸在了 mammoth 头上,mammoth 赚了 2 个 韶华币. 幸运榜 / 衰神榜
发表于 1 小时前 显示全部楼层
{:1110_550:}
[发帖际遇]: 一个袋子砸在了 Frank_2013 头上,Frank_2013 赚了 3 个 韶华币. 幸运榜 / 衰神榜
回复 支持 反对

使用道具 举报

不想打字就选择快捷回复吧
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|以梦为马,不负韶华

GMT+8, 2025-2-6 20:02

Powered by 以梦为马,不负韶华

© 2024-2099 Meng.Horse

快速回复 返回顶部 返回列表