小成本AI模型攻破算力护城河:DeepSeek与Kimi的革新
(图片来自网络)
近年来,AI领域盛行的“闭源+重资本范式”正被DeepSeek-R1与月之暗面Kimi K2 Thinking改写。二者以数百万美元成本、开源权重,凭借MoE与MuonClip等优化,在SWE-Bench与BrowseComp等基准追平或超越GPT-5,并以更低API价格与本地部署撬动市场,促使行业从“砸钱堆料”转向以架构创新与稳定训练为核心的路线。
**行业旧范式:闭源+重资本神话**
2025年前,AI界曾坚信“闭源、巨额投入和疯狂堆算力”是打造顶级模型唯一路径。OpenAI以1.4万亿美元基础设施蓝图、1.4万亿美元烧钱体现这一思路,训练GPT-4约耗1亿美元。闭源+重资本模式让OpenAI获高估值与资本支持,但“用钱砸出智能”神话正动摇。
**DeepSeek-R1:低成本高性能的冲击**
今年初,深度求索的DeepSeek-R1横空出世。开源且约560万美元成本训练,性能可媲美OpenAI顶级模型,下载量登顶美国苹果App Store免费榜。这款小成本模型直接质疑“开发AI需投入天量资金和算力”的传统观念,引发资本与行业震动,巨头股价下挫、AI芯片巨头市值蒸发。
**Kimi K2 Thinking:开源架构的震撼**
年末,月之暗面Kimi K2 Thinking震撼登场。开源且以数百万元训练,在SWE-Bench与BrowseComp等基准追平甚至超越GPT-5。其混合专家架构(384个专家模块、激活仅320亿参数)、MuonClip优化器等,让大模型既聪明又降低成本,在15.5万亿token训练中实现“零崩溃”。
**技术路径:架构创新胜过砸钱**
K2 Thinking采用混合专家架构,将庞大模型划分为专长各异专家模块,每次仅激活少量专家参与计算,既保持智能又降低成本。这种架构与优化技术,等于是用“聪明才智”破解过去需“砸钱才能解决的难题”,为小团队攀登AI高峰提供可能。
**开源风暴的经济冲击**
K2 Thinking等开源模型提供免费下载与本地部署,API价格更低。以K2 Thinking每百万输入token收4元(缓存时1元)、输出token16元,对比OpenAI GPT-5约9元与71元,费用仅为十分之一。开发者与企业更倾向采用开源模型,政府与企业也重新考虑自主可控的AI能力,行业叙事从“重资本”转向“架构创新与成本效率”。
**行业变革:叙事与泡沫冷却**
DeepSeek与Kimi带来的变革,让“烧钱才能保持领先”的假设动摇。封闭巨头们的估值泡沫面临质疑,投资者更关注实际效能与商业可行性。行业从“砸钱堆料”转向“架构创新+稳定训练”,证明小成本、开源、创新路线同样可行。
最新新闻
- 2025年11月9日:颜宁院士团队荣获2024年北京市科学技术奖自然科学奖一等奖
- 2025年11月9日:塞尔维亚小伙进博会从志愿者变身‘中国故事’传播者
- 2025年11月9日:京东首款合作车型定价公布,限时优惠8.99万元
- 2025年11月9日:中国科学院发布‘磐石V1.5’:一站式科研平台升级 助力多学科前沿研究
- 2025年11月9日:京东联合广汽发布埃安UT super,首车价格揭晓
- 2025年11月9日:硅谷知名风险投资机构红杉资本发生高层人事变动,掌门人三年后辞任
- 2025年11月9日:保罗生涯首次因技术原因缺阵,退役倒计时临近
- 2025年11月9日:深耕中国 外资热议‘十五五’:‘希望深度融入’
- 2025年11月9日:第34个全国消防日致敬火焰蓝:消防员,用奉献守护平安
- 2025年11月9日:第八届进博会:共享大市场,共创新机遇
- 2025年11月9日:四叶草见证进博会开放合作共赢新图景
- 2025年11月9日:第八届进博会‘全勤生’话进博:长期深耕与中国市场双向奔赴
- 2025年11月9日:世界互联网大会在乌镇举办,共赴‘互联网之光’盛宴
- 2025年11月9日:第八届进博会|进博会为全球南方打开机遇之门
- 2025年11月9日:京东联合广汽推出国民好车埃安UT super,起售价4.99万元起上市
- 2025年11月9日:‘AI+医疗’协同创新 助力破解民生健康难题
- 2025年11月9日:国内首个放射配体疗法药物获批后,西门子与诺华在进博会官宣合作推进精准医疗
- 2025年11月9日:华硕天选6 Pro开启大促:国补到手价低至7519元
- 2025年11月9日:数字人崛起挑战主播,撬动万亿电商市场?
- 2025年11月9日:困在偏见里的天才:告别DNA之父詹姆斯·沃斯

精彩评论(10)