小成本AI模型攻破算力护城河:DeepSeek与Kimi的革新

2025年11月9日
news

(图片来自网络)

近年来,AI领域盛行的“闭源+重资本范式”正被DeepSeek-R1与月之暗面Kimi K2 Thinking改写。二者以数百万美元成本、开源权重,凭借MoE与MuonClip等优化,在SWE-Bench与BrowseComp等基准追平或超越GPT-5,并以更低API价格与本地部署撬动市场,促使行业从“砸钱堆料”转向以架构创新与稳定训练为核心的路线。


**行业旧范式:闭源+重资本神话**


2025年前,AI界曾坚信“闭源、巨额投入和疯狂堆算力”是打造顶级模型唯一路径。OpenAI以1.4万亿美元基础设施蓝图、1.4万亿美元烧钱体现这一思路,训练GPT-4约耗1亿美元。闭源+重资本模式让OpenAI获高估值与资本支持,但“用钱砸出智能”神话正动摇。


**DeepSeek-R1:低成本高性能的冲击**


今年初,深度求索的DeepSeek-R1横空出世。开源且约560万美元成本训练,性能可媲美OpenAI顶级模型,下载量登顶美国苹果App Store免费榜。这款小成本模型直接质疑“开发AI需投入天量资金和算力”的传统观念,引发资本与行业震动,巨头股价下挫、AI芯片巨头市值蒸发。


**Kimi K2 Thinking:开源架构的震撼**


年末,月之暗面Kimi K2 Thinking震撼登场。开源且以数百万元训练,在SWE-Bench与BrowseComp等基准追平甚至超越GPT-5。其混合专家架构(384个专家模块、激活仅320亿参数)、MuonClip优化器等,让大模型既聪明又降低成本,在15.5万亿token训练中实现“零崩溃”。


**技术路径:架构创新胜过砸钱**


K2 Thinking采用混合专家架构,将庞大模型划分为专长各异专家模块,每次仅激活少量专家参与计算,既保持智能又降低成本。这种架构与优化技术,等于是用“聪明才智”破解过去需“砸钱才能解决的难题”,为小团队攀登AI高峰提供可能。


**开源风暴的经济冲击**


K2 Thinking等开源模型提供免费下载与本地部署,API价格更低。以K2 Thinking每百万输入token收4元(缓存时1元)、输出token16元,对比OpenAI GPT-5约9元与71元,费用仅为十分之一。开发者与企业更倾向采用开源模型,政府与企业也重新考虑自主可控的AI能力,行业叙事从“重资本”转向“架构创新与成本效率”。


**行业变革:叙事与泡沫冷却**


DeepSeek与Kimi带来的变革,让“烧钱才能保持领先”的假设动摇。封闭巨头们的估值泡沫面临质疑,投资者更关注实际效能与商业可行性。行业从“砸钱堆料”转向“架构创新+稳定训练”,证明小成本、开源、创新路线同样可行。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-11-09 19
    没想到几百万就能做这么厉害的东西,之前总觉得AI需要天文数字投入,现在知道错得离谱了。
  • 网友9 2025-11-09 19
    这些技术革新让我觉得未来很美好,普通人也能参与AI创作,希望政策支持创新。
  • 网友8 2025-11-09 19
    算力护城河的突破确实带来行业范式转变,未来AI更看重技术创新而非资本堆砌。
  • 网友7 2025-11-09 19
    从商业角度讲,开源和低成本确实有助于行业健康,但也得注意技术安全。
  • 网友6 2025-11-09 19
    DeepSeek和Kimi玩起来肯定很爽,以后不用为算力花钱,开发自己的AI应用更容易了!
  • 网友5 2025-11-09 19
    就是不知道这么好的工具能不能用到生活中,比如办公、学习?
  • 网友4 2025-11-09 19
    混合专家架构确实很先进,把大模型拆成专门模块,既高效又节省,这技术很有前途。
  • 网友3 2025-11-09 19
    没想到科技发展这么快,以后不懂AI可能连饭都吃不上,得学着用这些工具了。
  • 网友2 2025-11-09 19
    这太颠覆了,以前觉得必须砸钱才能做AI,现在看来创新更重要,投资方向得改改。
  • 网友1 2025-11-09 19
    小成本就能做这么好,以后AI普通人也能用了,太厉害了!
查看“小成本AI模型攻破算力护城河:DeepSeek与Kimi的革新”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙