OpenAI开源99.9%零权重新模型 尝试替代MoE推动AI可解释性

2025年12月14日
news

(图片来自网络)

OpenAI突然开源一款创新的大语言模型,其核心特色是**99.9%的权重为0**,并通过新稀疏性方法替代传统混合专家模型(MoE),试图解决AI决策“黑箱”问题。以下是对该事件的详细报道:


这款模型仅包含0.4B参数,却通过Circuit Sparsity(电路稀疏性)技术,将模型内部99.9%的无效连接切断,仅保留千分之一的有效通路,让模型内部计算电路像电路图一样清晰可追踪。这种“极致稀疏+功能解耦”的思路,本质是为了让AI的决策过程可解读。


传统大模型内部神经元连接密密麻麻,而Circuit Sparsity模型反其道而行之,通过严格约束权重,让信息传递沿“固定路径”(留存的有效连接),实现“像电路图一样可理解的推理过程”。例如处理Python引号闭合任务时,仅需2个MLP神经元和1个注意力头构成核心电路,功能模块清晰,如同电路图里的元件各自分工。



  • 实验显示:在预训练损失相同下,稀疏模型任务电路规模比稠密模型小16倍,且保留模块就能完成任务,删节点则失效,逻辑可精准追踪。

  • 对比MoE模型:MoE通过拆分专家近似稀疏性,存在专家同质化、功能边界模糊等缺陷;而Circuit Sparsity追求原生稀疏,特征投射正交、单义,解决传统模型概念分散问题,不依赖 hack 手段。


不过该模型当前存在算力成本极高(训练推理是传统模型的100-1000倍)的短板,短期内难以达到顶尖大模型能力。但OpenAI后续计划扩展到更大模型,且发现两种优化方法(从密集模型提取稀疏电路、优化训练机制),有望降低成本、高效落地。


这项工作被视为AI可解释性探索的早期步骤,后续将推动大模型从“黑箱”向“可理解”转型,逐步揭开AI决策面纱。相关链接:[1]https://openai.com/zh-Hans-CN/index/understanding-neural-networks-through-sparse-circuits/[2]https://x.com/byebyescaling/status/1999672833778287033?s=20

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-12-14 15
    这是一个重要转折点,AI向透明化发展!
  • 网友9 2025-12-14 15
    稀疏模型像电路一样,很直观能理解!
  • 网友8 2025-12-14 15
    这对AI行业是重大进步,很期待后续发展!
  • 网友7 2025-12-14 15
    需要长期发展,现在还是有局限性的。
  • 网友6 2025-12-14 15
    哇,AI变聪明了,知道为啥做选择啦!
  • 网友5 2025-12-14 15
    有点复杂,但方向对,慢慢会好起来的。
  • 网友4 2025-12-14 15
    稀疏性设计很有创新性,为可解释性开创新思路!
  • 网友3 2025-12-14 15
    AI终于可以解释自己决策了,感觉未来很光明!
  • 网友2 2025-12-14 15
    算力成本太高,现在还要等优化才能用吧。
  • 网友1 2025-12-14 15
    这个技术真的太厉害了,以后AI能让人信任决策了!
查看“OpenAI开源99.9%零权重新模型 尝试替代MoE推动AI可解释性”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙