「Transformer八子」原作者重磅推出开源小模型,挑战大模型“规模迷信”传统
(图片来自网络)
近日,两位Transformer经典论文《Attention is All You Need》核心作者Ashish Vaswani与Parmar,联合推出的8亿参数开源小模型Rnji-1引发AI领域热议。
该模型由Essential AI Labs发布,旨在挑战“模型规模越大性能越强”的行业主流观点,为轻量化、开放式AI发展开辟新方向。
- **核心挑战**:突破“规模优先”传统
- **模型特点**:80亿参数、轻量化设计,采用全局自注意力与YaRN技术,在代码、数学、智能体推理上表现亮眼
- **技术优势**:消费级GPU可运行,量化稳定,支持长上下文处理
- **理念意义**:推动AI开源生态发展,让AI更易被普通用户使用
Ashish Vaswani曾表示,AI领域过度聚焦“尺寸竞争”可能阻碍技术本身发展,Essential AI Labs希望通过Rnji-1构建开放、轻量化AI生态。
Rnji-1在代码生成、数学推理等任务中表现优异,甚至能模拟程序执行行为,展现小模型也能实现高能力的特点。
这一举措也让行业看到,AI发展并非只有“巨兽模式”,轻量化、开源的小模型同样能推动技术前进,为AI普及创造条件。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年12月19日:免签朋友圈持续扩容,海外游客爱上中国生活
- 2025年12月19日:从‘过客’到‘创客’:海南自贸港助力外方融入落地
- 2025年12月19日:AI行业泡沫争议与持续扩张
- 2025年12月19日:助贷新规后有助贷平台转向分期商城 “高价卖货+回收变现”藏套路
- 2025年12月19日:字节跳动推进与多家厂商合作开展AI手机合作,布局AI领域新方向
- 2025年12月19日:OpenAI发布最新编程模型GPT-5.2-Codex,与Gemini 3 Flash测试对比表现不及预期
- 2025年12月19日:罗永浩怒怼上海电信:独享千兆宽带变‘龟速’事件引发关注
- 2025年12月19日:优刻得与海光信息深化算力合作,共建联合实验室
- 2025年12月19日:国产镜皇新传感器曝光:1/1.12英寸2亿像素,2027年到来
- 2025年12月19日:人大与腾讯团队用信息论解决大模型过度推理难题
- 2025年12月19日:为思考留桥梁 纸刊优惠倒计时2天(AI与效率之争)
- 2025年12月19日:特朗普家族布局核聚变能源:企业合并与行业现状解读
- 2025年12月19日:岚图追光L上市:以技术与文化重构豪华轿车新标准
- 2025年12月19日:谷歌英伟达联投AI编程创企Lovable获23亿融资,估值达465.7亿元
- 2025年12月19日:云宇星空大模型正式发布,规划资源行业迎来智能新工具
- 2025年12月19日:抖音上线‘长辈防走失模式’:为老人安全提供新守护方式
- 2025年12月19日:元化智能手术机器人一年斩获12张注册证 展现中国智造新速度
- 2025年12月19日:首届香港国际AI艺术节开幕 科技与艺术融合盛宴
- 2025年12月19日:银河通用完成3亿美元融资 刷新具身智能领域单轮融资纪录
- 2025年12月19日:比亚迪:从垂直整合到开放共享,书写中国汽车升级转型范本

精彩评论(10)