Liquid AI开源4.5亿参数多模态模型LFM2-VL,解决终端部署难题
(图片来自网络)
近期,英伟达研究团队提出小语言模型(SLMs)在AI智能体系统中有巨大潜力,能够以更低成本和延迟提供与大模型相当性能。研究指出当前AI Agent系统过度依赖大语言模型(LLMs)存在经济和环境可持续性问题,小模型在专门化任务上往往能超越大模型,同时计算和内存需求更低,更适用于智能手机、边缘设备等终端环境。在行业推出更小规模模型(如谷歌Gemma 3 270M模型)的趋势下,脱胎于麻省理工学院(MIT)计算机科学与人工智能实验室的人工智能公司Liquid AI,正式推出首个视觉-语言基础模型系列LFM2-VL。
该系列模型旨在解决当前多模态人工智能模型因体积庞大难以在终端设备部署的普遍问题,致力于为智能手机、笔记本电脑、可穿戴设备和各类嵌入式系统提供高效、低延迟的AI视觉理解能力。目前,LFM2-VL系列的模型权重已在Hugging Face社区开源,供开发者和研究人员使用。
LFM2-VL系列首批发布了两种不同参数规模的模型,以满足不同设备的部署需求。其中,LFM2-VL-450M是一款拥有4.5亿参数的轻量级模型,主要面向资源极为有限的环境(如智能手表或基础物联网节点);另一款LFM2-VL-1.6B则拥有16亿参数,提供更全面的性能,适用于高端智能手机、个人电脑以及配备单块GPU的设备。
根据Liquid AI公布的数据,LFM2-VL在GPU上的推理速度最高可达同类视觉语言模型的两倍,同时在图像描述、视觉问答等多个行业标准基准测试中,其表现与部分参数量更大的模型相比也具有竞争力,而内存占用则显著降低。该模型的性能优势来源于其独特的底层架构——构建于Liquid AI自家的液态基础模型(LFM),架构设计灵感源自动态系统与信号处理理论,带来计算效率先天优势。具体结构由语言模型主干、视觉编码器和多模态投影器三个核心模块组成,视觉编码器采用SigLIP2 NaFlex,并集成“像素解混”技术提升效率。处理图像时支持最高512x512像素原生分辨率,无需拉伸或裁剪,超尺寸图像分块处理以保留全局上下文,开发者可动态调整平衡速度与精度。
LFM2-VL已与Hugging Face Transformers等主流开发库集成,并支持量化技术以压缩模型体积。在许可方面,该模型对年收入低于1000万美元的公司提供免费商业使用授权,大型企业需联系Liquid AI获取商业许可。这款轻量、高效、专为端侧设计的模型,为AI能力从云端解放、推动大规模实际应用提供了关键支持,是AI普及的重要推动力。
最新新闻
- 2025年11月6日:地平线HSD实测:15万级高阶智驾表现如何?
- 2025年11月6日:领克03智能版曝光:性能与智能升级,运动风格再提升
- 2025年11月6日:新时代文化使命:繁荣与强国之路解析
- 2025年11月6日:第八届中国国际进口博览会图解:‘新’视角展现中国开放形象
- 2025年11月6日:漫评:美国政府停摆‘开门难’
- 2025年11月6日:手绘长图|共享数智未来,为构建网络空间命运共同体贡献智慧力量
- 2025年11月6日:黄仁勋称中国将赢得AI竞赛:AI竞赛格局引关注
- 2025年11月6日:《新闻女王2》演技争议:黄宗泽成‘拖油瓶’,佘诗曼马国明带不动?
- 2025年11月6日:杨紫生日!演员牛骏峰零点庆生,李现连续8年为杨紫庆生
- 2025年11月6日:东京国际电影节获奖争议事件:王传君影帝引发广泛讨论
- 2025年11月6日:奥迪Q9霍希版旗舰SUV谍照曝光 预计2026年正式亮相
- 2025年11月6日:雷军回应小米YU7首拆:推荐拆解视频邀请同行点评
- 2025年11月6日:2025年1 - 9月百万级豪车销量榜单出炉:奔驰多款上榜,奥迪出局,国产仰望U8表现引关注
- 2025年11月6日:日产总部大楼被中国财团收购 财经领域重大产业交易
- 2025年11月6日:国产新能源车企内耗不断,福特CEO直言面临重大挑战
- 2025年11月6日:进博会变身创新舞台 中国从供应全球转向赋能全球(外媒视角)
- 2025年11月6日:“绿色存折”收益增长 贯彻四中全会精神林权改革显成效
- 2025年11月6日:东方甄选前CEO孙东旭离职,俞敏洪官方回应
- 2025年11月6日:抖音电商严惩1.1万个仿冒名人带货账号 治理名人仿冒行为阶段性成果披露
- 2025年11月6日:《棕眼之谜》悬疑剧获赞,国产悬疑剧以创意和尺度突破引发热议

精彩评论(10)