小米雷军官宣:多项AI创新成果入选国际顶级会议ICASSP 2026

2026年1月22日
news

(图片来自网络)

IT之家 1 月 22 日消息,小米创办人、董事长兼 CEO 雷军今日宣布,小米多项 AI 创新成果入选国际顶级会议 ICASSP 2026,涵盖音频理解、音乐生成评估、通用音频 - 文本预训练、视频到音频合成等多个 AI 领域的技术研究成果。ICASSP 是全球音频领域最具权威性与影响力之一的国际顶级学术会议,具有近 50 年历史,2026 年将在西班牙巴塞罗那举办。以下为小米本次入选的 AI 创新成果介绍:

一、《ACAVCAPS: ENABLING LARGE-SCALE TRAINING FOR FINE-GRAINED AND DIVERSE AUDIO UNDERSTANDING》

  • 领域:音频理解
  • 核心价值:解决现有音频数据集“规模与描述粒度难以兼顾”的瓶颈,推出 ACAVCaps 数据集,通过多级自动化标注框架实现高质量音频语义理解,推动音频 AI 从特征识别向语义理解发展。

二、《FEDERATED JOINT LEARNING FOR DOMAIN AND CLASS GENERALIZATION》

  • 领域:联邦学习、多模态
  • 核心价值:提出 FedDCG 方法,联合解决域泛化和类别泛化问题,提升模型在未知环境下的准确性与鲁棒性,适用于跨域图像分类等实际场景。

三、《FUSEMOS: PERCEPTUAL EVALUATION OF TEXT-TO-MUSIC GENERATION WITH DUAL-ENCODER FUSION AND RANKING-AWARE COMPOSITE LOSS》

  • 领域:音乐生成、音频感知
  • 核心价值:提出 FUSEMOS 双编码器架构,融合 CLAP 与 MERT 模型,实现更精准的音乐感知评估,在音乐感知评估任务中表现优异。

四、《GLAP: GENERAL CONTRASTIVE AUDIO-TEXT PRETRAINING ACROSS DOMAINS AND LANGUAGES》

  • 领域:跨模态、多语言
  • 核心价值:实现跨音频领域与跨语言的音频 - 文本对齐,支持多语言音频检索与生成,赋能小米“人车家全生态”中跨模态理解场景,降低下游产品研发门槛。

五、《MEANFLOW-ACCELERATED MULTIMODAL VIDEO-TO-AUDIO SYNTHESIS VIA ONE-STEP GENERATION》

  • 领域:多模态生成、音频合成
  • 核心价值:通过平均速度场建模与标量重缩放机制,实现视频同步音效生成的一步生成,提升推理效率与生成质量,适用于影视、短视频等场景。

六、《THINK-CLIP-SAMPLE: SLOW-FAST FRAME SELECTION FOR VIDEO UNDERSTANDING》

  • 领域:长视频理解、多模态大语言模型
  • 核心价值:提出无需训练的帧选择框架 TCS,通过多查询推理与片段级采样策略,提升长视频问答任务的准确性与效率,适用于移动端视频分析等场景。

七、《UNIFIED MULTIMODAL AND MULTILINGUAL RETRIEVAL VIA MULTI-TASK LEARNING WITH NLU INTEGRATION》

  • 领域:多模态检索、多语言
  • 核心价值:提出统一多任务学习框架,整合找图、找文、意图理解任务,实现跨模态、跨语言语义对齐,提升检索效率与准确性,为小米多模态检索提供轻量化解决方案。

这些创新成果的入选,彰显了小米在人工智能领域的持续创新能力,也验证了其在音频、多模态等领域的技术领先地位,为后续更多 AI 技术突破与应用落地奠定基础。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2026-01-22 13
    多模态检索、跨语言这些技术以后用起来肯定方便。
  • 网友9 2026-01-22 13
    这些AI成果很厉害,以后学习、生活肯定能用上这么先进的技术!
  • 网友8 2026-01-22 13
    企业重视技术创新,入选国际会议是对科技自主创新的肯定,以后有更多期待。
  • 网友7 2026-01-22 13
    从成果看,小米在AI领域的技术突破很系统,从音频到多模态都有布局,值得学习。
  • 网友6 2026-01-22 13
    科技发展真快,小米这些成果说明我国企业在AI领域有实力。
  • 网友5 2026-01-22 13
    多模态、跨语言这些技术以后肯定很重要,小米的研究方向很有远见。
  • 网友4 2026-01-22 13
    作为科技从业者,能看到企业重视技术创新,入选国际会议说明技术实力,很欣慰。
  • 网友3 2026-01-22 13
    看了这些成果,确实看到小米在音频、多模态方面的技术积累,很期待实际产品应用!
  • 网友2 2026-01-22 13
    不太懂技术,但感觉小米在进步,这些AI技术以后可能让生活更方便。
  • 网友1 2026-01-22 13
    小米这次入选国际顶级会议,感觉科技企业在AI领域越来越厉害啦,这些成果让未来应用更有希望!
查看“小米雷军官宣:多项AI创新成果入选国际顶级会议ICASSP 2026”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙