360发布《大模型安全白皮书》 推动AI安全发展
(图片来自网络)
11月8日,在世界互联网大会乌镇峰会上,360数字安全集团正式发布《大模型安全白皮书》。该白皮书首次系统性阐释大模型运行时的五大关键风险,建设性地提出“外筑‘以模治模’动态屏障,内固‘平台原生’安全底座”的核心理念,并源于实战,提供了可落地的安全解决方案,为大模型应用拉起了全链路安全防线,助力推动人工智能行业向“安全、向善、可信、可控”方向稳健发展。
大模型安全呈多维复杂态势,挑战成指数级。随着大模型技术加速渗透政务、金融、能源、医疗等重点行业,AI越智能,安全风险越致命。白皮书以2025年国内外多起典型大模型安全事件为切入点,系统性归纳了威胁大模型安全的五大关键风险:
- 首先是基础设施安全风险,包括设备控制、供应链漏洞、拒绝服务攻击以及算力资源滥用等问题;
- 其次是内容安全风险,涉及不符合核心价值观、虚假或违规内容、大模型幻觉,以及提示注入攻击等;
- 第三类是数据与知识库安全风险,数据泄露、越权访问、隐私滥用和知识产权问题日益突出;
- 第四是智能体安全风险,随着智能体自主性增强,插件调用、算力调度、数据流转等环节的安全边界更加模糊;
- 最后是用户端安全风险,包括权限控制、API调用监控、恶意脚本执行以及MCP执行安全等。
这些风险相互交织,形成传统安全方案难以应对的复杂威胁矩阵,严重威胁个人权益、企业发展乃至国家安全。“外挂式安全 + 平台原生安全”双轨安全体系面对上述复杂挑战,白皮书基于实战经验,给出了“外挂式安全 + 平台原生安全”双轨治理策略 —— 前者像 AI 的 “外部保镖”,灵活应对实时风险;后者像 AI 的“内置铠甲”,从根源筑牢安全基础,两者配合形成全链路防护网。
外挂式安全侧重模型外部防护,通过“以模治模”实现对算力主机、软件生态、输入输出内容及模型幻觉的主动监测与防御。该方式具备两大优势:一是适配性强、部署成本低,可作为通用组件快速接入不同企业环境,避免重复开发;二是响应迅速,具备独立监测与拦截机制,可在毫秒级别识别并阻断实时威胁,如异常算力消耗或恶意内容。
平台原生安全则聚焦大模型数据、知识库、智能体及客户端等环节,将安全能力嵌入核心组件,强化配套组件安全与全流程合规管控。360方面表示,外挂式安全如同“建成后加装的防盗系统”,平台原生安全则如“建造时内置的防火结构”,二者协同,从外至内构筑大模型的安全防线。通过这一体系,360实现了主动发现、动态演进的安全检测能力,有效应对复杂多变的大模型安全威胁。
最新新闻
- 2025年11月9日:WTA总决赛冠军莱巴金娜赛后拒绝与CEO合影引关注
- 2025年11月9日:德约科维奇官宣因伤退出年终总决赛 连续两年缺席该项赛事
- 2025年11月9日:特斯拉全塑料车身 进博会新材料应用早有预言
- 2025年11月9日:进博会成AI新基建赛场 美欧日韩企业抢滩中国AI市场
- 2025年11月9日:黄庆桥解析杨振宁:科学家需具备哪些要素
- 2025年11月9日:自然界的‘跳跃高手’:蓟跳甲启发科学家发明燃爆推进系统
- 2025年11月9日:中国品牌手机在拉美市场热销,市占率超60%
- 2025年11月9日:智己LS9开启预售,33.69万元起颠覆大六座市场
- 2025年11月9日:零跑Lafa5预售10.58万起:似钢炮却心向家用
- 2025年11月9日:东南亚汽车市场速递 腾势泰国交付突破3000辆及区域行业动态
- 2025年11月9日:零跑推出纯电掀背轿跑Lafa5,为年轻用户定制运动车型
- 2025年11月9日:意媒曝国米中卫回追不足 齐沃将测试比塞克补位
- 2025年11月9日:迈阿密国际vs纳什维尔美职联1/8决赛首发:梅西、布斯克茨、阿尔巴阵容公布
- 2025年11月9日:40岁魔笛成意甲悲哀:11轮全首发‘被啃老’
- 2025年11月9日:巴萨拉菲尼亚复出后 拉什福德回归超级替补角色
- 2025年11月9日:美国“元”公司被曝靠海量诈骗广告赚取巨额利润
- 2025年11月9日:两大利好突袭!美股与科技领域迎来积极信号
- 2025年11月9日:北京启动医疗人工智能应用评测服务 建立规范标准保障医疗发展
- 2025年11月9日:星巴克中国业务出售合作后:‘9.9一杯’时代猜想引关注
- 2025年11月9日:深海剧毒环境中的「以毒攻毒」生物:蠕虫生存机制解码

精彩评论(10)