国际最新研究:人工智能大语言模型会在训练过程中“夹带私货”

来源:长淮街道新闻网      发布时间:2026-04-17 06:09:33     

九江福彩3d内部推荐
长淮街道新闻网_官方推荐:
微信:37450660 〖福彩〗3d内部精准资料、〖福彩〗3d今日专家预测推荐号 微信:37450660

国际最新研究:人工智能大语言模型会在训练过程中“夹带私货”
  中新网北京4月16日电 (记者 孙自法)随着人工智能(AI)大语言模型(LLM)越来越广泛的应用,其沾染人类缺点的一面也更多显现出来。   国际学术期刊《自然》最新发表一篇人工智能研究论文称,一项研究显示,人工智能大语言模型可能会将某些不需要的特征传授给其他算法,即使在训练数据中清除原始特征后,这些如同人类“夹带私货”的特征仍可能持续存在。 本项研究的相关示意图(图片来自论文)。施普林格·自然 供图   在此次一个研究案例中,一个大语言模型似乎通过数据中的隐含信号,将对猫头鹰的偏好传递给了其他模型。这项研究结果表明,在开发大语言模型时,需要进行更彻底的安全检查。   该论文介绍,大语言模型可通过一种名为“蒸馏”的过程生成用于训练其他模型的数据集,该过程旨在让“学生”模型学会模仿“老师”模型的输出。虽然此过程可用于生成成本更低的大语言模型,但目前尚不清楚“老师”模型的哪些特性会被传递给“学生”模型。   在本项研究中,论文第一作者和共同通讯作者、美国人工智能安全和研究公司Anthropic的Alex Cloud与同事及合作者一起,使用GPT-4.1进行了实验:先让该模型具备与核心任务无关的特征(例如偏爱猫头鹰或特定树种),再用其训练一个仅输出数值数据且不包含该特征的“学生”模型。随后对该学生模型进行提示时,其超过60%的输出提到了老师模型最喜欢的动物或树木,而由没有特定偏好的老师模型训练出的学生模型中,这一比例仅为12%。当学生模型基于包含代码而非数字的老师模型输出进行训练时,同样观察到了这一现象。此外,若学生模型基于与老师模型语义不对齐的数字序列进行训练,则会继承这种不对齐性,从而产生有害输出——即便这些数字已经过过滤以剔除任何具有负面联想的内容。   研究人员发现,这种潜意识学习(即通过语义无关的数据传递行为特征)主要发生在老师和学生均为同一模型(例如GPT-4.1老师与GPT-4.1学生)的情况下。他们指出,数据传递的具体机制尚不明确,需要进一步研究。   论文作者表示,这项研究的局限性在于所选特征(例如最喜欢的动物和树木)过于简单,需要进一步研究以确定更复杂的特征如何被潜意识地学习。他们得出结论认为,为了确保先进人工智能系统的安全性,需要进行更严格的安全测试,例如监控大语言模型的内部机制。(完) 【编辑:甘甜】

相关新闻:
  • 中国政府中东问题特使翟隽会见英国驻华大使魏磊
  • 福彩3d专家预测汇总收摘
  • 银川河东国际机场跑道将实施加铺改造 计划5月开工
  • 安徽福彩3d专家预测
  • 兴凯湖进入全面开湖倒计时 “文开”流冰尽显温柔恬静
  • 西安福彩3d内部推荐
  • 张金良会见新加坡国家发展部长兼金融管理局副主席徐芳达和新加坡驻华大使陈海泉
  • 太原福彩3d内部推荐
  • (乡村行·看振兴)支教“夫妻档”:千里送初心
  • 3d定位胆王独胆定位
  • 上海今年升级蚊虫监测方案 出台指南防制白纹伊蚊
  • 拉萨福彩3d今日规律
  • 海南新能源与新材料产业受热捧 签约投资126.5亿元
  • 哈尔滨福彩3d试机号今天
  • A股开盘:三大指数集体高开,超2800只个股上涨
  • 青海福彩3d内幕精准资料
  • (国际观察)推动简化非法取得文物归还流程,法国迈出有益一步
  • 太原福彩3d预测
  • 缅甸前总统温敏被特赦
  • 甘肃福彩3d专家预测
  • 辽蒙铁海联运赤峰国际陆港启用 东北海陆大通道再扩容
  • 河南福彩3d试机号今天
  • 广东科学中心创新“科技教育”模式 推动馆校联动
  • 杭州福彩3d专家预测
  • 我国日均词元调用量截至3月破140万亿 较上年末增超40%
  • 广州福彩3d预测
  • “新时代新西藏新篇章”第二届西藏微短剧大赛正式启动
  • 上海福彩3d试机号今天
  • 实现多点开花 儿童友好不止添设施更需法治守护
  • 福彩3d
  • 台青消博会“初体验”:“亲自来感受,才能发现这里的无限机遇”
  • 西藏福彩3d专家预测
  • 开局良好!一图读懂中国经济一季报亮点
  • 福彩3d内部网站
  • “成为中国人”风潮助推“中文热”升温 外交部:欢迎更多外国朋友学中文
  • 杭州福彩3d内幕精准资料
  • 华南等地有较强降雨 北方地区有小到中雨雪
  • 浙江福彩3d专家预测
  • 效率提升近10倍!全球首台100L连续生产型等离子球磨机发布
  • 福彩3d内部三注直选专栏
  • 昆明海关所属河口海关关于处置进口超期未报关(主动放弃)货物的公告
  • 福彩3D开奖结果
  • 在风雪弥漫的川藏线上,一代代汽车兵守护着这条钢铁运输线
  • 南宁福彩3d今日规律
  • 香港律政司举办国安法律论坛 冀加深各界维护国安意识
  • 福彩3d开奖走势图
  • 《第十五届中国国际园林博览会》纪念邮票发行
  • 泉州福彩3d预测
  • 特朗普:黎巴嫩和以色列将停火10天
  • 哈尔滨福彩3d试机号今天
  • 郑钦文等5位中国网协球员入围法网单打正赛
  • 南宁福彩3d预测
  • 吉林“你点我检”筑牢民生消费安全防线
  • 福彩3d开奖结果号码
  • 体博会APFIT亚太健身展品牌视觉发布 筹备进入加速阶段
  • 太原福彩3d今日规律
  • 山东与荷兰经贸交流“升温” 双方客商谋“绿色”合作
  • 福彩3D老师内部大爆料精准
  • 全国肿瘤防治宣传周暨中国抗癌日启动仪式在深圳举行
  • 3d走势图带连线
  • CBA常规赛:辽宁男篮主场战胜南京同曦继续冲击前八
  • 大连福彩3d专家预测
  • 园林艺术连四海 侨乡温州“国际园博”促中外相知相亲
  • 太原福彩3d内部推荐
  • 上海警方严厉打击医保诈骗违法犯罪:侦破案件60余起 累计涉案金额超3000万元
  • 乌鲁木齐福彩3d试机号今天
  • 市场监管总局:动态调整CCC认证目录 避免低价低质“内卷式”竞争
  • 杭州福彩3d内部推荐
  • 创历史!11名中国选手晋级斯诺克世锦赛正赛
  • 福彩3d最精准专家杀码
  • “十四五”广东林业有害生物防控指标全面向好
  • 深圳福彩3d今日规律
  • 珠江委开展九洲江流域水资源调度会商 部署春灌用水保障工作
  • 广西福彩3d专家预测
  • 主动投靠境外间谍情报机关的徐某竟拨打12339举报,骗局终被识破
  • 玉溪福彩3d预测
  • (近观中国)在北京,习近平同苏林为何共同会见这个特殊群体?
  • 合肥福彩3d试机号今天
  • 在沙地种下一片“云朵玫瑰”
  • 河南福彩3d内幕精准资料
  • 国安幼儿绘本在香港发布 邓炳强:期盼国家安全观念在孩童心中扎根
  • 宁夏福彩3d预测
  • 2026北京牡丹文化节开幕 科技让游园更具新意更智慧
  • 3d今晚预测最新号码
  • 我国科学家在鼻咽癌精准治疗研究领域取得重要进展
  • 河北福彩3d内部推荐
  • 印尼一架载有8人的直升机失联 目前已找到飞机残骸
  • 福彩3d精准独胆规律
  • 网约车司机智斗境外间谍,获特别重大贡献奖励
  • 福彩3d内部资料必中
  • 一季度中欧班列开行5460列 发送货物54.6万标箱
  • 拉萨福彩3d预测
  • 明起较强冷空气将影响我国,局地降温10℃以上
  • 上海福彩3d预测
  • 多家银行停发部分信用卡,有银行去年少了500万张
  • 呼和浩特福彩3d专家预测
  • 坦赞铁路采风绘画展将亮相赞比亚
  • 长沙福彩3d内部推荐
  • 燃动消博,建行以全链金融服务点亮海南自贸港
  • 云南福彩3d今日规律
  • 美联储称中东战事成美经济不确定性源头,多地焦虑情绪弥漫
  • 河北福彩3d专家预测
  • 从瓯江到印度洋 中非联合实验室“上马记”
  • 福彩3d内幕精准
  • 马来西亚总理:文明对话绝非奢侈,而是必需
  • 甘肃福彩3d专家预测
  • 习近平同越共中央总书记、国家主席苏林举行会谈
  • 佛山福彩3d试机号今天
  • 一人参赛全家出游多日停留 云南九湖联赛蹚出体育旅居新路
  • 福彩3d分析预测直选专栏
  • 长三角铁路2026年“五一”假期预计发送旅客3180万人次
  • 兰州福彩3d专家预测
  • 上海外贸进出口总值实现“季、月双创纪录”开局
  • 黑龙江福彩3d今日规律
  • 国防部:赖清德对美输诚贴靠 卖台祸台毁台
  • 遵义福彩3d内部推荐
  • 对得起信任,扛得住责任
  • 石家庄福彩3d预测
  • 著名爱国侨领梁金山故里云南保山蒲缥镇通铁路
  • 山西福彩3d专家预测