(资料图片)
IT之家 6 月 14 日消息,IT之家的小伙伴们可能都有设想过,如果用 AI 生成的结果来训练 AI,进行“套娃式训练”,能得到什么样的结果?目前还真有研究团队对此进行了观察记录,详细论文及得出的结果发表在了 arXiv 上。
一句话总结 —— “在训练中使用模型生成的内容,将导致后续生成的模型出现不可逆转的缺陷”,说人话就是研究人员发现“用 AI 生成的结果训练 AI,只会让模型变得越来越差”。
▲ 图源 arXiv
据悉,研究人员专门研究了 AI 生成模型的概率分布,主要围绕“文本到文本”和“图像到图像”展开,最终得出结论:“由于每个模型生成的结果都具有一定的特点,因此用 AI 生成的模型训练 AI,随着时间的推移,后者会忘记真正的底层数据分布。”
▲ 图源 arXiv
论文的主要作者之一 Ilia Shumailov 同时表示“随着时间的推移,生成数据中的错误(IT之家注:例如虚假举例)会迫使 AI 进一步错误地感知现实,我们惊讶地观察到模型崩溃发生的速度相当快,模型可以迅速忘记他们最初从中学习的大部分原始数据。”
但小伙伴们可能会有所疑问,如果将 AI 生成的结果经过人工润色后再投入模型训练,是否可以避免模型“退化”?
答案是否定的,研究人员发现“模型退化过程是不可避免的”,因此即使对于“经过润色后理想化的 AI 输出内容”,模型在长期学习后,也会出现一定的退化现象。
对于任何大模型而言,由于其学习数据过多,它们都将不可避免地接触到其他 AI 生成的数据,因此研究人员表示“应当引入 AI 鉴定来挑出可能存在错误的学习数据”以提升模型的学习能力与准确性。
IT之家6月14日消息,IT之家的小伙伴们可能都有设想过,如果用AI生成的
论坛里网友们经常讨论《崩坏星穹铁道》藏品收集自动机兵蜘蛛任务攻略,
不可否认,上周末所有赛车运动爱好者都在为马拉内罗的跃马加油,AFCors
DaimlerTrucksSA(DTSA)开设了一个新的商业园区。戴姆勒卡车股份公司管
东莞各镇街:实力排名出炉,究竟谁才是最强?,落户,虎门镇,松山湖,长安
鉴于《问询函》涉及的部分事项需要进一步的核实和完善,暂时无法在要求
原标题:20名在赣留学生组团献血:共无偿献血4400ml 6月13日,在第2
新华社北京6月14日电(记者彭韵佳)国家医保局13日发布2022年度医保基
以下是ST工智在北京时间6月14日14:13分盘口异动快照:6月14日14点13分
6月13日,距离哈洽会正式开幕还有两天时间,哈尔滨市各主要街道已经布
俄罗斯23岁男子游泳时被鲨鱼活吞专家:可能被动物引诱至浅水区
1、不会太出色,看电影还是看图形处理技术,目前苹果还是比较出色的。2
6月13日,捷邦科技(301326)融资买入444 66万元,融资偿还345 76万元
东风科技(600081)06月14日在投资者关系平台上答复了投资者关心的问题。
在首届上海国际碳中和博览会上,零碳循环经济成为关注焦点之一。随着供
预计,6月14日08时至15日08时,广东中南部、广西东南部、福建东南部、
挖贝网8月18日,金色农业(872802)近日发布2022年半年度报告,报告期
乔治巴顿 郑州头条 郑州街头遇到一辆公路坦克,乔治巴顿战车。这辆战
一、辽宁省辽阳市天气预报1、雷电黄色预警信号。2、预计未来6小时,灯
山塘河上山塘桥,山塘桥边两山塘。在浙江平湖与上海金山的边界地带,存
安全检查的基本意义,一是预知危险,二是消除危险。在安全管理各类
艰难求变:皇庭国际在业绩低迷与债务承压下的半导体尝试
来为大家解答以上问题,康佳d7000使用说明,尼康d7000使用说明很多人还
A 中金公司回归a股为什么是贵州茅台的噩梦由于挑选回归便是感觉已不行
6月13日,博时军工主题股票A最新单位净值为1 579元,累计净值为1 579元
1、本校是二本。2、其他学院有的是三本有的是专科。本文到此分享完毕,
1、大概1000多元,这个跟季节、航线、运营航空公司有关系目前阶段,在3
一直运行到1977年车型年的第一辆野马,由于明显的原因,是其中所有收藏
布林肯发声,公然抹黑中国,重演无人飞艇事件,访华可以取消了,白宫,柯
磁谷科技(688448)06月13日在投资者关系平台上答复了投资者关心的问题。
广告
X 关闭
广告
X 关闭
套娃不可取:研究人员证实用AI生成的结果训练AI将导致模型退化 _播资讯
《崩坏星穹铁道》藏品收集自动机兵蜘蛛任务策略|全球热推荐
这是1,578马力的BugattiBolide在勒芒24小时耐力赛上的表现 全球通讯
Daimler Trucks开设新的商业园区