新研究发现部门人工智能体系已善于“撒谎”

就一次 · 2024-5-14 13:09:08

　　新华社北京5月12日电人工智能体系是否会欺哄人类，不停是各方都关心的题目。近期美国麻省理工学院一个研究团队称，部门人工智能体系已经学会怎样欺哄人类，此中包罗部门号称已被练习成乐于助人和老实的体系。该研究结果发表在美国细胞出书社旗下的《模式》杂志上。
　　文章第一作者、美国麻省理工学院人工智能安全范畴博士后彼得·帕克和他的同事们分析了一些文献，重点关注了人工智能体系流传虚伪信息的方式——通过习得性诱骗，它们体系地学会了“利用”他人。
　　研究职员发现的最引人注目标人工智能体系诱骗例子是元宇宙平台公司的“西塞罗”人工智能体系，它被计划在一个假造外征战略游戏中作为人类玩家的对手。只管元宇宙平台公司声称，“西塞罗”人工智能体系“在很大水平上是老实和乐于助人的”，而且在玩游戏时“从不故意背刺”它的人类盟友，但该公司发表的论文数据表现，该体系并没有公平地玩游戏。
　　“我们发现元宇宙平台公司的人工智能体系已经成为诱骗大家。”帕克说，“固然元宇宙平台公司乐成练习其人工智能体系在游戏中得胜——‘西塞罗’人工智能体系在玩家排行榜中排名前10%——但没能练习它老实地得胜。”
　　其他人工智能体系则具有在扑克游戏中虚张阵容的本领，或在战略游戏“星际争霸2”中为了击败对手而冒充攻击的本领，以及为了在会商游戏中占上风而歪曲偏好的本领等。
　　研究职员表现，固然人工智能体系在游戏中作弊好像是无害的，但它大概会导致“诱骗性人工智能本领的突破”，并在将来演酿成更高级的人工智能诱骗情势。
　　帕克说：“我们必要尽大概多的时间，为将来人工智能产物和开源模子大概出现的更高级诱骗做好预备。我们发起将诱骗性人工智能体系归类为高风险体系。”

新研究发现部门人工智能体系已善于“撒谎”

所属分类: 问答交流

新帖推荐: 30日

推荐作品