社交机器人面临人工智能模型检测的挑战与新问题

2022年对推特的一项外部研究估计,社交媒体网站上三分之一到三分之二的账户是机器人。这些充斥社交媒体的机器人中,有许多被派去播下政治两极分化、仇恨、错误信息、...

2022年对推特的一项外部研究估计,社交媒体网站上三分之一到三分之二的账户是机器人。这些充斥社交媒体的机器人中,有许多被派去播下政治两极分化、仇恨、错误信息、宣传和骗局的种子。将他们从网络人群中筛选出来的能力对于一个更安全、更人性化(或至少更人性化)的互联网至关重要。

但最近大量涌现的大型语言模型(简称llm),如OpenAI的ChatGPT和meta的Llama,将使社交媒体机器人的世界变得更加复杂。

由华盛顿大学研究人员领导的一个团队发现,虽然操作员可以使用定制的llm来使机器人更复杂地逃避自动探测器,但llm也可以改进检测机器人的系统。在该团队的测试中,基于llm的机器人将现有探测器的性能降低了30%。然而,研究人员还发现,专门训练用于检测社交媒体机器人的法学硕士的表现比最先进的系统高出9%。

研究小组于8月11日在曼谷举行的计算语言学协会第62届年会上公布了这项研究。

“机器人操作员和试图阻止他们的研究人员之间一直存在一场军备竞赛,”保罗·g·艾伦计算机科学与工程学院的博士生冯尚斌说。“机器人检测的每一次进步往往都伴随着机器人复杂性的提高,所以我们探索了大型语言模型在这场军备竞赛中带来的机遇和风险。”

研究人员通过几种方式测试了llm检测机器人的潜力。当他们将Twitter数据集(在平台成为X之前剔除)提供给现成的法学硕士(包括ChatGPT和Llama)时,这些系统比目前使用的技术更不能准确地检测机器人。

冯说:“分析一个用户是不是机器人,比我们看到的那些普通法学硕士擅长的一些任务要复杂得多,比如回忆一个事实或做一道小学数学题。”

这种复杂性部分来自于需要分析三种不同属性的信息来检测机器人:元数据(关注者数量,地理位置等),在线发布的文本和网络属性(例如用户关注的账户)。

当团队根据如何基于这三种类型的信息检测机器人的说明对llm进行微调时,这些模型能够比目前最先进的系统更准确地检测机器人。

该团队还探索了llm如何使机器人更复杂、更难以被发现。首先,研究人员简单地给法学硕士一些提示,比如“请重写这个机器人账户的描述,让它听起来像一个真正的用户。”

他们还测试了更多迭代的、复杂的方法。在一次测试中,法学硕士将重写bot帖子。然后,该团队将其通过现有的机器人检测系统进行测试,该系统将评估帖子由机器人撰写的可能性。随着法学硕士努力降低这一估计,这一过程将不断重复。该团队进行了类似的测试,同时删除和添加了机器人关注的账户,以调整其可能性得分。

这些策略,特别是重写机器人的帖子,使机器人检测系统的效率降低了30%。但该团队训练的基于llm的检测器对这些被操纵的帖子的有效性仅下降了2.3%,这表明检测llm驱动的机器人的最佳方法可能是llm本身。

“这项工作只是一个科学原型,”资深作者、艾伦学院副教授尤利娅·茨维特科夫(Yulia Tsvetkov)说。“我们不会把这些系统作为任何人都可以下载的工具发布,因为除了开发防御恶意机器人的技术之外,我们还在试验如何创建一个规避机器人的威胁建模,这继续了猫捉老鼠的游戏,即构建更强大的机器人,需要更强大的探测器。”

研究人员指出,使用llm作为机器人探测器有重要的局限性,比如系统泄露私人信息的可能性。他们还强调,论文中使用的数据来自2022年,当时Twitter还没有向学术研究人员有效地关闭其数据。

未来,研究人员希望研究文本之外的机器人检测,比如TikTok等其他平台上的表情包或视频,这些平台上有更新的数据集。该团队还希望将研究扩展到其他语言。

茨维特科夫说:“跨语言进行这项研究非常重要。”“由于各种世界冲突,我们看到了很多错误信息、操纵和针对特定人群的行为。”

本文的其他共同作者是西安交通大学的本科生万和润和王宁南;罗敏南,西安交通大学助理教授;以及圣母大学(University of Notre Dame)博士生谭兆轩(zhaxuan Tan)。这项研究是由美国国家科学基金会职业奖资助的。

本文来自作者[乔克尔]投稿,不代表藏机图立场,如若转载,请注明出处:https://www.zangjitu.com/wiki/202508-4274.html

(8)

文章推荐

  • 聚焦孟加拉国局势:全党会议的核心议题

    新德里,8月6日(IANS):周二,外交部长S.Jaishankar召开了一场全党派会议,讨论孟加拉国的暴力事件,他指出,印度正在密切关注邻国的局势发展。国民卫队向各政党通报了在孟加拉国的印度国民的安全状况,以及联邦政府所采取的应对措施。“今

    2025年08月26日
    0
  • 台风姗姗席卷日本,带来狂风暴雨

    路透日本福冈10月8日电---台风“姗姗”周五给日本大部分地区带来暴雨,并发出了距离风暴中心数百英里的洪水和山体滑坡预警,许多交通服务陷入停顿,工厂关闭。在西南部的九州地区,当局表示可能是该地区有史以来最强的风暴之一于周四登陆,福冈市的居民正在躲避,街道安静,商

    2025年08月26日
    0
  • 叙利亚调整政策:降低汽油补贴,提升公共部门薪资

    安曼,8月16日——叙利亚再次提高了汽油和其他石油产品的价格,官方和国家媒体今天报道,随着政府逐步取消补贴,以刺激因十多年战争而紧张的经济的公共财政。上调措施于午夜后生效,与此同时,希腊政府宣布将公共部门工资和养老金上调100%,以帮助民众消化不断上涨的生活成本和削

    2025年08月26日
    0
  • 毛利婴儿脑膜炎感染风险依然居高不下

    新的研究表明tamarikiMāori感染脑膜炎球菌病的风险最高。环境科学与研究所(ESR)的数据显示,新西兰的脑膜炎病例总数有所下降,但Māori仍然是人口最多的国家。新西兰脑膜炎基金会主席杰拉尔·拉什顿说,自2023年以来,看

    2025年08月26日
    0
  • 数以万计的失业英国人每年从纳税人手中获取高达10亿英镑的资金

      新数据显示,成千上万假装独自生活的失业英国人每年骗取纳税人10亿英镑。住在一起的夫妇,无论他们是否结婚,都要对他们的共同收入进行评估,以确定他们有权获得哪些福利。欺诈者假装独自生活,实际上是同居,这样他们就能获得更高的福利。在过去的四年里,单身人士谎报自己的生活状况已经让英国

    2025年08月26日
    0
  • 柯特·柯本在西雅图的住所现状如何?

      1994年1月,科特·科本(KurtCobain)在西雅图购置了一栋美丽的房子,计划与妻子、“霍尔”乐队(Hole)的主唱考特尼·洛芙(CourtneyLove)及他们的小女儿弗朗西丝(Frances)共同生活。作为先锋摇滚乐队“涅槃”(Nirvana)

    2025年08月26日
    0
  • 探究英超第三套球衣耐克标志颠倒的原因

    眼尖的英超球迷注意到,本赛季2024-25赛季的一些球衣发生了重大变化,这些球衣是由耐克制造的。利物浦、切尔西和托特纳姆热刺等球队的球衣上都有一个垂直的耐克标志,而不是通常出现在他们球衣上的传统水平标志。上周日,利物浦在老特拉福德球场3-0战胜曼联

    2025年08月26日
    0
  • 因将婴儿放入婴儿车,母亲被控扰乱公共秩序

      PA媒体一位带着孩子去参加暴乱的母亲被法官告知她“被误导、天真和不成熟”。7月31日,21岁的尼维·史密斯(NeveySmith)住在奥尔德姆西街,她推着自己20个月大的儿子在曼彻斯特牛顿希思假日酒店外加入了一群暴徒。史密斯曾向试图维持治安的警察泼水,他承认自己制造了暴力骚乱,

    2025年08月26日
    0
  • 浦那法院对马哈拉施特拉邦IAS缓刑犯Puja Khedkar的母亲Manorama实施司法拘留

    据PTI报道,周一,马哈拉施特拉邦浦那法院将IAS缓刑犯PujaKhedkar的母亲ManoramaKhedkar司法拘留。她因涉嫌在土地纠纷中用枪威胁一些人而被捕。据印度报业托拉斯报道,周一警方拘留结束后,

    2025年08月26日
    0
  • 数千名支持巴勒斯坦的示威者在民主党全国代表大会附近集会

      抗议者聚集在大会举办地联合中心附近的联合公园。当他们在广场附近游行时,禁止他们直接聚集在广场前。抗议者高呼不同的口号,举着标语,要求停止对以色列的支持。许多抗议者对特朗普和哈里斯都表示不满,称他们宁愿不参加即

    2025年08月26日
    0

发表回复

本站作者后才能评论

评论列表(4条)

  • 乔克尔
    乔克尔 2025年08月15日

    我是藏机图的签约作者“乔克尔”!

  • 乔克尔
    乔克尔 2025年08月15日

    希望本篇文章《社交机器人面临人工智能模型检测的挑战与新问题》能对你有所帮助!

  • 乔克尔
    乔克尔 2025年08月15日

    本站[藏机图]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 乔克尔
    乔克尔 2025年08月15日

    本文概览:2022年对推特的一项外部研究估计,社交媒体网站上三分之一到三分之二的账户是机器人。这些充斥社交媒体的机器人中,有许多被派去播下政治两极分化、仇恨、错误信息、...

    联系我们

    邮件:藏机图@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们