在《机器人与人工智能前沿探索》的最新研究成果中,科学家们揭示了一个引人注目的现象:那些能够即时展现情感的机器人,不仅更受人们的喜爱,还被视为更加可靠,它们仿佛桥梁,拉近了人与机器之间的距离,使得人机交互体验更加贴近人性的温暖。这一发现,依托于尖端的人工智能技术,深刻揭示了情感表达在机器人与人类互动中的核心价值,为未来机器人技术的发展描绘了一幅充满情感色彩的新蓝图。
该研究的兴起,源自社交机器人日益融入人类生活的各个角落。从温馨的家庭到专业的医疗机构,机器人的身影无处不在,而它们理解并回应人类情感的能力,成为了构建和谐人机关系、建立信任及促进顺畅交流的关键。正如识别他人的面部表情,并以恰当的情感反馈回应,是人际交往中的基本礼仪,对于机器人而言,这一能力的掌握同样至关重要。
过往研究已证实,具备情感表达能力的机器人更容易获得用户的青睐。然而,如何在实时互动中精准捕捉并表达情绪,仍是摆在科研人员面前的一大难题。为此,研究者们将目光投向了GPT-3.5等大型语言模型,探索其在人机交互中激发情感反应的潜力。
随着轻量级大型语言模型(LLM)的飞速发展,构建下一代通用机器人的梦想正逐步照进现实。众多企业纷纷推出原型机,预示着社会对这类机器人的强烈需求。“我们正站在一个新时代的门槛上,机器人不仅需要智能,更需要情感。”研究的主导者,来自马克斯·普朗克心理语言学研究所多模态语言学系的博士后研究员Chinmaya Mishra如是说。
在机器人日益成为社会不可或缺一员的今天,赋予它们情感行为显得尤为迫切。一个能够恰当展示情感的机器人,不仅易于理解,更能通过有效沟通加深与人类的联系,从而提升整体互动体验。
然而,要在机器人上模拟情感行为,绝非易事。它要求机器人具备感知人类行为、理解传递的信息、制定合适反应,并准确表达相应情感的能力。尤其是在实时环境中实现这一目标,对于实现无缝人机交互(HRI)至关重要。
Mishra分享了他的研究动机:“我对此课题的兴趣源于两方面:一是探索LLM的潜力,验证其是否能帮助解决这些难题;二是希望从依赖特定平台和计算密集型模型,转向开发适用于任何社交机器人平台的云端架构。”
在这项涉及47名参与者的研究中,参与者与著名的Furhat机器人共同参与了一个独特的情感图像分类游戏,旨在检验机器人的情感表达能力。Furhat机器人以其仿人类头部和丰富的面部表情著称,通过背部投影的面部动画,能够生动展现多种情绪。
Mishra及其团队发现,当机器人的情绪表达与对话内容相契合时,参与者对互动体验的评价更为积极,相比之下,机器人表情不一致或缺乏情绪表达时,参与者的满意度明显降低。
具体而言,在情绪一致的条件下,参与者感受到的互动更为积极,情感上更为贴切,且认为机器人的行为更加人性化。这表明,机器人非言语线索与其互动情感背景的一致性,对于人类如何感知和与机器人互动具有决定性影响。
更为有趣的是,研究还发现,情绪的一致性不仅改善了参与者对机器人的看法,还对他们的任务表现产生了积极影响。在相同条件下,与情绪表达一致的机器人互动时,参与者在排名游戏中取得了更高的分数,凸显了情感表达机器人在协作任务中的实际效用。
Mishra向PsyPost透露:“LLM能够可靠地评估对话背景,并确定机器人在互动中应表达的适宜情绪。”机器人的情绪表达被视为有意为之,恰当的情绪对人与机器人的互动体验和结果均产生了积极影响。这些情绪是机器人在互动中即时生成的,使得人们更容易理解并与之交流,因为机器人通过这些情绪传达了它们的内部状态和意图。
然而,值得注意的是,机器人理解情境并作出适当情绪表达的决策过程,完全取决于开发者/研究者的架构设计。为了模拟机器人的真实行为,我们不得不将复杂的人类行为简化为可操作的部分。尽管这些简化后的模型看似合理且有效,但在真正创造出拥有与人类相似能力的机器人之前,我们仍有很长的路要走。
研究还深入探讨了参与者如何解读机器人的情绪表达,尤其是在情绪不一致的情况下。部分参与者将复杂的情绪状态赋予了机器人,这表明他们倾向于将机器人行为拟人化,并对其表情进行更深层次的解读。这一发现揭示了人类在互动中寻求情感连贯性的本能,甚至会根据机器人的面部表情,将类似人类的情感复杂性归因于机器人。
“参与者将复杂的情绪与机器人的行为相联系,这令人惊讶。”Mishra表示。例如,在一个实验中,机器人被指示表现出矛盾的行为,在描述悲伤情境时却面带微笑。参与者认为,机器人可能悲伤至极,以至于用笑容来掩饰。他们说,这也是他们在类似情境下的反应。在另一个案例中,参与者将机器人的微笑解读为讽刺。
这再次证明了机器人情感表达的强大力量,“即使人们知道他们正在与机器人交流,他们仍然会将其当作真实的人来对待。”Mishra对PsyPost说。此外,这也揭示了我们的大脑在互动过程中是如何解读情感的。
尽管研究结果充满希望,但研究过程中也遇到了一些挑战。技术问题,如API调用延迟导致的机器人响应时间延长,以及GPT-3.5在情绪预测时无法考虑更长会话历史的问题,都是亟待解决的难题。此外,本研究仅聚焦于基本情绪类别,可能忽略了人类情绪表达的细腻差异。
Mishra解释道:“当前研究的一个主要局限在于使用了纯文本模式。”人类情绪是多模态的,涉及面部表情、言语、手势、体态和上下文等多种行为的展示和解读。他相信,随着多模态LLM的引入和发展,这些问题将在不久的将来得到解决。
另一个需要关注的问题是对OpenAI等LLM API提供商的依赖。目前,市场上缺乏可与商业LLM API相媲美的公开访问LLM API,这限制了相关研究的开展和应用,仅使少数能够承担费用的团体/个人得以涉足。
未来的研究可以进一步探索能够整合更广泛情绪和多模式输入(包括面部表情和肢体语言)的复杂模型,以在人与机器人之间建立更加细致、有效的情感互动。
“长远来看,我希望通过增强机器人的多模式性,来优化其情感行为模型。”Mishra展望道。这将使机器人在人机交互过程中更加人性化,更加适应人类的需求。

联系方式
QQ:1624000000 邮箱:1624000000@qq.com 微信16538900008 电话:16538900008
转载请注明:麦朵芯-经典域名热荐网 » 科技前沿 » 情感共鸣:开启人机交互新纪元
版权声明
本文仅代表作者观点,不代表本网站立场。
本文系作者授权本网站发表,未经许可,不得转载。
发表评论