复旦、人大等发布大五人格+MBTI测试 角色扮演AI特质还原率达82.8%

站长之家 2023-11-20 15:28:35新闻资讯
38

近期,由复旦大学和中国人民大学合作的Chat凉宫春日团队发布了一项关于AI角色扮演的研究。该研究强调了良好的人设还原度对于评价AI角色扮演的重要性,特质还原率高达82.8%。研究使用了大五人格的NEO-FFI问卷和MBTI的16Personalities测试,并通过LLM进行引导式开放式问答,全面测试了AI角色的人格。这一面谈式人格测试框架的提出,为评估角色扮演AI的人格特质提供了新的方法。

1.png

项目地址:https://github.com/LC1332/Chat-Haruhi-Suzumiya/tree/main/research/personality

随着大语言模型的发展,基于这些模型的角色扮演聊天机器人在全球范围内引起了广泛关注。相较于传统聊天机器人的繁琐工程,现今的大语言模型能够轻松构建具备不同身份、人格、记忆和语言习惯的角色扮演AI。然而,对于角色扮演AI的分析性研究仍然相当匮乏,尤其是在对它们的评估上。这项研究通过使用心理学的人格相关理论,从大五人格和MBTI等维度对角色扮演AI进行了人格测试,为这一领域的研究提供了新的视角。

研究者提出的面谈式人格测试框架通过开放式问答,使得角色扮演AI的评估更为全面。与传统的Likert Scale相比,这种框架能够更好地激发角色扮演AI的扮演行为,减少对底座LLM训练数据的影响。实验结果显示,现有的角色扮演AI在大五人格和MBTI测试上的还原率达到了82.8%。

研究者指出,这些结果仍受到底座LLM的先验影响,表现为在某些维度上的平均得分与底座模型较为一致。为了研究这一点,研究者比较了不同底座模型对角色扮演AI的影响,发现在某些维度上存在一致性,但在其他维度上并没有明显的相关关系。

综合而言,这项研究为评估AI角色扮演的人格特质提供了新的方法和视角,同时也揭示了在现有技术中存在的一些挑战和限制。未来,随着技术的不断发展,角色扮演AI的人格还原度和表现可能会得到进一步提升。

ai
THE END
战地网
频繁记录吧,生活的本意是开心

相关推荐

Whisper-NER:aiOla推出的开源AI音频转录模型,实时遮蔽敏感信息
Whisper-NER是aiOla基于OpenAI的开源语音识别模型Whisper开发的一款高级音频转录模型。它不仅继承了Whisper在多语言、实时处理及高准确度方面的卓越性能,还创新性地加入了敏...
2024-11-21 新闻资讯
113

Vue中异步函数async和await的使用方法详解
为了简化异步代码的编写和维护,JavaScript引入了async和await关键字,它们使得异步操作看起来更像是同步操作,从而提高了代码的可读性和可维护性。本文将深入探讨Vue中异步函...
2024-11-19 编程技术
109

AI、AIGC、AGI是什么意思?它们有什么区别?
人工智能(Artificial Intelligence,简称AI)、人工智能生成内容(Artificial Intelligence Generated Content,简称AIGC)和通用人工智能(Artificial General Intelligence,简...
2024-11-19 电脑知识
124

字节跳动推出PixelDance与Seaweed视频生成模型:可在即梦AI平台免费体验
近日,字节跳动宣布推出两款全新的视频生成模型——PixelDance和Seaweed,并通过其即梦AI平台向公众免费开放使用。这一举措旨在助力设计师、影视制作人员及动画创作者等专业人...
2024-11-18 新闻资讯
119

阿里通义推出“代码模式”:Qwen2.5-Coder开发,非程序猿也能轻松写代码!
阿里通义实验室今日宣布推出一项创新功能——“代码模式”,这一突破性工具使得即使没有编程背景的用户也能通过简单的日常语言指令快速生成各种应用程序。用户现在只需访问通...
2024-11-15 新闻资讯
125

宝塔安装青龙面板及配置Maiark短信登录图文教程
青龙面板则是一款自动化任务管理工具,可以帮助开发者自动化执行各种任务,提高开发效率。本文将详细介绍如何使用宝塔面板搭建青龙面板并配置Maiark短信登录的详细教程,帮助...
2024-11-15 编程技术
125