您的位置:首页 >访谈 >

可穿戴人工智能系统可以通过分析语音模式、生命体征来检测个人的情绪

麻省理工学院的科学家开发了一种新的人工智能,可穿戴系统,可以根据一个人的言语模式和生命体征来预测对话是快乐,悲伤还是中立。

美国麻省理工学院 (MIT) 研究生图卡·阿尔哈奈 (Tuka Alhanai) 说: “想象一下,在谈话结束时,你可以倒回它,看看你周围的人感到最焦虑的时刻。”Alhanai说: “我们的工作是朝着这个方向迈出的一步,这表明我们可能离人们口袋里有AI社交教练的世界不远。”

观看我们所有来自Express Technology的视频

当参与者讲故事时,该系统可以分析音频,文本转录和生理信号,以83% 的准确性确定故事的整体音调。使用深度学习技术,系统还可以为对话中的特定五秒钟间隔提供 “情感分数”。

Mohammad Ghassemi说: “据我们所知,这是第一个以被动但可靠的方式收集物理数据和语音数据的实验,即使受试者正在进行自然的,非结构化的互动。” 麻省理工学院博士候选人Alhanai说: “我们的结果表明,可以实时对对话的情感语调进行分类。”

研究人员说,通过让多个人在对话中使用智能手表,从而创建更多数据以供其算法分析,可以进一步提高系统的性能。该系统的开发非常考虑到隐私: 研究人员说,该算法在用户设备上本地运行,作为保护个人信息的一种方式。

许多情绪检测研究显示参与者 “快乐” 和 “悲伤” 的视频,或者要求他们人为地表现出特定的情绪状态。但是,为了激发更多的有机情绪,团队要求受试者讲述自己选择的快乐或悲伤故事。

受试者佩戴了一种研究设备,该设备可以捕获高分辨率的生理波形,以测量运动,心率,血压,血流和皮肤温度等特征。该系统还捕获了音频数据和文本成绩单,以分析说话者的音调,音调,能量和词汇。

在捕获了31个不同的对话 (每个对话几分钟) 之后,团队对数据进行了两种算法训练: 一种将对话的总体性质分类为快乐或悲伤,而另一种则将每次对话的每五秒块分类为积极,消极或中立。

“例如,该系统了解文本转录中的情绪如何比原始加速度计数据更抽象,” Alhanai说。

Alhanai说: “这是非常了不起的,一台机器可以近似我们人类如何感知这些相互作用,而没有我们作为研究人员的大量投入。”

相关推荐

猜你喜欢

特别关注