比较机器情感识别和人类基准

发布的 Annelies Querner-Verkerk 在2013年9月6日星期五- 3分钟阅读

我们的情绪在面部表情中表现得很明显。正因为如此，面部表情可以用于各种各样的研究(例如，识别顾客对产品的反应)。它已经成为消费者研究和人机交互等领域的重要组成部分。FaceReader一个自动化工具的例子是用于面部表情分析．它为研究人员提供了一种基于面部关键点的客观评估。

为什么要做这个研究?

机器情感识别仍然是一个相当新的领域。在这项研究中，Jansen等人选择了以人类表现为基准的机器情感识别。他们选择这样做有四个原因。

首先，人类能够以一种容易理解的方式识别和报告他们看到的情绪。此外，人工智能的其他用途也以人类的表现为基准。第三，当涉及到智力任务时，人类被认为是优越的。最后，衡量人工智能应用是否成功的标准是它们是否能够击败人类的表现。

情感识别可以采用多种不同的方法，包括基于视觉的，基于音频的和基于生理学的。在这个实验中，研究人员注意到，他们没有发现任何一个实验将这三种类型结合起来创建一个多模态实验。这可能是由于即使在单模态实验中情感识别也很困难。

结合模式是情感研究领域向前迈出的一步。为了建立一个基本的基准，Janssen等人收集了结合信号的三种形式(语音、视觉和生理)的数据。

免费白皮书: 如何建设一个观察实验室

你想了解更多如何建立一个观察实验室吗?往下读，找到完美的提示和技巧!

这个实验分为三个部分。第一部分通过一系列测试收集数据，其中包括测量参与者回忆生活中某些事件时的情绪强度。总的来说，中性条件的情绪强度比其他条件要低。

然而，在其他条件下，他们之间的情绪强度没有显示出显著的差异。这些条件(快乐、放松、悲伤、愤怒和中性)在其他方面确实有所不同。在快乐和放松的条件下，效价更高，而在悲伤和愤怒的条件下，效价更低。

愤怒的状态最终有最高的唤醒水平。此外，快乐和悲伤的条件下的唤醒水平都高于中性和放松的条件。

实验的第二部分实际上是两个独立的实验，一个用荷兰语，另一个用美式英语。在这两项测试中，参与者都观看了第一部分的录音，并描述了他们想象中的参与者的感受。

第一个实验使用了说美式英语的人来消除语言结构的影响，因为计算机中的算法没有使用这种信息。他们可以仅根据说话者所表现出的情绪来评价他们的情绪。

荷兰的这项研究是为了观察当语义信息也可用时，情绪识别任务是如何进行的。对于说英语的人来说，最好的情绪识别表现出现在同时播放视频和音频的时候，而不是只播放两者中的一种。

然而，对于荷兰人来说，语境和音频条件产生了最好的情感识别。

最后，实验的第三部分是机器情绪识别测试。机器根据收集到的数据进行训练，并进行测试，看看它们的表现如何。这些数据来自第一部分中测量的视频、音频和生理模式。

研究人员正在测试机器是否能将所展示的情绪分为五类。当结合视频和音频时，机器表现最好，尽管单独视频紧随其后。单独的音频效果并不好。当添加生理指标时，分类性能为76%。

当我们将人类和机器的结果进行比较时，我们可以看到机器实际上表现得更好。当使用视频和音频时，机器的成功率为65%，而人类只有31%。这表明使用机器可以用于面部表情分析。

有了这些信息，像FaceReader这样的工具就可以在基于视觉的情感识别中变得很有价值。它有助于客观地自动化情感研究。表情分析软件通过对面部表情的无偏分析，使人机交互研究更加简单、高效。

免费白皮书: FaceReader方法

下载免费的FaceReader方法论笔记，了解更多面部表情分析理论。

参考文献

FaceReader诺达bwin必赢登录入口斯信息技术公司
詹森,J.H.;Tacken p;弗里斯，J.J.G.德;布鲁克，E.L.范登;Westerink J.H.D.M.;Haselage p;IJsselsteijn, W.A.(2013)。机器在识别自传体回忆引发的情绪方面比普通人表现得更好。人机交互，28, 479 - 517。

不要错过最新的博客文章

分享这篇文章

主题

学习
更多的