您的位置:首页 >生活 >

研究探索了非裔英语使用者如何调整自己的讲话以便于语音技术理解

导读 与语音技术(例如亚马逊的 Alexa、苹果的 Siri 和 Google Assistant)的互动可以提高效率和生产力,让生活变得更轻松。然而,在互动过程...

与语音技术(例如亚马逊的 Alexa、苹果的 Siri 和 Google Assistant)的互动可以提高效率和生产力,让生活变得更轻松。然而,在互动过程中,生成和理解语音的错误很常见。使用这些设备时,说话者通常会将他们的语音风格从正常模式转变为更响亮、更慢的语调,这被称为技术引导语音。

技术导向语音研究通常侧重于美国英语的主流变体,而不考虑更经常被技术误解的说话者群体。在由 AIP Publishing 代表美国声学学会发表的《JASA Express Letters》中,来自 Google Research、加州大学戴维斯分校和斯坦福大学的研究人员希望填补这一空白。

语音技术常常误解的一个群体是讲非裔美国英语(AAE)的人。由于 AAE 使用者的自动语音识别错误率可能更高,因此技术中的语言歧视可能会产生后续影响。

“在所有自动语音识别系统中,黑人男性说的每 10 个单词中就有 4 个被错误转录,”合著者 Zion Mengesha 表示。“这影响了每个使用语音技术的机构(包括医疗保健和就业)对非裔美国英语使用者的公平性。”

“通过与黑人用户交谈并了解他们在使用语音技术时的情感、行为和语言反应,我们看到了更好地理解这个问题的机会,”合著者考特尼·赫尔德雷斯说。

该团队设计了一项实验,以测试 AAE 说话者在想象与语音助手交谈时如何调整自己的言语,与与朋友、家人或陌生人交谈相比。该研究通过比较语速和音调变化,测试了熟悉的人、陌生的人和语音助手指导的言语条件。研究参与者包括 19 名认为自己是黑人或非裔美国人的成年人,他们在语音技术方面遇到过问题。每位参与者都向语音助手提出了一系列问题。同样的问题被重复,就像在与熟人交谈一样,再次与陌生人交谈。每个问题都被记录下来,总共 153 条录音。

录音分析表明,与与另一个人交谈相比,说话者在与语音技术交谈时表现出两种一致的调整:语速较慢,音调变化较少(语音更单调)。

“这些发现表明,人们对于如何与技术对话有着自己的思维模式,”合著者米歇尔·科恩 (Michelle Cohn) 表示。“考虑到语音识别系统的差异,人们会采用一套‘模式’来更好地理解技术。”

语音技术还存在其他误解,例如第二语言使用者。研究人员希望扩大人机交互实验中探索的语言种类,并解决技术障碍,以便它能够支持所有想要使用它的人。

版权声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢您的支持与理解。
关键词: