科技食谱

语音识别算法无法理解更多黑色声音

语音识别算法现在已成为日常生活的一部分,因为它们被用于各种设备和应用程序中,例如智能扬声器和智能手机。但是,在使用苹果,亚马逊,谷歌,IBM和微软推出的语音识别算法的实验中,据说存在一个问题,即与白语音相比,语音识别算法不能很好地识别黑指甲。

语音识别算法用于各种应用程序中,例如智能助手操作,语音输入和文本服务。语音识别系统使用机器学习算法,并针对开发人员准备的语音数据和文本数据训练机器学习算法。

为了研究这些语音识别算法的准确性,斯坦福大学的研究小组进行了一项实验,其中在苹果,亚马逊,谷歌,IBM和Microsoft的语音识别算法中,被授权人员所说的语音被转换为文本。实验中使用的声音长19.8小时,由42位白人和73位黑人所说的2,141条声音组成。另外,说话的人中有44%是男性,平均年龄为45岁。

实验的结果是,两家公司的语音识别算法平均误解了白人说出的单词的19%,但黑人说出的单词的比率为35%。此外,错误率是所有黑人男性的41%和黑人女性的30%。

在任何语音识别算法中,黑色部分的错误率都超过白色部分。就苹果公司的语音识别算法而言,错误率最高,黑人为45%,白人为23%。表现最佳的微软公司,黑人的错误率为27%,白人的错误率为15%。

研究小组发现结果并非特定于特定公司,并且所有五个结果都显示出相似的模式。过去,有报告称算法和软件中存在种族偏见。在某些情况下,Google相册将黑人识别为大猩猩,并对其进行了标记,并且在没有种族相关数据的医疗系统中对黑人进行了不平等的评估。

此问题很可能是由于训练机器学习算法的数据集中存在偏差所致。用于训练的数据本身包含丰富的白色说话者语音,如果不包括黑色说话者语音,语音识别算法将无法很好地学习黑色说话者的口音或语调,并且错误率会增加。研究小组指出,这表明开发人员需要使用更多种类的数据来训练语音识别算法。

关于这一结果,谷歌表示,公平是谷歌AI的基本原则之一,并且它多年来一直致力于提高语音识别算法的准确性,并将在未来继续发展。 IBM表示将继续开发,改善和改善自然语言和语音处理能力,并努力通过IBM Watson来提高用户能力水平。亚马逊正在其网页上提供有关其是否正在不断改进其语音识别算法的解释。相关信息可以在这里找到。

lswcap

lswcap

通过每月的AHC PC和HowPC杂志时代,他在网络IT媒体上观看了“技术时代”,如ZDNet,电子报互联网经理,Consumer Journal Ivers的编辑,TechHolic出版商和Venture Square的编辑。 我很好奇这个仍然充满活力的市场。

Add comment

Follow us

Don't be shy, get in touch. We love meeting interesting people and making new friends.

Most discussed

%d 블로거가 이것을 좋아합니다: