科技食谱

收集语音以创建每种语言的语音数据集

开发 Web 浏览器 Firefox 的 Mozilla 正在开发 Common Voice,这是一个为世界各地存在的每种语言创建语音数据的项目,以创建有助于开发语音识别软件(如 Siri 和 Alexa)的语音数据集。有。

在Common Voice中,您可以通过两种方式参与:朗读为标题提交的句子,以及聆听并确认已录制的声音。您可以创建一个帐户并做出贡献,在您的个人资料中输入您的用户名、年龄、性别等,并查看隐私政策和条款和条件。

Mozilla 在 2021 年 8 月又增加了 16 种常见的语音语言。 据 Mozilla 称,亚马逊 Alexa 和 Apple Siri 等语音技术是数百万讲非洲本土语言的人支持的结果,他们正在呼吁 Common Voice 参与。相关信息可以在这里找到。