Masakhane是一个开源项目,汇集了非洲AI研究人员和工程师,他们使用机器翻译来翻译非洲2,000多种不同的语言。
非洲大陆使用的语言包括英语,法语和阿拉伯语,但是自古以来非洲部落还使用许多其他语言。非洲大陆上有超过2,000种语言,由于其多样性,可能成为沟通或商业的障碍。
创立Masakane的南非AI研究人员是Jade Abbott和Laura Martinus。该项目正在与非洲各地的AI研究人员和数据科学家合作进行。他们在2019年的机器学习和自然语言处理会议上开会,讨论了将非洲语言转换为机器学习模型的项目,然后启动了Masakane。项目名称Masakane意味着我们在祖鲁语中在一起。
可以机器翻译成Masakane的语言包括尼日利亚Pidgin的英语和北非和中非使用的阿拉伯方言,以及非洲的各种母语。与欧洲语言不同,这些语言没有特定的基准和大型数据集。因此,Masakane计划开始与其他团体和语言学家合作以创建语言数据集。
如果可以使用多种非洲语言进行机器翻译,则有望为非洲人带来各种好处。 Masatee目前在整个非洲拥有大约60名开发商。南非,肯尼亚和尼日利亚有许多开发人员,参与者正在以其母语收集数据并进行模型训练。
例如,来自肯尼亚Ruhiya的工程师在与部落交谈时会说Ruhiya。但是,在肯尼亚,包括学校在内的公共场所都说英语。在日常生活中,每个部落都说不同的语言,造成了沟通上的鸿沟。使用机器学习翻译非洲语言可能会导致在非洲使用AI的增长,并促进非洲人在生活中使用AI的运动。 Masakane等整个非洲大陆的项目对于将非洲开发人员和研究人员的社区联系起来并实现长期合作至关重要。
语言差异是一个障碍,因此消除语言障碍可以使许多非洲人参与数字经济,最终参与AI经济。它说明,参与Masakane的人有责任允许那些无法参与数字社会的人参与AI。
根据GitHub在2019年发布的一份报告,肯尼亚和尼日利亚等非洲国家的开源项目参与者数量显着增加。非洲技术和开发者生态系统对硅谷公司也很有吸引力.2019年,Twitter的CEO Jack Doh和GitHub Nut Friedman的首席执行官陆续访问了非洲。
Masakane的参与者解释说,非洲开发人员社区正在迅速发展,并且非洲语言的机器翻译具有吸引力。 Masakane可能是将非洲开发商推向世界的立足点。通过Masakane,可以将英语文学翻译成各种非洲鲑鱼,从而可以培养许多才华。
此外,Masakane可以增强对语言之间结构差异的理解。这不仅意味着它为非洲人提供了各种机会,而且开发商参与Masakane的原因还指出,非洲人进行AI项目的成功可能会导致放松对非洲AI研究人员的限制。大多数与AI相关的主要会议都在欧洲,亚洲和北美举行,非洲研究人员与其他研究人员互动的机会有限。据说即使在西方国家,政府机构等受过教育的非洲人也拒绝接受非洲AI研究人员。
2019年12月,AI国际会议(NeurIPS)在加拿大温哥华举行,但非洲和亚洲研究人员报告称加拿大政府拒绝签发签证。即使消除了对非洲开发人员的偏见,成功领导非洲人进行AI项目也很重要。
此外,参加Masakane的非洲开发人员可以交流各种知识,以促进彼此的发展。相关信息可以在这里找到。
Add comment