科技食谱

Google创建的世界上最大的数据集

2016年,谷歌首次推出了一套机器学习数据集(Open Images)。谷歌最近推出了Open Images Dataset V5。

由于机器学习在学习时需要大量数据,因此Google在2018年发布了Open Data V4(Open Images v4)图像数据集.Open Image V4为900万张图像提供了标签和边界框。 Open Image v4是世界上最大的数据集,拥有150万个600类对象的边界框,有超过300,000个图像注释和注释注释。 Open Image Data Set v5是最新版本。

Open Image Data Set v5在350个类别中为对象实例提供了280万个细分掩码。与边界框不同,此分段掩码仅识别实体所在的位置。它是一个显示细分蒙版对象轮廓和细节空间放大的功能。最重要的是,它包含多种类别对象和插图,而不是过去的任何数据集。

掩模比手动绘图更有效,并且在交叉联盟(IoU)中具有84%的准确度。除了面具,谷歌还增加了640万个经过人工测试的新图像级标签,产生了近20,000个类别和3650万个标签。它还提高了物体检测模型的准确性,包括提高600个测试和测试集类别中的锡密度。欲了解更多信息,请点击这里