使用人工智能的图像识别模型旨在准确识别照片或图像中反映的物体。它旨在应用于各种领域,例如自动驾驶汽车。例如,在自动驾驶汽车中,图像识别模型的物体识别精度直接关系到自动驾驶汽车的安全性,因此用于模型学习的数据集起着重要的作用。麻省理工学院和IBM的研究人员团队创建了ObjectNet,ObjectNet是包含各种对象的图像识别模型的数据集。
ObjectNet是图像识别模型的数据集。它不包括用于训练图像识别模型的训练集,而是由用于验证模型准确性的测试集组成。包含的图像测试集数量为50,000,与ImageNet相同。
ImageNet是一个数据集,其中包含通过照片共享服务(例如Flickr)收集的图像。但是,ObjectNet是一个数据集,用于组织委托自由摄影师付费拍摄的照片数据。这是一组图像,似乎很难通过故意将对象倾斜到侧面,从通常不会拍摄的怪异角度拍摄或故意在肮脏的房间拍摄来识别图像。
ObjectNet包含人类可能难以判断的图片,例如放在脏房间里的椅子和椅子背面的图片。图像识别模型使用数据集通过深度学习提高图像识别的准确性。但是,即使在像ImageNet这样的海量数据集中,也存在一个盲点,即其中包含的图像中没有诸如椅子靠背或倒下椅子之类的图像。因此,当发生诸如椅子的靠背或倒下的椅子之类的不规则情况时,从现有的数据集(如ImageNet)学习的图像识别模型无法准确地识别图像。
而且,与其他数据集不同,ObjectNet不包含训练集。大多数数据集都有一组单独的测试,用于学习模型和验证准确性。然而,由于这两者具有高度相似性,因此据说在某些情况下无法进行精确的验证。
实际上,通过在ImageNet和ObjectNet上进行图像识别测试的结果,ImageNet成功地以高达97%的精度识别图像,但是ObjectNet降低到了50-55%。这意味着图像识别模型(例如对象的背面)无法准确识别,并且图像识别模型体系结构不包含识别对象的背面或机灵角度的概念。在这方面,图像识别模型需要更智能的算法。
专家说,如果您想知道该算法在现实世界中的运行状况,则应该使用似乎没有偏见且从未见过的图像测试图像识别模型。相关信息可以在这里找到。