科技食谱

Open AI开发的图像识别AI

Clip(CLIP)是由非盈利组织OpenAI新开发的图像识别AI,OpenAI开发的GPT-3是生成准确句子的AI,而DALLE是从句子生成图像的AI。我在解释。

在人类中,已知有神经元对各种类型的信息作出统一的响应,例如即使看女演员哈莉·贝瑞的照片或插图,神经元也对哈莉·贝瑞的文本做出响应。根据OpenAI,剪辑可以以与人类相同的方式处理各种类型的信息。

现有的将人脸识别为人脸的图像识别模型对人脸插图和文字均不响应。但是,该剪辑可以以相同方式处理蜘蛛侠角色扮演照片和插图,以及字符串蜘蛛侠。

剪辑还可以通过乘以其他图像特征来识别图像。例如,当识别存钱罐时,该夹子被认为是使经济与其他因素(例如娃娃和玩具)成倍增长。此外,剪辑还减去元素。例如,惊喜的表情可以通过祝福,拥抱,震惊和微笑的表情来识别,而亲密的表情可以通过疾病的表情和柔和的微笑结合在一起来识别。

Open AI还解释了剪辑的弱点。例如,标准贵宾犬的图像可以准确地识别为标准贵宾犬,但是如果在图像上放置多个$标记,它将被识别为存钱罐。另外,事实是该剪辑具有出色的笔迹识别性,例如在某些情况下,将粘贴在以iPad书写的纸张上的苹果识别为iPad。 Open AI将公开用于剪辑分析的工具,并将在未来通过继续进行与剪辑有关的研究来解决问题。相关信息可以在这里找到。

lswcap

lswcap

通过每月的AHC PC和HowPC杂志时代,他在网络IT媒体上观看了“技术时代”,如ZDNet,电子报互联网经理,Consumer Journal Ivers的编辑,TechHolic出版商和Venture Square的编辑。 我很好奇这个仍然充满活力的市场。

Add comment

Follow us

Don't be shy, get in touch. We love meeting interesting people and making new friends.

Most discussed

%d 블로거가 이것을 좋아합니다: