科技食谱

利用AI语句生成技术成功地自动生成图像

由研究人工智能的非营利组织OpenAI开发的AI句子创建机器GPT-2能够自动生成高精度句子,因此开发团队对它过于危险表示关注,并发布了纸张被延迟。 。但是,正在开发一种通过直接应用用于GPT-2学习的体系结构自动生成图像的技术。

将在特定领域训练的模型转移到另一个领域的技术称为转移学习。 GPT-2在这种转移学习模型上取得了巨大的成功。除了GPT-2(无需人工干预即可生成句子)外,它在Google BERT和Facebook RoBERTa方面也取得了重大进展。另一方面,在自然语言领域,转移学习模型的成功令人惊讶,但是直到现在,还没有从图像创建转移学习模型的强大功能。

OpenAI已尝试使用转移学习模型(例如GPT-2)和成品的新样本来训练像素序列与图像一致。这是一种技术,其中模型仅通过人工提供一半的图像就可以完成图像。

OpenAI在ImageNet上训练了三个版本的GPT-2模型:具有7600万个参数的iGPT-S,具有4.55亿个参数的iGPT-M和具有14亿个参数的iGPT-L。同时,使用ImageNet和Internet图像对具有68亿参数的iGPT-XL进行了培训。每个模型都降低了图像分辨率,创建了一个代表像素的独特9位调色板,并生成了比标准RGB光谱标准短三倍的输入序列,而又不影响准确性。

根据OpenAI,扩大了模型规模,并进行了更多的迭代训练以提高图像质量,从而在基准测试中获得了良好的结果。但是,iGPT模型有局限性,例如生成的图像质量低或训练数据有偏差,因此它充当概念验证演示。研究团队解释说,这些发现是弥合计算机视觉和语言理解能力之间差距的一个很小但重要的步骤。相关信息可以在这里找到。

lswcap

lswcap

通过每月的AHC PC和HowPC杂志时代,他在网络IT媒体上观看了“技术时代”,如ZDNet,电子报互联网经理,Consumer Journal Ivers的编辑,TechHolic出版商和Venture Square的编辑。 我很好奇这个仍然充满活力的市场。

Add comment

Follow us

Don't be shy, get in touch. We love meeting interesting people and making new friends.

Most discussed

%d 블로거가 이것을 좋아합니다: