谷歌Imagen,人工智能对语言更加深入理解
在其解释中,谷歌将社会问题视为尚未让用户尝试的主要原因。谷歌表示,Imagen可以生成有害的,逼真的图像,因为所使用的数据集包含许多未被证明的单词,其中许多可能被认为是种族主义,贬损或其他有害的。据报道,Imagen可以创建比OpenAI的人工智能工具DALL-E2更逼真和逼真的图像,不过谷歌尚未公开Imagen,如图片所示,Imagen扩散模型可根据用户的书面提示输出绘图、油画、CGI渲染等。I
日前,谷歌宣布推出了一款新的AI系统Imagen,可以将文字描述转化为逼真的图像的人工智能技术。
震惊全网的DALL·E 2才新鲜出炉一个月,谷歌就派出名为Imagen的选手来打擂台。网友表示:DALL·E 2诞生一个月就过时了?
据报道,Imagen可以创建比OpenAI的人工智能工具DALL-E2更逼真和逼真的图像,不过谷歌尚未公开Imagen,如图片所示,Imagen扩散模型可根据用户的书面提示输出绘图、油画、CGI 渲染等。
人工智能图像生成并不是什么新鲜事儿,但谷歌最新的研究展示了自第一个人工智能驱动的图像生成器问世以来我们从未见过的进步,这就是Imagen。Imagen将文本转换为逼真的图像,完全由AI驱动,该AI可以理解大型单词库以及这些单词在视觉意义上的含义。
Google Imagen 官方网站还解释这种人工智能技术的工作原理,首先分析用户输入的文本并使用T5-XXL进行编码。嵌入在 AI 中的文本首先被转换为分辨率为64x64像素的小图像。Imagen进一步利用文本条件超分辨率扩散模型对图像进行64×64的上采样,然后这个图像继续增长并最终形成。
Imagen 的开发者谷歌研究的大脑团队表示,基于变压器和图像扩散模型,Imagen实现了前所未有的真实感。谷歌声称,对比其它模型,在图像保真度和图像-文本匹配方面,人类评估者更喜欢 Imagen。
但是,谷歌还没有公开这项技术。在其解释中,谷歌将社会问题视为尚未让用户尝试的主要原因。谷歌表示,Imagen可以生成有害的,逼真的图像,因为所使用的数据集包含许多未被证明的单词,其中许多可能被认为是种族主义,贬损或其他有害的。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)