谷歌Imagen，人工智能对语言更加深入理解

在其解释中，谷歌将社会问题视为尚未让用户尝试的主要原因。谷歌表示，Imagen可以生成有害的，逼真的图像，因为所使用的数据集包含许多未被证明的单词，其中许多可能被认为是种族主义，贬损或其他有害的。据报道，Imagen可以创建比OpenAI的人工智能工具DALL-E2更逼真和逼真的图像，不过谷歌尚未公开Imagen，如图片所示，Imagen扩散模型可根据用户的书面提示输出绘图、油画、CGI渲染等。I

海森大数据

647人浏览 · 2022-07-15 08:09:04

海森大数据 · 2022-07-15 08:09:04 发布

日前，谷歌宣布推出了一款新的AI系统Imagen，可以将文字描述转化为逼真的图像的人工智能技术。

震惊全网的DALL·E 2才新鲜出炉一个月，谷歌就派出名为Imagen的选手来打擂台。网友表示：DALL·E 2诞生一个月就过时了？

据报道，Imagen可以创建比OpenAI的人工智能工具DALL-E2更逼真和逼真的图像，不过谷歌尚未公开Imagen，如图片所示，Imagen扩散模型可根据用户的书面提示输出绘图、油画、CGI 渲染等。

人工智能图像生成并不是什么新鲜事儿，但谷歌最新的研究展示了自第一个人工智能驱动的图像生成器问世以来我们从未见过的进步，这就是Imagen。Imagen将文本转换为逼真的图像，完全由AI驱动，该AI可以理解大型单词库以及这些单词在视觉意义上的含义。

Google Imagen 官方网站还解释这种人工智能技术的工作原理，首先分析用户输入的文本并使用T5-XXL进行编码。嵌入在 AI 中的文本首先被转换为分辨率为64x64像素的小图像。Imagen进一步利用文本条件超分辨率扩散模型对图像进行64×64的上采样，然后这个图像继续增长并最终形成。

Imagen 的开发者谷歌研究的大脑团队表示，基于变压器和图像扩散模型，Imagen实现了前所未有的真实感。谷歌声称，对比其它模型，在图像保真度和图像-文本匹配方面，人类评估者更喜欢 Imagen。

但是，谷歌还没有公开这项技术。在其解释中，谷歌将社会问题视为尚未让用户尝试的主要原因。谷歌表示，Imagen可以生成有害的，逼真的图像，因为所使用的数据集包含许多未被证明的单词，其中许多可能被认为是种族主义，贬损或其他有害的。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

揭秘易开发核心功能：页面信息提取与无障碍服务配置详解

易开发（DeveloperHelper）是一款专为Android开发者打造的快速开发工具，核心功能包括界面分析、页面信息提取、加固脱壳等，完美支持Android 9.0系统。本文将深入解析其两大核心功能——**页面信息提取**与**无障碍服务配置**，帮助开发者快速掌握使用技巧，提升开发效率。## 一、无障碍服务：易开发的核心引擎 🚀无障碍服务是易开发实现界面分析的基础，通过系统级别的

魔乐社区

解决Rust版本管理难题：gh_mirrors/ru/rust-toolchain高级用法与实战案例

gh_mirrors/ru/rust-toolchain是一款简洁高效的GitHub Action工具，专为Rust开发者设计，能够快速安装和管理Rust工具链，解决多版本共存、环境配置复杂等常见问题，让Rust项目构建过程更加流畅。## 🚀 为什么选择gh_mirrors/ru/rust-toolchain？在Rust开发中，不同项目可能需要不同版本的Rust编译器，手动管理多个工具链

魔乐社区

如何使用IconGenerator快速创建符合Apple人机界面指南的应用图标

IconGenerator是一款专为macOS用户设计的免费应用图标生成工具，能够帮助开发者和设计师轻松创建符合Apple人机界面指南的各种尺寸应用图标。无论是iOS、macOS还是watchOS应用，只需简单几步，即可生成完整的图标套件，省去手动调整尺寸的繁琐过程。## 为什么选择IconGenerator？对于苹果生态开发者来说，制作应用图标往往是一项耗时的工作。Apple的人机界面指