OpenAI 发布 GPT Image API:支持文生图/图生图/局部重绘/透明背景

OpenAI 正式发布 GPT Image API[1] (模型 ID: gpt-image-1),支持以下功能:

  1. 文生图

  2. 图生图

  3. 局部重绘

  4. 透明背景输出

官方还同步发布了详细的使用指南文档[2]。不过要注意的是,这个接口必须通过OpenAI 的 API Organization 认证才能访问。

定价方面采用输入输出 token 计费模式。如图所示, 高质量模式下生成 10 张图的成本非常的贵。

腾讯混元 3D v2.5:参数量提升10倍至10B,分辨率达1024

腾讯混元 3D[3] v2.5 版本正式发布,模型总参数量从 1B 大幅提升至 10B,有效几何分辨率达到 1024,新增支持高清纹理和凹凸贴图功能。不过这个版本暂未开源。

佬们可以前往官网体验,每天有 20 次免费使用机会,也可以通过腾讯云 API 接入服务。

Flex.2-preview 发布:8B 参数开源生图模型

Flex.2-preview[4] 现已发布!模型集成了文生图、通用控制(支持线条、姿势、深度等多种 ControlNet)和遮罩修图等功能。还可以通过 AI-Toolkit 进行个性化微调,完全开源可商用(Apache 2.0 许可证)。

Bad Apple AI 版

由大佬 @SwayStar123 使用 AI 制作的 Bad Apple,佬们可以看看。

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐