OpenAI 发布 GPT Image API：支持文生图/图生图/局部重绘/透明背景

模型集成了文生图、通用控制（支持线条、姿势、深度等多种 ControlNet）和遮罩修图等功能。腾讯混元 3D[3] v2.5 版本正式发布，模型总参数量从 1B 大幅提升至 10B，有效几何分辨率达到 1024，新增支持高清纹理和凹凸贴图功能。不过这个版本暂未开源。不过要注意的是，这个接口必须通过OpenAI 的 API Organization 认证才能访问。佬们可以前往官网体验，每天有 20

三花AI

411人浏览 · 2025-04-24 10:39:07

三花AI · 2025-04-24 10:39:07 发布

OpenAI 发布 GPT Image API：支持文生图/图生图/局部重绘/透明背景

OpenAI 正式发布 GPT Image API[1] (模型 ID: gpt-image-1)，支持以下功能：

文生图
图生图
局部重绘
透明背景输出

官方还同步发布了详细的使用指南文档[2]。不过要注意的是，这个接口必须通过OpenAI 的 API Organization 认证才能访问。

定价方面采用输入输出 token 计费模式。如图所示, 高质量模式下生成 10 张图的成本非常的贵。

腾讯混元 3D v2.5：参数量提升10倍至10B，分辨率达1024

腾讯混元 3D[3] v2.5 版本正式发布，模型总参数量从 1B 大幅提升至 10B，有效几何分辨率达到 1024，新增支持高清纹理和凹凸贴图功能。不过这个版本暂未开源。

佬们可以前往官网体验，每天有 20 次免费使用机会，也可以通过腾讯云 API 接入服务。

Flex.2-preview 发布：8B 参数开源生图模型

Flex.2-preview[4] 现已发布！模型集成了文生图、通用控制（支持线条、姿势、深度等多种 ControlNet）和遮罩修图等功能。还可以通过 AI-Toolkit 进行个性化微调，完全开源可商用（Apache 2.0 许可证）。

Bad Apple AI 版

由大佬 @SwayStar123 使用 AI 制作的 Bad Apple，佬们可以看看。

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

cover

CLONE——面向长时任务的闭环VR全身遥操：其MoE架构可实现“蹲着走”，且LiDAR里程计解决位置偏差，更增强AMASS数据集

基于C#winform使用openvino部署PP-OCRv5的onnx模型paddleocrv5模型部署

本教程将指导您如何使用OpenVINO在C# WinForm项目中部署PP-OCRv5模型。

cover

AISHELL-5 全球首套智能驾舱中文语音交互数据集开源

所有评论(0)

查看更多评论

三花AI

@weixin_51674085

已为社区贡献9条内容