大家好,我是鲁工。

前段时间,谷歌发布的图像生成与图像编辑模型Nano banana成为了AI圈的顶流,一时间各类玩法刷爆社媒。

原以为Nano banana会在很长一段内没有竞争对手,但没想到,不到两周的时间,字节就搞出了与之匹敌的Seedream-4.0模型,全方位对标谷歌的Gemini图像模型系列和产品。

除了Seedream-4.0对标Nano banana之外,基于该模型驱动的故事书和连环画功能也直接对标Gemini的Storybook。

基于前段时间Nano banana的几个测试例子,我对比测了一下Seedream-4.0在这些例子上的表现。

1.人物变装或场景变换

提示词这块没有限定,根据需要进行表达即可。比如下图的提示词示例为:

图1-2:Give the figure in the picture a decent, pretty floral dress.

图2-3:Change the scene to the park.

Seedream-4.0:

Nano banana:

图片

效果上几乎不分上下,但我感觉Nano整体观感上略胜一筹,Seedream-4.0在场景变换后人物脸部有那么稍微一点崩坏。

2.多图参考与融合

提示词:

The figures of Figures 1 and 2 sit together on the sofa in Figure 3.

图片

Seedream-4.0:

Nano banana:

图片

这个例子有点意思,Seedream-4.0生成的人物保持了一定的距离,而Nano则显得两人亲密无间。但Seedream-4.0的缺陷还是在于,人物面部有轻微崩坏。

3.老照片修复

提示词:

修复这张照片。

Seedream-4.0:

Nano banana:

图片

这个例子我感觉Seedream-4.0的修复效果更好一点,光影效果看起来更真实,也更有年代感一些,并且人脸也没有出现之前的崩坏情况。

4.发型设计9宫格

提示词:

Design 9 different hairstyles for the character in the picture, show close-ups of the character with each hairstyle, and output in a single 9-grid image.

图片

Seedream-4.0:

Nano banana:

图片

都是九宫格,都大概整了9种发型,但是Seedream-4.0的人脸又崩了。

5.与名人合照

提示词模板与示例:

模板:Design a photo of this image character with [人物] at the [地点].

示例:Design a photo of this image character with Kobe Bryant at the Lakers home arena.

Seedream-4.0:

Nano banana:

图片

两张图都有着明显的P图感,并且Seedream-4.0看起来画面还有点粗糙。

6.信息图

创建指定对象的信息图,比如小昆虫之类的,可以拿来做科普。

提示词:

Generate an infographic of [指定对象].

Seedream-4.0:

Nano banana:

图片

两种效果各有特色,但整体来看还是Nano更好一点。

7.Lovart图文笔记

在Lovart中使用图像模型生成超详细的图文笔记,可以视为信息图的一种高端玩法,这个也是这两天除了手办之外,Nano最流行的玩法。目前Lovart上Nano banana和Seedream-4.0都可以支持,所以最强的图像生成的模型,配上最强的设计AI,碰撞出的火花也无可比拟。

提示词来自赛博禅心:

你需要生成一个长笔记,给中国的中学生解释清楚一件事情:

{主题}

这个长笔记的背景风格为笔记本/手账,适合手机阅读

笔记中的文字,都是中文

笔记主体文字为 36px,图片宽度为 1080px,清晰易读

你还会用 nano-banana(seedream-4.0)画一些图片,放在笔记中,便于读者更好的理解内容,风格统一

你的图片为手绘风格插图,彩色粗铅笔,信息量丰富,图中文字均为英文,纯色背景

你需要生成这个笔记,来解释后面的内容;对于重点内容要加粗;你的配色非常合理且好看

以下为你要生成的内容

{内容和图片描述}

请生成这个笔记,并在最后给出信息“这篇文章,完全由 lovart & nano-banana 生成,带来直观的信息表达”

Seedream-4.0:

Nano banana:

图片

在这个任务上,Seedream-4.0跟Nano banana没法比,并且图片中的文字也崩的彻底。

8.眼镜试戴

这个跟穿戴有点类似,我们可以选择不同型号的眼镜镜框,然后把图片和人物照片喂给香蕉即可。提示词没有固定写法,一个参考示例如下:

Based on the profile photo, try fitting him with four different styles of glasses and output the results as a four-panel collage.

Seedream-4.0:

Nano-banana:

图片

这个任务Seedream-4.0给的眼镜款式稍微有点抽象,比起Nano来还是差了一些。

9.旅游打卡

可以利用Nano生成任意人物在著名景点、或者上传一张人物图和一张经典图,让Nano生成旅游打卡图。

提示词示例:

A photo of the girl visiting the Great Wall of Beijing.

Seedream-4.0:

Nano-banana:

图片

Seedream-4.0的P图感太重,感觉就是人物和背景的简单拼接,相反Nano就更贴合旅游打卡照。

10.制作vscode风格的json代码卡片

提示词示例:

A close-up shot of a hand holding a business card designed to look like a JSON file opened in VS Code. The card shows code formatted in realistic syntax-highlighted JSON code. The window includes typical toolbar icons and a title bar labeled Business Card.json, styled exactly like the interface of VS Code. Background is slightly blurred, keeping the focus on the card. The card displays the following code formatted in JSON: 

{ "name": "Louwill", "title": "Algorithm Engineer", "email": "louwill2023@email.com", "link": "louwill.com" }

Seedream-4.0:

Nano-banana:

这个例子,两个模型的表现都不太好。有意思的是,这个例子用GPT-4o图像生成反而效果更佳,感兴趣的朋友去试一试。

11.春联生成

提示词:

创作一幅春联书法,上联是:智海扬帆参数万亿汇成新气象,下联是:龙年献瑞算力千钧赋能大文章,要求排版整洁,书写正确,体现书法之美。

Seedream-4.0:

Nano-banana:

中文汉字类任务确实是Seedream-4.0的强项,相比之下,Nano banana目前无法用于带汉字生成的任务。

12.经典手办

这个是之前全网最火的玩法,打开小红书全都是这个。最早的玩法版本应该来自于藏师傅。

提示词:

Please turn this photo into a figure.

Behind it, there should be a partially transparent plastic paper box with the character from this photo printed on it. In front of the box, on a round plastic base, place the figure version of the photo I gave you. I'd like the PVC material to be clearly represented. It would be even better if the background is indoors.

Using the nano-banana model, a 1/7 scale commercial figurine of the character in the picture was drawn, in a realistic style and in a real environment. The figurine was placed on a computer desk with a round transparent acrylic base with no text on it. The content on the computer screen was the brush modeling process of the figurine, and next to the computer screen was a BANDAl-style toy box with the original painting printed on it.

Seedream-4.0:

Nano-banana:

图片

Seedream-4.0虽然能完整复现,但整体视觉效果还是比Nano看着要差一点,显得精细度不够。

全部12个例子,只有老照片修复和春联生成这两个任务,Seedream-4.0是强于Nano banana的。在大多数涉及人物和人脸的任务上,Seedream-4.0都不如Nano,并且人脸容易出现崩坏。当然,可能我测试的还远不全面,从社交媒体上的各方测试来看,Seedream-4.0也确实表现出了强大的图像生成与编辑能力。

所以,总结来看,如果涉及中文汉字类的图像生成,可以用Seedream-4.0,这个是先天优势。但在其他生成任务上,能用Nano就用Nano。

但是我们也需要看到的是,Seedream-4.0代表了国内图像生成与图像编辑模型与国外最先进模型之间的差距在缩小。相信随着时间的推移,Seedream-4.0也会逐渐修复上述缺陷。

感谢您阅读我的文章。我是鲁工,八年AI算法老兵,目前正在全面拥抱大模型和AIGC,。感兴趣的小伙伴可以加我微信(louwill_)交个朋友。

图片

>/ 作者:louwill

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐