本文探索更多关于MidJourney的用法,官网社区的热图往往偏向创意性或创造性,接着上一篇文章,笔者期望探索不同的Prompt和用法使用MidJourney创造更为实际的图片。

多照片合并设计

通过两张照片以及Prompt描述,将两张照片按照描述合成为预期的效果,比如笔者期望将一张Logo图片出现在另一张孩子的衣服上,实际效果并不如意。

is a logo printed on cloth of boy in and logo is located on the center of clothes,photographic,high detailed,3d rendering,avatar,bright light,spaceship background,F2.8 –iw 1.5

MidJourney在处理图片时无法完整处理原图,会根据原图的特点生成新的图片,且会受到原图的背景等影响,越是复杂的背景,越是无法完整呈现图片主体的内容。如上图,Logo图片在处理后生成了各种不同的Logo样式,但好在Logo确实按照Prompt中所描述出现在孩子衣服的胸口。

由此产生另一个想法,通过真人照片凭空在衣服上制造新的样式,比如在衣服胸口打一个特定的Logo:

is a boy model with white sweater,print a text logo of letter R on it with red color,avatar,3d rendering,high detailed –iw 1.8

上图中是在孩子衣服胸口打印一个R的文字Logo,并且将原来的衣服颜色更换为了白色。经过几番重新生成和选择,最终效果良好的图片如下:

传说中的神兽

一些文化中的动物是人们想象的,想象中的动物其实并不存在,笔者尝试在不直接使用动物名称的前提下,使用人们对动物描述的原文或者类似文字的Prompt描述来生成动物,看是否能够符合印象中动物的样子,比如龙、美人鱼。

龙在中国古代的描述中是这样的:

头如骆驼,角如鹿,眼如兔,耳如牛,颈如蛇,腹如蜃,鳞如鲤鱼,爪如鹰,掌如虎。

将上面的描述整理为Prompt之后生成图片,却相差甚远:

a animal which Head like a camel, horns like a deer, eyes like a rabbit, ears like a cow, neck like a snake, belly like a mirage, scales like a carp, claws like an eagle, palms like a tiger.3d rendering

即便简化描述,生成的图片也依然是更多现实中动物的模样,比如《美人鱼》电影中对美人鱼的描述,一半是人,一半是鱼,上半身是人,下半身是鱼。

an animal half body is human and the other half body is fish

显然,上面的Prompt在图片生成过程中只能根据关键词进行拼接生成,并无法产生我们想象中美人鱼的样子,即便将Prompt做进一步的细化描述:

beautiful Chinese girl with fish tail floating in the sea,she has long black hair and beautiful face,realistic,3d rendering,bright light

无论如何用朴素的语言描述美人鱼的样子,最终的成图都是女孩加鱼,而无法将人和鱼结合起来形成人鱼的样子,即便样子恐怖一些。

a beautiful Chinese girl with a big fish tail floating in the sea,full body,long black hair,beautiful face,realistic,3d rendering,high detailed,bright light

如果通过–no参数设置不允许出现脚和腿,那么成图是这样的:

A Chinese girl with a large fish tail floating on the sea, full body, long black hair, beautiful face, realistic, 3D rendering, high detail, bright light –s 750 –no feet,legs

如果再加上不允许出现鱼头,那么成图如下:

A Chinese girl with a large fish tail floating in the sea, full body, long black hair, beautiful face, 3D rendering, high detail, bright light –s 750 –no feet,legs,fish head

笔者英文能力范围内无论使用怎样的描述,都无法通过文字来实现想象中的龙或者美人鱼。

多人照片合影

上传两张原图,或者将一张原图和Prompt中的人物名字结合,产生一组两人合影的图片。但笔者发现,/imagine命令无论引入多少图片,通通会基于Prompt生成一个人物的图片,即在图片处理过程中,图片和Prompt是分别被处理的,Prompt是处理所有图片的提示或依据,并无法通过Prompt来实现基于原图的多人合影。

比如笔者想通过自己孩子照片实现和Elon Musk的合影:

is a little Chinese boy standing with Elon Musk on a farm working on the plants,full body,realistic,photographic,sunshine light,sunrising,F2.8 –iw 1.8 –s 750

最终的成图是Prompt对于原图的描述,因此变成了孩子与Elon Musk的合体,并不是最初所期望的效果。或者简化Prompt,降低对于成图的干扰:

this little boy is talking with Elon Musk

结果依然是合体人,并没有两个人对话的图片。

真人照片换装

通过–iw参数设置原图的比重最大,通过Prompt来实现人物的换装,如果效果良好,可以实现一键换装的效果。

blue dress –iw 2

通过blue dress的Prompt,将原图中孩子的红色运动服换位了蓝色裙子,虽然长相发生了变化,但对于换装的效果还是明显的。且显然MidJourney对于人脸的识别和还原还存在很大的困难。

笔者从中找到一张相对而言最像原图的图片:

照片局部修改

局部修改是MidJourney尚未推出的功能,结合原图使用Prompt,笔者尝试对照片进行局部修改,并以孩子万圣节的照片为例:

big mouth –iw 2

采用最简单的Prompt,将原图的比重设置最大,成图效果虽然嘴巴变大了,但会因为背景或面部其他装扮的干扰而形成恐怖的效果。即上文所说,越是纯粹的照片越能够产生期望的效果,越是复杂的图片主体的处理越会受到其他部分的干扰。

于是索性做了一个可爱版本的小怪物:

big mouth,long ears,bright eyes,sharp teeth,realistic,3D rendering,avatar,warm light –iw 1 –ar 9:16

图片上写字

在图片上写字是期望实现通过MidJourney实现隐写,即将文字隐藏在图片中,并通过MidJourney再读取其中的文字。从技术原理上,这样显然不现实,因此笔者尝试将中文、英文和数字呈现在图片中。

text of “子午” engraved on bricks wall

text of “great wall” engraved on bricks wall

text of “9527” engraved on bricks wall

结果依然是不理想,无论是中文、英文还是数字,都无法按照Prompt的描述将文字体现在图片中,但实现这个效果并不难,结合NLP技术和现有的图像生成应当在未来可以实现理想的效果。

技术型图片生成

有没有可能通过MidJourney生成技术类的图片呢?比如生成一张3D版本的网络拓扑图。

A topology diagram with routers, switches, firewalls, DMZ zones, and server devices,3d rendering

显然,对于技术类型图片的处理和生成只会其意而无法产生真正有意义的、严谨的技术图片。于是,将Prompt做了更加细化的描述:

A topology diagram shows a firewall followed by a switch, a switch connected to a DMZ and an office zone, a web server in the DMZ, and three employee office computers in the office zone.

同样,生成的图片在技术呈现上毫无意义甚至错误百出的,且字母或描述都出现了乱码和错误,无论重新生成多少次,最终的结果都不太理想,远看像一回事,近看无法直视。最后,附上笔者用于处理卡通3D头像的Prompt:

personality girl,super detail,soft colors,soft ighting,anime,high detail,art station seraflurart,ip,divine , cinematic edge lighting,light anddark contrast,Delicate features,Soft light,clean background.IP design,art bv Studio Ghibli,3d,c4d,blender,UnreaEngine,8kOC rendererbest quality –iw 1.5 –s 750

使用上面的Prompt需要根据性别修改girl或boy,原图需要尽可能高清和干净,产生的效果显著,如果不像原图,需要调整–iw参数,并多生成几次:

更新

目前的MidJourney已经支持图片中写字的功能,但仅限于英文字母和数字。