还可以参考播客「三五环」的这一期播客:
这就说到,AIGC 目前还是需要有很经验主义的引导语,在 Midjourney 工具里被称为 Prompt。Prompt 的使用方式直接影响了图片的质量效果。现在 Midjourney 还没有大家想象的已经到了随意说点啥都能画得特别令人满意的程度,很多时候好的图片是需要调教的。
例如,我曾经想画一个封面,表达的是喝运动饮料的运动员的状态,用的 prompt 是:
A asian athlete, throwing out drink cans, pop art, circle picture
(亚洲运动员,扔出饮料罐,波普艺术,圆形)
有点不符预期,这几个过于写实了,也不咋好看。似乎固定一下风格会好一些。怎么让运动感更强,而且更有艺术性呢?
于是我加了一个「colorful ink painting」,水墨画风格。就变成了这样:
比刚才的更风格化了、更有趣了。
只要使用一段时间 Midjourney,就会发现,对于风格的描述,几乎是写 prompt 最重要的技能。
我曾经想要模仿画一幅类似艺术家徐冰的作品《天书》的作品,他用常见的部首组合成不存在的字,这种陌生又熟悉的感觉很有意思:
由于 AI 目前是完全不识字的,画出来不存在的字这个好解决。但怎么样让文字整齐排列,像是一幅书法作品呢?
如果直接输入
Chinese words, Calligraphy
(中国字,书法),会出现这种结果:
当然也挺好看,但不符合预期。
这时我想到了前阵子用过的一位摄影师的风格,他叫做 Andreas Gursky,1955 年出生的德国摄影师,喜欢大尺幅、高密度的拍摄手法,比如这样的:
(巴黎蒙帕纳斯线 Paris Montparnasse ,1993年)
那不是巧了吗?于是用简单的这个 prompt :
Chinese words, Calligraphy , by Andreas Gursky
就能得到这样的结果了:
所以接下来就容易说明了:
对于 Midjourney 的使用来说,promps 就是核心竞争力。
这些各种各样的风格,包括画风(水墨、波普、抽象)、艺术家(摄影师、画家)等等,是能画好图最关键的武器。创意当然重要,但离怎么样实现创意之间,需要有大量的 prompts 的素材作为武器。
3.Midjourney 保姆注册和使用说明
想尝试的朋友,这里提供一份完整的注册使用说明。
1)科学上网。
2)注册网站(),注意,由于 Midjourney 并没有自己官方的客户端,而是搭载在 Discord 上的,所以过程中,没有 Discord 账号的话也要注册一下。
3)Discord 可以简单理解为微信群,Midjourney 在群组里放置了机器人(bot)。我们画图的过程,就是把 prompt 发给 bot,它会回复给我们。
所以加入大的群组(社区)后,可以看到各种小群组。对于新用户,有免费的画图名额,要进入新人画图群组,是这几个 newcomer rooms:
进入之后,你会发现很多人已经在画图了:
画图的方式是,在对话框里输入
/imagine
对话框会变成这样:
在 prompt 的框里输入英文的描述,敲回车即可。
4)你会发现每次生成 4 个不同的图片,这样每张都不算高清。这其实算是 demo,低成本地让你判断有没有合适的,然后可以再做 upscale (升级,或者扩大篇幅)的操作。每个图片下面也有快捷按钮,U1-U4 指的就是按顺序的图片。
注意,upscale 的操作也是耗费额度的。
具体 upscale 的操作技巧,下一节我们再聊。
5)免费会员有 25 次的使用额度,用完后就没了。付费会员则分为几类:
- 10 美元/月,每个月 200 张的额度;
- 30 美元/月,fast 模式大概有 900 张的额度,relax 模式额度不限;
- 60 美元/月,fast 模式大概有 1800 张额度,relax 模式额度不限,同时可以私密模式下使用(其它模式下你画的图是公开在个人主页的)。
一般推荐的还是前两种。付费可以用国际货币信用卡。
查看付费页面的方式是在输入框里使用语句:
/subscribe
付费会员会有自己的 bot,不用在群组里发了:
几个补充:
英语不熟悉的朋友,推荐用这个:deepl.com
用 Midjourney 画出的图片,创作者可以拥有版权,这两种情况例外:
更详细的可参考:docs.midjourney.com
对于付费会员来说,Midjourney 的 feed 社区是发掘好的 prompts 的绝佳圣地:
4.prompt 结构说明与属性描述词
Midjourney 的 prompt 的结构可以拆分成三个基础组成部分:
1)内容描述:就是主体内容,表达我们到底想画什么。是骡子是马,是猴子是兔。他们是什么形象、穿着什么衣服、在干什么,等等。
2)风格描述:包括曾经讲过的艺术家、画笔风格、艺术风格等等,甚至包括打光、视角、拍照相机的牌子等等。
3)属性描述:最基本的图片属性,比如尺寸、使用的 Midjourney 版本。
显然,内容描述是各位在画每个图的时候各自去创作的;风格描述,就是这个创意库接下来要探讨的;而属性描述,是相对最基础也容易掌握的部分。这篇文章就探讨几个最基本的属性描述词。
对了,强调一下,内容描述和风格描述都是可以用 , 或者 + 隔开的。而属性描述是要用两个短横线隔开的,要严格遵循:--[属性名][空格][属性值]
比如:rabbit, white --v 4
版本号 --v 1/2/3/4
前文提到过了,去年底发布的 v4 是效果最震撼的,而之前的三个版本还没有达到如此写实的程度。2023 年,这个专栏更新的过程中,Midjourney 预计会发布 v5,又会有一轮优化。
v 1-4 的区别,可以用同样的关键词来体会,比如:
cat --v 1
cat --v2
cat --v3
cat --v4
直观的感受,自然是默认都用 v4 即可,效果是最好的。但在画不同艺术风格的图片时,也未必。有时候觉得过于写实了,用一下 v2、v3 画抽象的风格,可能会有奇效。
另外,每次输入 --v 4 是比较麻烦的,想要默认都是 v4,可以输入语句:
/settings
这里面可以选择各种默认的语句。每次输入完,会自动给你添加上的。
扩幅相关 upscale
upscale 是把 4 in 1 的 demo 图片扩大篇幅成为更高清的图片。默认的扩幅一般就能用了。
这里还有一个 Make Variations,也容易理解,就是根据这个图重新做一份 4 in 1 的 demo,效果是这样的:
对于扩幅的图片像素大小,官方有一个完整的图表:
负面提示词 --no
如果不希望图片里出现什么内容,可以用这个描述。
比如:
--no hands
不要出现手。
质量 --q .25/.5/1/2
这是很量化的图片渲染时间,默认是 1。如果用更短的时间,消耗的额度更少,图片效果可能略差;反之亦然。
注意,渲染时间也跟额度有关。q 设置为 2,差不多就消耗两倍的额度。
图片比例 --ar 2:3/3:2
v4 版本只支持三种比例:
默认的 1:1,2:3 和 3:2(今天刚更新的版本,已经支持 16:9 等尺寸了)
要调整比例,使用语句 --ar,如:
cat --ar 2:3
v3 支持更多比例。但这里不展开说了。
参考图片
Midjourney 是支持参考图片的。比如如果想依据自己的照片画图,可以直接把图片网址放在 prompt 里面。例如:
iron man
如果图片还没有上传到什么图床,可以直接在对话框里发送,发送完后点击右键——复制地址。
增加语句重制 Remix
跟普通的重新制图不一样,高阶版的增加语句重制,可以在原构图/基本结构上,画别的主题。
具体操作是要去 settings 里打开 Remix Mode,然后再已经 upscale 的图片下点击 Make Variations,就可以另行输入 prompt 了。
这是我画的中国古镇:
这是用同一张图片在 Remix 模式下绘制的北欧古镇:
暂无评论内容