Midjourney中文入门教程 Midjourney 应用场景1：Stock Photo

2024-02-26 开发教程 Midjourney中文入门教程匿名 11℃

Text Prompt 的部分，我删除重写了 3 遍，每次写完都不太满意。前两遍，我都希望通过一个或几个万能模板教会大家写 Midjourney 的 Text Prompt，但实际试了很多遍后，我发现：

图片信息量非常大，万能模板的确让你生成一张及格的图片，但很难让你生成一个完全满意的图片。
要想生成一张高分图片，需要的不仅仅是 prompt engineering，甚至还需要一些美学知识，不同场景参数的使用都是不一样的，所以有些时候，用模板反而有点死板。

所以，我不想直接教大家所谓的万能模板，而是通过一个个实际场景教大家如何写好 text prompt ，因为不同场景，你告知给模型的信息是不一样的。

而且我认为，知道为什么，远比知道怎么做更重要。当你知道为什么后，遇到新的场景，你也能很好地解构出 prompt 里需要什么，而不是盲目套模板。

最后，图片场景有非常多，我会尽量分享一些大家日常工作中能用上的。希望能让 AI 提高你的工作效率，而不是用完即弃的玩具。

Text Prompt 开篇介绍一下 Midjourney V5 提升较大的 Stock Photo 场景。

什么是 Stock Photo？

Stock Photo 直译为图库图片。一般你能在一些图库网站上找到，这些图片通常来自一些摄影师或设计师。部分图片因为版权的原因，如果你需要使用则需要付费。

大部分使用 Stock Photo 的用户都是一些设计公司，或者广告公司。你应该常常能看到这类图片，比如最经典的两人握手照片：

我认为 AI 生成图片对图片库冲击非常大，V5 版本基本上满足了我的 Stock Photo 需求。

技巧一：临摹

我认为学习图片类的 prompt，跟学习画画是类似的，最好的学习方法不是直接用模板。

而是拿真图，或者别人生成的图来临摹。英文不好，也可以先写中文，然后让 ChatGPT 翻译。当你临摹了几张后，你就会慢慢搞懂如何做出类似的图了。

拿上面的那个握手图为例，我们仔细观察上面那张图，图中元素有什么：

第一主体是两个手，然后握在了一起，并且看起来是两个亚裔男人。
第二两人都穿着西装。
第三背景看上去像是在办公楼的大门，两人可能是在握手告别。并且背景刻意进行虚化了，或者是使用照相机拍摄的。

再归纳总结下，大概的信息：

主体：两个穿着西装的亚裔男人在握手告别
场景：办公楼大门
图像风格：stock photo，照相机拍摄，

这时候，我们就能尝试写一下 prompt 了（如果你觉得自己英文水平还不太行，也可以尝试用翻译软件翻译）。

stock photo of two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building,taken with Canon

Midjourney 生成的结果如下所示：

Emm 🤔 好像跟我们的预期不一样。不要慌，刚开始用 Midjourney 一定会遇到这种问题，重要的是多尝试。

我们再来分析下 Midjourney 为何生成了这样的图片？复盘一下：

首先图片的主体，或者说焦点，我们只需要「握手」，而不是两个人。
照相模式好像并不能实现背景虚化？更像是一种图像风格，图四就像是一种老照片的风格。

那我们调整下 prompt，增加焦点和背景虚化关键词：

stock photo of two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building, focus on two hands, taken with Canon, background bokeh

再来看看生成的结果，结果好很多：

图 1 和图4 基本满足需求了，图 2 和图 3 裁剪一下，也能满足我们的需求。不过需要注意，Midjourney 在人手的生成上暂时还有点问题，细看图 2和图 4，其中有一个人的手有 6 个手指 😂，但我认为未来应该会修复。

那我们来总结一下 prompt ，该 prompt 分成以下几个部分：

第一部分（红色线）：描述你想要的内容主体。
第二部分（蓝色线）：描述主体背景/环境。
第三部分（黄色线）：照片的焦点位置。
第四部分（绿色线）：照片的风格或者说是特殊要求。

总结下之后，你是不是就总结出了一个模板了？😁

技巧二：多实验

上述的案例，我还想教给各位第二个技巧：多试验。

图片生成遇到不符合预期的情况，不要慌，分析问题，然后使用控制变量法，一个个调整图片，不要急，上面我写的 prompt 还有一个地方，不知道各位有没有注意，就是开头的 stock photo，试试将这两个词删掉会怎样？

two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building, focus on two hands, taken with Canon, background bokeh

生成结果也依然满足需求，而且手指的数量也准确了，说明这个 Stock Image 对模型的影响不是很大。