了解那些塑造了 Midjourney 发展历程 的旧版工具与功能。
如果你想了解 Midjourney 旧版模型的功能特性,你来对地方了。在不断推出新版本的同时,我们也希望回顾那些曾经存在的旧工具与功能,它们正是构建今日 Midjourney 体验的基石。
V5.2 发布于 2023 年 6 月,并在 2023 年 6 月 22 日至 2024 年 2 月 14 日 期间作为默认模型。V5.2 输出图像更锐利、细节更丰富、色彩与对比度更出色,整体构图也更加自然。该版本对提示词(Prompt)的理解力优于早期模型,同时对 --stylize(风格化)参数的响应更灵敏,可实现更细腻的风格控制。
V5.1 发布于 2023 年 5 月 4 日。在 2023 年 5 月 3 日至 6 月 22 日 期间为默认模型。该版本具有更出色的默认审美倾向,使得即便使用简单的文字提示,也能生成高质量图像。V5.1 拥有更高的一致性(Coherency),能更精准地理解自然语言提示,生成图像时更少出现杂质(Artifacts)与边框问题;锐度提升明显,并支持高级功能如 平铺(--tile)模式。
V5 发布于 2023 年 3 月,并在 3 月 30 日至 5 月 3 日 期间作为默认模型。V5 相较 V5.1 拥有更强的摄影写实感;能更忠实地还原提示内容,但若要实现理想风格,通常需要更长、更具体的提示词。
Niji 5(虹绘模型) 发布于 2023 年 4 月。可通过不同的 --style 参数进行风格微调,例如:
| 参数名称 | 默认值 | 可选范围 | 中文说明 |
|---|---|---|---|
| Aspect Ratio(纵横比) | 1:1 | 任意比例 | 控制图像宽高比,如 1:1(方形)、16:9(横向)等。 |
| Chaos(混乱度) | 0 | 0–100 | 控制结果之间的差异度,值越高,图像越随机、变化越大。 |
| Quality(质量) | 1 | 0.25、0.5、1 | 决定渲染质量与耗时,数值越高画质越好,但消耗更多 GPU。 |
| Seed(随机种子) | 随机 | 0–4294967295 | 固定随机性,使用相同种子可重复生成相似结果。 |
| Stop(停止进度) | 100 | 10–100 | 提前终止生成过程,得到更柔和、未完成的画面效果。 |
| Stylize(风格化) | 100 | 0–1000 | 控制画面的艺术化程度,数值越高越“艺术”、越具风格化表现。 |
放大工具说明:版本 5 提供 Upscale (2x) 与 Upscale (4x) 两种放大模式,可将图像尺寸分别提升至原来的 2 倍 或 4 倍。⚠️ 但需注意:它们与平移(Pan)和平铺(Tile)功能不兼容。
V4 模型 于 2022 年 11 月 发布。它在 2022 年 12 月 20 日至 2023 年 3 月 30 日 期间为默认模型。V4 是 Midjourney 团队基于全新代码架构与 自研 AI 超级集群(AI Supercluster) 从零打造的模型,相较于以往版本,它代表着一次彻底的系统级重构。V4 拥有比以往版本更广泛的知识库,对生物、场景、物体、材质等具备更精准的识别与表现能力。它在细节刻画上表现更出色,能够处理包含多人物、多物体的复杂提示词(Prompt),生成结果更具层次感与逻辑性。V4 支持多种高级功能,包括:图像提示(Image Prompting),多重提示(Multi-prompts) 同时具备极高的画面一致性(Coherency), 在处理图像提示词时尤其稳定且表现优异。
V4 模型拥有三个风格微调版本(也称「风格风味 / Flavor」),它们在风格化调校上略有差异。你可以在提示词末尾添加 --style 4a、--style 4b 或 --style 4c 来切换不同风格的 V4 模型。4c 为默认版本,支持最大纵横比 1:2 或 2:1,4a 与 4b 仅支持 1:1、2:3、3:2 三种比例。
Midjourney 的首个「Niji(虹绘)」系列模型 —— Niji 4,发布于 2022 年 12 月 20 日
| 参数 | 默认值 | 取值范围 | 中文说明 |
|---|---|---|---|
| Aspect Ratio(纵横比) | 1:1 | 1:2 – 2:1 | 控制画幅比例。 |
| Chaos(混乱度) | 0 | 0–100 | 控制结果的多样性与差异性。 |
| Quality(质量) | 1 | 0.25, 0.5, 1 | 决定生成质量与速度的平衡。 |
| Seed(随机种子) | 随机 | 0–4294967295 | 固定随机性,用于复现结果。 |
| Stop(停止进度) | 100 | 10–100 | 控制生成过程终止百分比。 |
| Style(风格版本) | 4c | 4a, 4b, 4c | 指定子模型风格。 |
| Stylize(风格化程度) | 100 | 0–1000 | 控制艺术风格化的强度。 |
Upscalers(放大器):早期版本的 Midjourney 会为每次任务生成一组低分辨率缩略图(预览网格)。你可以为任意缩略图使用 Upscaler(放大器),以提升分辨率并增强细节表现。下表列出了 1:1 方形画幅 下的不同放大模式与对应输出分辨率。更多细节请参考 Upscalers(放大器) 章节。
| 模型版本 | 起始网格尺寸 | 默认放大(Default Upscale) | 细节放大(Detail Upscale) | 轻量放大(Light Upscale) | 测试放大(Beta Upscale) |
|---|---|---|---|---|---|
| Version 4 | 512 × 512 | 1024 × 1024 | 1536 × 1536 | 1536 × 1536 | 2048 × 2048 |
| Niji 4 | 512 × 512 | 1024 × 1024 | 1024 × 1024 | 1024 × 1024 | 2048 × 2048 |
--test 与 --testp 模型于 2022 年 8 月 首次推出,它们是 Midjourney 为了收集社区反馈、测试新功能而设立的实验模型。这些测试模型让用户能够预览即将推出的功能,并可与 --creative 参数搭配使用,以获得更具变化性与创意性的构图结果。在使用这些模型时需注意,它们支持的 --stylize(风格化强度)范围为 1250–5000,这意味着模型会呈现出非常强烈的艺术化风格倾向。
不过,这两个测试模型也存在一些功能限制,不支持 多重提示(Multi-prompts);不支持 图像提示(Image-prompts);支持的最大纵横比为 3:2 或 2:3。当纵横比为 1:1 时,模型会生成 两张初始网格图像(Grid);若使用其他比例,则仅生成 一张初始网格图像。此外,在编写提示词时要注意:提示词开头的词语权重更高,比末尾的词对画面影响更大。正因为这些独特特征,--test 与 --testp 模型非常适合进行实验性视觉创作与风格探索。
Upscalers(放大器):测试模型生成的初始网格图像分辨率为 512 × 512 像素。唯一可用的放大方式是 Beta Upscale(测试放大),在使用 1:1 比例 时,它会输出 2048 × 2048 像素 的成品图像,更多细节请参考 Upscalers(放大器) 章节。
V1 模型 是 Midjourney 的首个公开版本,于 2022 年 2 月至 4 月 期间作为默认模型。V1 生成的图像风格极为抽象、富有绘画感,但整体一致性(coherency)较低,构图常呈现出自由、不可控的视觉散点。
V2 风格更具创造力、色彩丰富且依然带有绘画气质,但画面一致性仍然较低。
V3 生成结果具有极高的创造性与构图表现力,并首次实现了中等程度的画面一致性。
V3 旧版参数:--sameseed 随机种子(Seed)会在初始网格(Grid)图像中生成一块统一的随机噪声场(Noise Field),这一噪声作为所有图像生成的起点基础。当使用 --sameseed 参数时,初始网格中的所有图像都会使用相同的噪声起点,因此生成的四张图会结构高度相似,仅在细节或颜色上略有差异。
--hd 是一个早期的替代模型,生成的图像内容复杂、细节丰富但偏抽象,且画面一致性较低。
Upscalers(放大器):早期版本的 Midjourney 每次生成任务都会先创建一组低分辨率图像网格作为初始结果。你可以对这些图像使用 Upscaler(放大器),来提升分辨率并增强细节表现。下表展示了 1:1 方形图像 的各版本放大结果,更多细节请参考 Upscalers(放大器) 章节。
| 模型版本 | 起始网格 | 默认/细节放大(Detail Upscale) | 轻量放大(Light Upscale) | 测试放大(Beta Upscale) | 最大放大(Max Upscale) |
|---|---|---|---|---|---|
| Version 1 – 3 | 256 × 256 | 1024 × 1024 | 1024 × 1024 | 1024 × 1024 | 1664 × 1664 |
| HD | 512 × 512 | 1536 × 1536 | 1536 × 1536 | 2048 × 2048 | — |
这些参数属于早期 Midjourney 模型时代的特性,有的已整合进新版,有的则被废弃或重构。
| 分类 | 参数 | 中文说明 |
|---|---|---|
| 高清模型 | --hd | 早期高分辨率模式,生成更复杂、更抽象的图像。 |
| 测试模型 | --test, --testp | 公测模型,用于功能测试与社区反馈收集。 |
| 创意模式 | --creative | 提高随机性与自由构图度,使结果更具艺术化。 |
| 同种子模式 | --sameseed | 所有网格图使用相同噪声起点,生成结构相似的变体。 |
| 轻量放大 | --uplight | 更柔和的放大算法,边缘平滑、风格轻盈。 |
| 测试放大 | --upbeta | 实验性放大算法,提升清晰度但速度较慢。 |
| 中止生成 | --stop | 控制图像生成进程提前结束(柔化画面)。 |
| 风格调优码 | --style code | 来自 Style Tuner 的自定义风格编码。 |
| 已弃用参数 | 替代方案或状态 |
|---|---|
--width / --w | 改用 Aspect Ratio(纵横比) 参数 |
--height / --h | 改用 Aspect Ratio(纵横比) 参数 |
--fast | 改用 Quality(质量) 参数 |
--vibe | 已更名为 模型版本 1 |
--upanime | 已废弃(旧版日系放大模式) |
--hq | 已废弃 |
--newclip | 已废弃 |
--nostretch | 已废弃 |
--old | 已废弃 |
| 参数 | 作用范围 | V6 | V5 | V4 | V3 | Test / Testp | Niji 4 | Niji 5 |
|---|---|---|---|---|---|---|---|---|
| 最大纵横比 (Max Aspect Ratio) | 初始与变体图像 | 任意 | 任意 | 1:2 / 2:1 | 5:2 / 2:5 | 3:2 / 2:3 | 1:2 / 2:1 | 任意 |
| Chaos(混乱度) | 初始图像 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Image Weight(图像权重) | 影响图像提示比重 | 0–3 (默认 1) | 0.5–2 (默认 1) | 0.5–2 (默认 1) | 任意 (默认 0.25) | — | 0.2–2 (默认 1) | — |
| Quality(质量) | 控制渲染速度与清晰度 | 0.5–2 | 0.25–1 | 0.25–1 | 0.25–2 | — | 0.25–2 | 0.25–2 |
| Repeat(重复生成) | 重复任务次数 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Seed(随机种子) | 固定随机起点 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Sameseed(同种子模式) | 仅影响初始网格 | — | — | — | ✅ | ✅ | — | — |
| Stop(停止进度) | 控制生成中止百分比 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Style(风格模式) | 控制子模型风格 | raw | raw | 4a / 4b | — | — | expressive / cute / scenic / original | — |
| Stylize(风格化强度) | 控制艺术化程度 | 0–1000 (默认 100) | 0–1000 (默认 100) | 0–1000 (默认 100) | 625–60000 (默认 2500) | 1250–5000 (默认 2500) | — | 0–1000 (默认 100) |
| Tile(平铺) | 无缝重复纹理 | ✅ | ✅ | ✅ | ✅ | — | ✅ | ✅ |
| Weird(怪异度) | 扭曲、非线性效果 | ✅ | ✅ | ✅ | — | — | — | — |
| 初始图像数量 | 生成的网格数 | 4 | 4 | 4 | 4 | 2 或 1(取决于比例) | 4 | 4 |
在早期的 Midjourney 模型版本中,系统生成的图像尺寸相对较小,这些图像仍然可以通过 旧版放大器(Legacy Upscaler) 进行放大,这些放大工具不仅提升图像分辨率,还会为画面添加额外的细节信息。针对早期模型生成的图像,Midjourney 提供了多种旧版放大器可供选择,请注意,使用旧版放大器会消耗 GPU 运算时间。
Midjourney 5.x 系列模型默认生成的图像尺寸为 1024 × 1024 像素,你可以使用 Upscale (2x) 或 Upscale (4x) 工具,将图像分别放大到 2048 × 2048 或 4096 × 4096 像素。V5 的放大工具无法与 Pan(平移)工具或 Tile(平铺)参数同时使用。
每种放大器在放大图像时都会产生不同的视觉变化,下表中的所有尺寸单位均为像素,并以1:1 方形比例为基准。
| 版本 | 初始图像 | 默认放大 (V4 Default) | 轻量放大 (Light) | 测试放大 (Beta) | 细节放大 (Detail) | 最大放大 (Max)** |
|---|---|---|---|---|---|---|
| V4 | 512 × 512 | 1024 × 1024 | 1536 × 1536 | 2048 × 2048 | 1536 × 1536 | — |
| V1–V3 | 256 × 256 | — | 1024 × 1024 | 1024 × 1024 | 1024 × 1024* | 1664 × 1664 |
| Niji | 512 × 512 | 1024 × 1024 | 1024 × 1024 | 2048 × 2048 | 1024 × 1024 | — |
| Test / Testp | 512 × 512 | — | — | 2048 × 2048 | — | — |
| HD | 512 × 512 | — | 1536 × 1536 | 2048 × 2048 | 1536 × 1536* | — |
* = 各模型的默认放大器。
** = Max Upscale(最大放大)是旧时代资源消耗极高的放大方式,仅在 Fast 模式 下可用。
当使用旧版模型时,在提示词中加入 --uplight 或 --upbeta 参数,Discord 界面中的 U# 按钮 会自动变为对应的 Light Upscale 或 Beta Upscale 快捷键。
Style Tuner(风格调谐器) 是 Midjourney 5.2 版本 在 Discord 中推出的实验性功能,它是 Midjourney 迈向 个性化生成、情绪板(Moodboards)与风格探索器(Style Explorer) 的重要早期尝试之一。/tune 命令现已停用,用户无法再创建新的风格调谐器。你仍然可以使用 /list_tuners 命令访问此前创建的风格调谐器,并继续在提示词中使用已存在的 --style code 风格代码。
Remaster(重制) 是 Discord 界面中用于旧版图像放大的一个按钮。点击该按钮后,系统会自动将你原先的提示词(Prompt)重新混合并在 V5.2 模型中重新生成。在 Discord 中任意一张放大过的旧版图像下方,点击 🆕 Remaster 按钮即可对其进行重新生成。
Stop 参数(--stop) 适用于 V6 及更早版本 的 Midjourney 模型。当你在提示词中使用 --stop 参数时,可以在图像尚未完全生成前提前终止生成过程,从而得到更柔和、更模糊、细节较少的画面。
--stop 的默认值为 100,即系统会完整生成整张图,除非你手动指定其他值。你可以将该值设置在 10 到 100 之间,数值代表希望停止生成的“进度百分比”。