你可能在社交媒体上见过这类图,毛线编织的小矮人,圆滚滚的身体,戴着尖顶帽,整个画面带着一种让人想伸手捏一下的温暖感。它们几乎都来自同一条 Midjourney 提示词,被大量转发和复制。

但复制一条提示词只能得到一张好看的图。如果你想用这种风格做一个 IP 角色——让它能笑、能哭、能出现在不同场景里,同时观众一眼就能认出"是同一个角色"——单靠那条提示词是做不到的。
这篇文章记录的就是这个过程:从一条风格提示词出发,一步步把它变成一个有表情、有场景、有辨识度的毛毡风 IP 角色。
先看看那条广泛流传的提示词长什么样:
animated characters by steffik joakimeus, in the style of bill gekas, joyful and optimistic, soft sculptures, victor nizovtsev, charming characters, colour, selective focus
它叠了三位艺术家的名字(steffik joakimeus、bill gekas、victor nizovtsev),加上 soft sculptures 这个关键的材质词,组合出了毛毡编织玩偶的视觉效果。出图质量很稳定,随便跑一次都能得到讨喜的角色。

问题在于,每次生成的角色都不一样。这一批是橙色卷发的小精灵,下一批可能就变成棕色直发的老奶奶。发色、体型、帽子形状、服装风格全都在变。对于发社交媒体来说这不是问题,但如果你的目标是做 IP,角色不能每次都换一张脸。
原始提示词描述的是一种视觉风格,而不是一个具体角色。要锁定角色,需要做一件事:把模糊的风格感受翻译成明确的外貌特征。
从原始提示词的出图里挑一个你最喜欢的角色,然后观察它的具体特征:头发是什么颜色和形状?帽子是什么款式?穿什么衣服?身体比例如何?把这些观察到的细节逐一写进提示词。
我选了一个橙色卷发、戴蓝绿色尖顶帽的小矮人,把它的特征写成了这样:
a small knitted gnome character, round body, orange curly hair, teal pointed hat with pom pom, teal wool coat with orange buttons, brown boots, big round nose, freckles, joyful expression, soft sculpture style, full body, front view, clean blurred background, selective focus
和原始提示词对比,三位艺术家的名字全部去掉了,取而代之的是具体的外貌描述——orange curly hair(橙色卷发)、teal pointed hat with pom pom(带毛球的蓝绿色尖顶帽)、teal wool coat with orange buttons(蓝绿色毛线大衣配橙色纽扣)、brown boots(棕色靴子)、big round nose, freckles(大圆鼻子和雀斑)。
风格层面只保留了 soft sculpture style 和 selective focus 这两个词,因为它们足以撑住毛毡质感和浅景深的视觉效果。

跑出来的结果,几张图里的角色高度一致:同样的配色、同样的帽子、同样的体型比例。偶尔纽扣的数量或围巾的有无会变化,但站在观众的角度,这已经是"同一个角色"了。
这就是锁定角色的核心逻辑。你描述得越具体,Midjourney 的发挥空间越小,角色一致性就越高。
一个 IP 角色不能只有一个表情。想象一下,如果你在做一套表情包或者一个儿童绘本的角色设定,至少需要开心、生气、难过、困倦这些基本情绪。
保持角色描述不动,只替换表情相关的词。
开心版本里写的是 joyful expression,把它换成 angry expression, furrowed brows(生气,皱眉),角色就皱起了眉头、撅起了嘴。换成 crying expression, tears(哭泣,眼泪),同一个小矮人就低着头掉眼泪。换成 sleepy expression, half-closed eyes(犯困,半闭眼),它就变成一副没睡醒的样子。



几组表情跑下来,角色的核心特征——橙色卷发、蓝绿色尖顶帽、圆圆的身体——在每一张图里都保持住了。表情的变化也足够清晰,观众不需要看文字说明就能读懂角色此刻的情绪。
描述表情时,除了情绪词本身,最好加上对应的面部特征。比如不只写"生气",而是写"生气,皱眉";不只写"犯困",而是写"犯困,半闭眼"。Midjourney 对情绪词的理解有时候比较模糊,但对具体的面部特征(皱眉、流泪、闭眼)反应很准确。给它一个情绪方向加一个物理特征,出来的表情会更到位。
有了表情之后,下一步是把角色放进不同的场景里。一个 IP 角色需要能出现在各种情境中——阅读、通勤、休闲、户外——每个场景都能成为一张独立的插画或者一个故事的片段。
操作方式和表情扩展类似,角色描述保持不变,去掉 full body, front view 这类固定视角的限制词,在角色描述之后加上场景描述。
比如让角色坐在沙发上看书:
a small knitted gnome character, round body, orange curly hair, teal pointed hat with pom pom, teal wool coat with orange buttons, brown boots, sitting in a tiny knitted armchair reading a book, cozy room background, soft sculpture style, warm lighting, selective focus

场景描述部分写的是 sitting in a tiny knitted armchair reading a book, cozy room background(坐在小小的编织扶手椅上看书,温馨的房间背景),再把灯光从默认改成 warm lighting(暖光),整个画面就有了故事感。
让角色在雨天撑伞:
a small knitted gnome character, round body, orange curly hair, teal pointed hat with pom pom, teal wool coat with orange buttons, brown boots, holding a tiny umbrella walking in the rain, wet cobblestone street, soft sculpture style, selective focus

让角色在秋天的公园骑自行车:
a small knitted gnome character, round body, orange curly hair, teal pointed hat with pom pom, teal wool coat with orange buttons, brown boots, riding a small knitted bicycle, autumn park, falling leaves, soft sculpture style, selective focus

三组场景跑下来,角色的辨识度依然很高。橙色卷发配蓝绿色尖帽的轮廓在任何背景下都很突出,这也验证了一个 IP 设计的基本原则:好的角色配色方案应该在不同环境中都能保持辨识度。
写场景描述时,道具和环境尽量也加上"编织""毛毡"的材质暗示。比如不写"自行车",而是写"小小的编织自行车"(a small knitted bicycle);不写"扶手椅",而是写"编织扶手椅"(a tiny knitted armchair)。这样场景和角色的材质风格能保持统一,不会出现一个毛线玩偶骑着一辆真实金属自行车的违和感。
到这里,用一条提示词的变体已经能产出一套包含多表情、多场景的角色图了。但 Midjourney 做 IP 角色有一个绕不开的现实:它不是一个角色设计工具,它是一个图片生成工具。
具体来说,这套方法能保持住的是角色的"大特征"——配色方案(蓝绿+橙色)、轮廓剪影(圆身体+尖帽子)、材质风格(毛毡编织)、面部特征(大圆鼻+雀斑+卷发)。这些特征在每一张图里都很稳定,足以让观众在不同图片之间建立起"这是同一个角色"的认知。
保持不住的是细节层面的一致性。纽扣的数量可能从三颗变成四颗,围巾有时候出现有时候消失,大衣的下摆长度每张图都略有不同,口袋的位置和样式也在变。如果你需要的是像素级别的一致性——比如动画项目里角色的每一帧都必须完全相同——Midjourney 目前做不到。
这意味着用 Midjourney 做 IP,它适合的位置是流程的前端:快速探索角色方向、确定配色和造型语言、产出一批概念图给团队对齐审美。到了需要精确控制的阶段——制作角色规范手册、输出可用于动画的标准化素材——仍然需要设计师用 Illustrator 或 Procreate 这类工具重新绘制。
换一个角度理解:Midjourney 在这个流程里扮演的角色,类似于设计师手绘草稿的替代品。过去你可能需要花一两天画十几个角色草稿来探索方向,现在几个小时就能用提示词跑出上百个方案。它加速的是"从无到有"的阶段,而不是"从有到精"的阶段。
最后把这篇文章用到的所有提示词整理在一起,方便你直接复制使用。
a small knitted gnome character, round body, orange curly hair, teal pointed hat with pom pom, teal wool coat with orange buttons, brown boots, big round nose, freckles, joyful expression, soft sculpture style, full body, front view, clean blurred background, selective focus
生气:将 joyful expression 替换为 angry expression, furrowed brows
哭泣:将 joyful expression 替换为 crying expression, tears
犯困:将 joyful expression 替换为 sleepy expression, half-closed eyes
读书:去掉 full body, front view, clean blurred background,加上 sitting in a tiny knitted armchair reading a book, cozy room background, warm lighting
雨中撑伞:去掉 full body, front view, clean blurred background,加上 holding a tiny umbrella walking in the rain, wet cobblestone street
骑车:去掉 full body, front view, clean blurred background,加上 riding a small knitted bicycle, autumn park, falling leaves
这套方法的核心是背后的思路,不是这条具体的提示词:先用风格词找到你想要的视觉方向,再把风格翻译成具体的角色特征描述来锁定角色,最后通过替换表情词和场景描述来扩展这个角色的表现力。换一个风格、换一个角色造型,同样的思路照样能用。
有0人收藏了本文