随行案例:随行的产品团队决定做焦点小组之后,下一步确卡住了。决定做了,但具体怎么做,没有人能说得清楚。
四个人给了四个不同方向的建议,但没有一个人在回答最根本的问题。招多少人、分几组、每组聊什么、招什么样的人、在什么样的场地做,这些决定直接影响最终能拿到什么质量的数据。如果团队在没想清楚这些问题的情况下就开始盲目招募、订场地、写提纲,后面出了问题就很难补救了。
比如做了四组之后才发现,招来的用户全是高活跃用户,偶尔使用的人一个都没有,数据的代表性有明显偏差。比如所有组都聊了相同的话题,但旅伴匹配和本地向导放在一起讨论时间根本不够,两个概念互相干扰,哪个都没聊透。比如场地订的是公司会议室,参与者坐成一排面对白板,气氛容易变得紧张,讨论更像在做汇报而不是在聊天。这些问题等到做完了才发现,往往已经来不及纠正了。
我们这篇文章讲的就是,在正式开始招募和设计提纲之前,需要先把哪些问题想清楚。
不是所有研究问题都适合用焦点小组来回答。焦点小组擅长回答的是"用户怎么想"的问题,不擅长回答"用户怎么做"的问题。擅长回答的是"为什么"的问题,不擅长回答"有多少"的问题。
在它擅长的范围内,焦点小组能给你高质量的数据。超出这个范围,它不仅浪费时间,还可能给你不可靠的结论。

产品还在概念阶段,团队想知道用户对这个方向的初始反应——他们是否能理解这个概念,是否感到有吸引力,担心什么,期待什么。这是焦点小组最经典的应用场景。用户不需要有任何实际使用体验,只需要对着一个描述或早期草图反应,而群体讨论让不同用户的反应可以互相触发和补充,比逐一访谈能更快地收集到多样的视角。
用户用什么词汇来描述某个问题、某个需求、某个体验。这类研究在产品文案、功能命名、引导流程的设计上有直接的价值。焦点小组里,用户会在讨论中自然地用自己的语言表达,研究者可以观察哪些词汇反复出现、不同用户是否用了不同的框架来理解同一件事。
随行案例:随行团队在做焦点小组时注意到一个现象。用户在谈论结伴旅行时从来不说"旅伴匹配",而是说"找搭子""约同路人"或者"找人一起"。这个语言差异直接影响了后来功能的命名方向。
用户对某个产品类别、某个品牌或某个话题的整体印象和情感态度,适合在焦点小组里探索。这类问题没有对错之分,用户在一个安全的群体环境里更容易打开话匣子。不同用户之间的讨论和碰撞,往往能揭示出更深层的感知结构,比如什么东西让用户感到信任,什么东西触发了担忧,哪些因素在影响用户的整体印象。这些感知层面的信息,靠问卷里的选项很难捕捉到。
当研究者还不确定用户的核心需求是什么,需要从用户的日常经历和痛点里浮现出研究方向时,焦点小组提供了一个相对高效的探索方式。讨论的话题可以设定得比较宽泛,让用户自由说出他们关心的事。不同用户的关注点如果互相印证,说明这个需求很可能是广泛存在的。如果某个用户提到了一个其他人都没想到的需求,也值得单独标记,后续做更深入的调查。
问卷或行为数据告诉了团队一个"是什么"的现象,但研究者需要理解"为什么"。数据显示某个功能的满意度低,焦点小组帮你理解低满意度背后的具体原因。数据显示有一批用户在某个节点流失了,焦点小组帮你理解这批用户在那个节点的体验和想法。焦点小组在这种场景下的角色是"给数据补上解释",而不是替代数据本身。

话题高度私密。 财务状况、健康问题、感情生活、和个人失败相关的经历,这类话题在群体环境里很难拿到真实的回答。当周围坐着其他人的时候,参与者会不自觉地调整自己的说法,倾向于说"合适"的话而不是真实的话。这种倾向在一对一的环境里会弱很多,所以涉及私密话题的研究应该用一对一深度访谈。
需要了解实际操作行为。 用户在使用产品时做了什么、在哪个步骤遇到困难、操作错误发生在什么环节,这些问题需要观察用户的真实操作过程,不能靠用户自己描述。用户对自己行为的回忆往往不准确,他们会无意识地"合理化"自己的操作(比如觉得自己很快就找到了某个功能,但实际上花了两分钟)。可用性测试或行为数据分析是更合适的工具。
参与者之间存在权力关系。 如果同一组里有上司和下属、客户和供应商、或者在同一领域有竞争关系的人,讨论几乎不可能真实展开。下属会说他们认为上司想听的话,而不是自己真正的想法。有竞争关系的参与者会保留自己的核心判断,只说不痛不痒的表面观点。分组时必须避免这种情况。
需要统计显著性的结论。 如果研究问题的本质是"有多少用户这样想"或者"什么比例的用户有这个需求",焦点小组给不了可靠的答案。六到八个人的讨论可以告诉你"有人这样想",但不能告诉你"多大比例的人这样想"。需要量化结论时,问卷才是正确的工具。
话题需要参与者完全独立思考。 当研究需要收集每个用户不受他人影响的独立判断时(比如测试一个设计方案的第一印象),把用户放在一起反而会污染数据。第一个发言的人说了"我觉得这个按钮太小了",后面的人就很难不受这句话的影响,群体讨论会让最终的反馈趋于一致,而不是反映每个人真实的感受。
确定了焦点小组是合适的研究方法之后,下一步是把"我们想知道什么"转化成"焦点小组能帮我们探索什么"。这两个问题看起来差不多,但如果不做这一步转化,研究问题就会停留在一个太大或太模糊的状态,讨论提纲写不出来,主持人在现场也不知道该把对话引向哪里。
团队内部讨论研究需求时,通常会用业务语言来表达,比如"我们想知道用户愿不愿意用旅伴匹配功能"。
这句话作为业务目标没有问题,但如果直接拿它当研究目标去写讨论提纲,焦点小组就会变成一场投票。参与者说"愿意"或"不愿意",研究者拿到了一个二选一的答案,然后发现这个答案对设计决策几乎没有帮助。因为设计师需要知道的不是"愿不愿意",而是用户在什么条件下才愿意、他们的顾虑具体来自哪里、什么样的设计细节会让他们觉得这个功能可信。
所以研究目标需要从"要一个答案"转化成"要一种理解"。转化后的研究目标可以是这样的:"理解用户对陌生人结伴旅行的态度和顾虑,以及哪些条件会影响他们对这个功能的接受意愿。"
这个目标告诉研究者,讨论需要覆盖三个维度:用户的态度、顾虑的来源、以及接受的条件。设计师读到对应的研究结论之后,能直接从中提取设计方向。用户最大的顾虑是安全问题,那就在匹配流程里加入身份验证和评价机制。用户觉得不知道对方是什么样的人,那就在匹配页面上展示对方的旅行偏好和历史评价。研究结论和设计行动之间的距离越短,研究目标就定得越准。
把业务语言转化成焦点小组的研究目标,有三个具体的转化动作。
第一个动作,把"想知道"换成"想理解"。 "我们想知道用户愿不愿意用"指向的是一个结论,结论拿到了研究就结束了。"我们想理解用户对这个功能的态度和顾虑"指向的是一个过程,讨论可以沿着态度、顾虑、条件这些维度层层展开,拿到的信息量远大于一个"愿意"或"不愿意"。
第二个动作,把"会不会"换成"为什么会、为什么不会"。 焦点小组最擅长挖掘行为背后的原因,而不是统计行为本身的比例。"用户会不会用旅伴匹配"是一个投票题,"用户在什么情况下会考虑和陌生人结伴,在什么情况下绝对不会"才是焦点小组能回答好的问题。
第三个动作,把终点式的问题换成过程式的问题。 "这个功能是否有市场"是一个终点,回答完就停了。"用户在什么情境下会需要这类功能、他们过去有过哪些相关经历、当时的感受是什么"是一条路径,讨论可以沿着这条路径走下去,过程中浮现出来的信息往往比预设的问题更有价值。
随行案例:随行团队做完这三步转化之后,研究目标从"了解用户对旅伴匹配和本地向导的态度"变成了三个具体的探索方向。
方向一,还原真实经历。 用户在独自旅行时,有没有遇到过需要旅伴或需要当地信息来源的情况?这些需求在什么场景下出现?当时是怎么解决的?
方向二,捕捉第一反应。 当用户第一次听到"在 App 上匹配旅伴"和"在 App 上预约本地向导"这两个概念时,脑子里浮现的是什么?联想到了什么?有哪些具体的顾虑或期待?
方向三,定位接受条件。 什么样的匹配机制、信息展示方式、安全保障措施会影响用户对这两个功能的接受程度?哪些条件满足了用户就愿意试,哪些条件缺失了用户就直接放弃?
三个方向各自对应讨论提纲里的一个阶段。研究者写提纲时知道每个阶段该探索什么,主持人在现场追问时也知道该往哪个方向深入。
确定了研究目标之后,进入具体的研究设计阶段。首选需要确定的就是这个研究一共要做几组焦点小组。这个数字直接影响研究的成本和数据的质量,定少了覆盖不到关键用户群,定多了时间和预算都有压力。
决定组数的起点是用户分类。如果不同类型的用户对研究问题的看法有实质性的差异,每一类用户就需要单独成组。把差异很大的用户混在同一组里,讨论中的分歧会反复出现,主持人很难推进话题,最后拿到的数据也很难解读,因为研究者分不清某个观点是哪类用户在说。
随行团队的研究有两个需要区分的维度。
第一个维度是对独自旅行的偏好。有些用户非常享受独处,独行是他们旅行的核心价值,在他们看来"加一个旅伴"是对旅行体验的干扰。另一些用户享受旅行本身,但不介意甚至希望有伴,独行只是因为身边没有合适的人一起去。这两类用户对旅伴匹配功能的态度很可能截然不同。如果把他们放在同一组,讨论会充满对立,很难形成有深度的探索。
第二个维度是对陌生人的开放程度。有些用户在旅途中很愿意和陌生人交流,有过不少和陌生人同行的正面经历。另一些用户有过不好的经历,或者对陌生人保持较高的警惕。这个维度同样会显著影响用户对两个新功能的反应。
随行案例:基于这两个维度,随行团队把目标用户分成了两类。独行偏好型(享受独处,独行是主动选择)和结伴意愿型(希望有伴,独行是被动情况)。每一类做两组,总共四组。
同一类用户不能只做一组就下结论,因为一组里六到八个人的讨论可能受到某个强势参与者的影响,或者碰巧遗漏了某个重要话题。同类型的用户至少做两组,两组的发现互相印证,数据的可靠性才有保障。
实际操作中,同类型用户做两到三组通常就够了。第一组会浮现出主要的话题和观点。第二组会确认或补充第一组的发现,有时候第二组会带来第一组没有出现的新视角。如果第三组的讨论中已经不再出现新的主题,说明这类用户的数据已经饱和,不需要再做更多组了。对于时间和资源有限的项目,每类用户做两组是合理的起点。
一个焦点小组研究项目,总组数通常在四到八组之间。少于四组,数据的覆盖面不够,结论容易被质疑。超过八组,分析的工作量会变得很大,而且通常到五六组之后就很难再出现新的发现了。
四组是很多项目的起点。如果第一轮做完之后发现有新的用户类型需要覆盖,或者有某个重要话题在前几组里只是被触及但没有展开,可以追加一两组做定向的深入。
随行案例:随行团队最初计划做四组,后来在前两组里发现"对陌生人的安全顾虑"这个话题比预想中复杂得多,于是追加了一组专门围绕安全话题做深入讨论,最终做了五组。
组数定了,接下来要决定每组需要几个人。人多了,观点多样性上去了,但每个人能说话的时间就少了,讨论容易被几个人主导。人少了,每个人都能聊得比较深,但覆盖的视角有限,可能漏掉重要的观点。
大多数情况下,6 到 10 人是合适的范围。 这个人数规模下,不同背景的参与者能产生真实的对话和碰撞,主持人也有足够的空间管理讨论的方向和节奏。6 人是下限,如果再少,碰上一两个不太爱说话的参与者,讨论就会变得单薄,群体互动的活力出不来。10 人是上限,如果再多,主持人很难确保每个人都有机会说话,沉默的参与者会越来越多。
如果话题比较复杂,需要每个人都聊得比较深入,可以把人数缩到 3 到 5 人。 这个规模更接近深度对话而不是群体讨论,每个参与者有更多时间展开自己的想法,主持人也有更多机会追问细节。线上焦点小组通常也建议缩到 5 到 7 人,因为线上讨论的自然流动性比线下差,参与者更容易分心,人少一些主持人更容易把控。
还有一种特殊情况是二人组。 当研究话题高度个人化,或者需要观察两个人之间的自然互动时,二人组比群体讨论更合适。比如研究夫妻或伴侣怎么一起做旅行决策,让两个人当面聊比分别访谈能拿到更真实的互动数据。但二人组不适合需要多样观点的研究,因为两个人的对话形不成真正的群体动态。
随行案例:随行团队决定每组招募 8 人,目标完成人数 7 人。8 人比 7 人多一个缓冲位,如果有人临时取消,仍然能保证 7 人参加讨论。7 人又不像 10 人那么难管理,在线下圆桌的环境里,这个人数的讨论既有足够的多样性,主持人也能照顾到每个人。
组数和人数定了,接下来要决定是在线下做还是线上做。
线下焦点小组能提供更丰富的观察信息。主持人可以看到参与者的全身肢体语言,不只是一个视频框里的面部表情。有人听到某个概念时往后靠了一下,有人不自觉地向前倾,有人在某个话题上和旁边的人交换了一个眼神,这些非语言信号是重要的研究数据,线上环境几乎捕捉不到。
面对面的环境也更容易让参与者放下防备。坐在同一个房间里的人建立信任感更快,讨论的节奏也更自然。谁先开口、谁接上话、谁停下来想一想,这些对话的流动在线下会自然形成,在线上就需要主持人刻意去管理。如果研究的话题涉及情感、信任或个人经历,线下环境让参与者更愿意打开自己。
如果讨论中需要使用实物材料(概念卡片、纸质原型、便利贴排序活动),线下也更方便。参与者可以直接翻看、标注、移动卡片,操作自然流畅。同样的活动搬到线上,需要额外的协作工具和操作指引,技术摩擦会分散参与者的注意力。
线上焦点小组的核心优势是打破地理限制。如果目标用户分布在不同城市甚至不同国家,线下意味着要在每个地点分别组织,或者承担参与者的差旅费用。线上只需要一个视频会议链接,参与者不用出门,招募的时间成本和经济成本都低得多。当目标用户是某个小众群体、本地很难凑够人数时,线上几乎是唯一可行的选择。
但线上有两个必须正视的劣势。第一个是参与者容易分心。在家或在办公室参加视频会议的人,可能一边听讨论一边看手机消息,可能被家人打断,可能在摄像头看不到的地方做别的事。参与深度下降了,数据质量也就跟着下降。
第二个是技术问题。网络卡顿、麦克风杂音、摄像头黑屏,任何一个参与者的技术故障都会打断讨论的节奏。一组里如果出现两三次技术中断,整组的讨论体验和数据质量都会受到明显影响。
所以选择线下还是线上,判断逻辑是这样的。如果目标用户集中在同一个城市、研究需要使用实物材料、或者话题涉及情感和信任需要参与者充分放松,优先选线下。
如果用户分布分散、招募时间紧、预算有限,线上是合理的选择,但需要在设计上做补偿。比如把每组人数缩小到五到七人来降低管理难度,比如增加书面互动环节(让参与者在聊天框里先写下自己的想法再口头讨论)来弥补纯口头讨论中容易出现的从众效应。
随行案例:随行团队的目标用户主要集中在一线城市,刺激材料以 App 概念截图和卡片为主,线下和线上都可行。他们最终选择了线下,原因是旅伴匹配和本地向导这两个概念都涉及对陌生人的信任感。这类有情感成分的话题,参与者在面对面的环境里更容易卸下防备、说出真实的顾虑,线上隔着屏幕很难达到同样的讨论深度。
大多数焦点小组研究只做一轮。召集参与者,完成讨论,分析数据,出报告。但有些研究场景需要做不止一轮。
如果研究目标是探索性的,想了解用户的第一反应和自然态度,不需要验证某个特定的设计方向,一轮就够了。参与者看到概念后的反应、讨论中浮现的顾虑和期待,一轮讨论已经能提供足够的信息来指导下一步。
如果研究目标是迭代式的概念测试,就需要多轮。第一轮测试初始概念,收集用户的反馈和顾虑,然后团队根据反馈修改概念或调整设计方向,第二轮用修改后的版本再测一次,看用户在第一轮里提出的问题是不是被解决了。每轮都产出具体的改进方向,研究和设计之间形成一个迭代循环。这种方式适合产品概念还需要经过几轮打磨的阶段。
多轮焦点小组有一个参与者选择上的细节需要注意。第二轮通常应该找新的参与者,因为参与过第一轮的用户已经接触过初始概念,他们的反应不再是真实的第一印象,数据会失真。但在某些情况下,设计师也会故意邀请第一轮的参与者回来参加第二轮。这些回头参与者能从用户的视角直接评价"改之前是什么感觉、改之后变好了还是变差了",这种前后对比是新参与者给不了的。所以实际操作中,第二轮可以混合安排,大部分是新参与者,留两三个是第一轮回来的。
随行案例:随行团队这次做的是单轮研究。因为研究目标是探索用户对两个新概念的态度和顾虑,属于探索性研究,不需要迭代验证一个已有的设计方向。
研究设计的决策都做完之后,需要把它们落成一份可执行的项目计划。重点是两件事,时间要多久,钱要花多少。
一个四组的焦点小组项目,从启动到报告完成,通常需要四到六周。如果招募顺利、团队有经验,可以压缩到三到四周。如果招募遇到困难或者分析工作量超出预期,可能会拉到六到八周。
四到六周的时间大致分成这样几段。
焦点小组的成本主要有四块。
第一块是主持人。如果团队里有做过焦点小组的 UX 研究员,可以内部承担,不产生额外费用。如果需要外聘专业主持人,费用根据经验和市场差异很大,需要提前询价。外聘主持人的好处是经验丰富、控场能力强,代价是费用高而且需要花时间让主持人理解产品背景和研究目标。
第二块是场地。线下焦点小组需要一个安静的、适合围坐讨论的空间。理想的配置是圆形或 U 形座位加单向玻璃(观察员可以在隔壁看到讨论过程但不进入讨论室)。这类专业场地通常按场次收费。如果没有预算租专业场地,公司内部一间安静的会议室加一台摄像机也能用,只是观察员需要坐在讨论室里,可能会影响参与者的自然程度。
第三块是参与者激励。焦点小组通常占用参与者一个半到两个小时,应该提供合理的报酬来补偿他们的时间。金额根据目标用户群体的时间价值来定,专业背景的用户(比如医生、律师、高管)激励要高于普通消费者。形式可以是现金、购物卡或产品权益,取决于哪种对目标用户更有吸引力。
第四块是录制和转录。如果团队内部有录制设备就不需要额外花钱。转录可以用 AI 工具辅助(飞书妙记、讯飞听见都能做),速度很快,但生成的文字稿需要人工校对,这一步的时间成本不能忽略。
随行案例:随行团队的预算有限,主持人由团队内部的 UX 研究员承担,场地借用了合作方的会议室,参与者激励按每人 200 元的标准发放购物卡,录制用手机架加蓝牙麦克风解决,转录用 AI 工具加人工校对。四组的总硬性支出控制在了五千元以内。
把前面所有的决策汇总起来,看看随行团队最终的研究规划长什么样。
从规划确认到报告完成,预计需要五周时间。
到这一步,研究什么、研究谁、用什么方式、需要多少人、谁来做、什么时候完成,都已经确定了。后续的招募、提纲设计、现场主持和数据分析,都可以在这个框架里展开了。
有0人收藏了本文