在Reddit上探索未满足的需求

在构建任何东西之前找到付费客户的 Reddit 到 LLM 工作流程——没有调查,没有猜测

在Reddit上探索未满足的需求
AI编程/Vibe Coding 遇到问题需要帮助的,联系微信 ezpoda,免费咨询。

大多数创始人和作家把 Reddit 当作社交信息流。他们刷屏,希望发现一个趋势,并可能保存一两个评论。

那不是研究。那是猜测。

现实情况是,Reddit 是互联网上最大的未满足需求开源数据库。人们不只是在那里聊天;他们明确描述了损坏的软件、他们愿意支付更多费用的服务,以及他们目前正在用胶带和电子表格解决的问题。

但信号被埋藏在噪音中。如果你手动阅读主题,你会错过模式。你会被争论、梗和排名算法分散注意力。

有一种系统的方法可以过滤掉噪音。

它不需要抓取机器人或 Python 脚本。它依赖于每个 Reddit URL 中内置的隐藏功能和提示 LLM 的特定方式。

我停止了"寻找想法",开始运行这个工作流程。以下是我如何使用原始数据找到人们确切试图购买的东西。

1、为什么 Reddit 主题比客户访谈更好

传统市场研究有一个问题:人们撒谎。不是故意的——他们只是在试图解决问题的过程中不知道他们真正想要什么。

在采访中问某人,"你会为 X 付费吗?"他们会给你一个社会上可接受的答案。看他们在论坛主题中挣扎,他们会确切地告诉你什么损坏了,他们尝试了什么变通方法,以及他们愿意在放弃之前忍受多少摩擦。

Reddit 主题——尤其是在较小的、利基子版块中——捕捉人们在痛苦时刻。他们不是为研究人员表演。他们向陌生人寻求帮助,因为当前的解决方案不起作用。

优势不是速度。是上下文。你看到问题、尝试的解决方案、他们做出的权衡,以及他们用来描述所有这一切的语言。那是你无法从调查中获得的数据。

2、工作流程:从主题到洞察

以下是我用来从大多数人错过的 Reddit 对话中提取模式的过程。

2.1 提取完整主题数据

Reddit 的 API 使这变得容易。获取任何主题 URL 并在末尾添加 /.json。你可以获得整个对话——每个回复、嵌套主题、投票计数、时间戳——以结构化格式。

示例:https://www.reddit.com/r/productivity/comments/example/.json

这可以立即给你所有内容。无需手动复制,没有丢失上下文,没有你滚过的回复。

2.2 将其输入到 LLM

复制 JSON 输出并将其传递给 Claude、ChatGPT 或任何具有大上下文窗口的模型。目标不是总结——是模式提取。

使用这个提示:

"分析此 Reddit 主题以了解未满足的用户需求。识别:1) 人们试图解决的核心问题,2) 提及的当前解决方案中的差距,3) 人们正在使用的变通方法,4) 表明付费意愿的语言模式,5) 多个评论中重复出现的挫折。以结构化发现输出,而不是总结。"

模型会提取你手动阅读会错过的主题:以五种不同方式表述的相同投诉、人们不直接陈述的隐含需求、埋藏在随意评论中关于价格敏感性的信号。

2.3 映射真正的痛苦

寻找人们解决得不好的问题。不是他们提到一次的那些——是在多个评论中、不同用户中出现,有证据表明他们已经尝试修复它的那些。

良好的信号:

  • "我目前正在使用 [工具 A] + [工具 B] + 电子表格来做这个"
  • "我知道这是一个奇怪的设置,但这是我能让它工作的唯一方法"
  • "我愿意为某件只处理 [特定事情] 付费"

糟糕的信号:

  • "有人应该建立……"
  • "如果……会不会很酷"
  • 没有关于为什么当前选项失败的上下文的功能请求

区别在于意图。一组正在积极解决当前问题。另一组是在做白日梦。

2.4 找到其他人看不到的模式

阅读关于同一主题的十个主题。将每个通过 LLM 运行。寻找在不同上下文中出现的重叠痛点。

这是大多数人停止得太早的地方。一个主题告诉你一组人需要什么。十个主题告诉你该类别缺少什么。

模型会显示你无法手动捕获的连接:同一个问题如何在相邻利基市场以不同方式体现,哪些变通方法反复出现,哪些抱怨实际上是更深层次结构问题的症状。

3、在哪里寻找

并非所有子版块都有用。大的、通用的那些太嘈杂。太小的那些没有足够的数量。你想要中等规模的社区(1 万–50 万成员),专注于特定活动、角色或问题。

良好的狩猎场:

  • r/freelance(独自管理混乱工作流程的人)
  • r/productivity(持续工具实验)
  • r/startups(创始人在负担不起适当软件之前解决问题)
  • r/realestateinvesting(利基流程,高支付意愿)
  • r/teachers(资金不足,创造性的变通方法)
  • r/sysadmin(企业问题,个人解决方案)

小规模子版块是金矿。人们公开解释他们需要什么、他们尝试过什么,以及他们愿意为什​​么付费。对话很详细,因为社区很紧密,问题很具体。

避免:

  • 人们只是抱怨而不尝试解决方案的子版块
  • 由爱好者而不是从业者主导的社区
  • 纯理论性的主题("如果有这样做的应用程序……")

你想要人们目前正在积极解决问题的主题,而不是想象更美好的未来。

4、数据实际揭示了什么

LLM 分析会给你结构化模式,但你仍然需要正确解释它们。

寻找收敛。 如果三个不同主题中的人提到用同样的两个工具拼凑在一起,那就是一个差距。如果二十个人提到它,那就是一个市场。

观察语言。 不提供解决方案就说"我需要"的人在头脑风暴。说"我目前正在使用 X,但它会在……时中断"的人是买家。

跟踪变通方法。 某人当前的解决方案越复杂,他们忍受的痛苦就越多。五步手动过程比轻微不便表明更高的支付意愿。

识别非明显的洞察。 有时真正的机会不是陈述的问题——它是他们在陈述的问题之前或之后做的事情。LLM 会捕捉到这些,因为它不锚定于你的假设。

5、这会在哪里失败

这个工作流程有明显的限制。

它无法在规模上验证需求。 Reddit 主题告诉你问题存在,人们正在尝试解决它。它们不会告诉你有多少人有这个问题,或者他们是否真的会购买你的解决方案。

它偏向于善于表达的用户。 发布详细工作流程解释的人并不能代表所有有问题的人。你看到的是最投入的、最技术的或最沮丧的子集。

它错过非语言行为。 你在阅读人们说他们做的事情,而不是观察他们实际做的事情。陈述的行为和实际行为之间总是存在差距。

它无法告诉你人们不知道他们存在的问题。 你仅限于人们能够表达的痛点。真正新颖的解决方案通常解决了用户不知道自己可以表达的需求。

小样本量是嘈杂的。 即使十个主题可能只有 100-200 条评论。这在统计学上不显著。你正在做定性模式识别,而不是定量研究。

6、如何测试你发现的内容

阅读主题给你的是假设,而不是答案。你仍然需要验证。

最快的测试: 创建一个落地页,用你在主题中看到的确切语言描述你的解决方案。将其发布到同一个子版块(遵循社区规则),看看人们是否参与。如果他们参与,请求电子邮件注册或预购。

更好的测试: 构建一个粗略的原型,并把它提供给发布该问题的人。他们的反馈会告诉你是否正确理解了需求。

最好的测试: 启动一个最小版本并收费。Reddit 用户会告诉你他们愿意为某事付费。实际支付行为是唯一重要的信号。

7、真正的优势

工作流程不是关于速度。每个人都可以拉取 Reddit 主题。每个人都有权访问 LLM。

优势在于比其他人更好地倾听。

大多数人阅读一个主题,略过顶部评论,然后继续。你阅读十个主题,提取结构化模式,并映射存在的和人们实际做的事情之间的差距。

大多数人寻找想法。你在寻找人们已经试图解决的未满足需求的证据。

这就是猜测产品市场契合度与从证明它存在开始的区别。

8、从这里开始

选择一个你有领域知识的子版块。找到一个人们在请求工具推荐或描述其当前工作流程的主题。在 URL 末尾添加 /.json。复制输出。

使用本文中的提示将其输入到 LLM。阅读结构化发现。

如果你看到了手动阅读时错过的模式,工作流程就有效。如果你看到人们现在解决得不好的问题,你就找到了值得测试的东西。

目标不是拥有完美的数据。而是停止在看其他人看的地方,开始倾听真正正在讨论问题的地方。


原文链接: The Reddit + LLM Workflow That Finds Money Where No One Else Looks

汇智网翻译整理,转载请标明出处