产品设计师上下文工程指南

AI并不总是当你添加更多细节时会"更努力"。通常，情况相反——它往往会迷失。在处理复杂推理任务时，准确率可能下降高达70%。但许多设计师仍然把AI当作黑箱：倒入需求，期待魔法，不起作用时无休止地修正。问题不在于"糟糕的提示"，而在于没有给AI清晰思考所需的信息。

作为设计师，我们理解信息结构化的方式直接影响人们处理它的方式。同样的原则适用于AI——只是AI对结构比人类更敏感。

上下文工程是应用于AI的设计思维——当你像设计系统一样结构化上下文，AI变得可靠且真正协作。当你不这样做时，你本质上是在让某人解决一个拼图，同时隐藏了一半的碎片。

1、为什么上下文比命令更重要

关于大语言模型的研究揭示了一些违反直觉的事情：更多上下文通常意味着更差的性能。当上下文长度翻倍时，写作质量大约下降40%。这种模式在不同模型和任务中都成立。

这在实践中意味着什么？你上传的那个庞大的品牌PDF，连同设计系统文档和用户研究综合？你可能让AI表现更差，而不是更好。它被信息淹没了，忘记了重要事项，忘记了你在三段前提到的约束。

Anthropic的研究团队将上下文工程定义为：

"精心策划最小的高信号token集，以最大化期望结果的可能性。"

这与大多数人使用AI的方式相反。直觉是给它一切——每个边缘情况、每个约束、你做过的每个用户研究。但更多并不更好。我们需要的是更智能的策划。

把它想象成设计界面。你不会一次向用户展示所有可能的操作。你在相关时逐步揭示信息。AI需要同样的考虑。

当上下文被适当优化时，结果是惊人的：AI完成设计任务的准确率提高40%，与非结构化上下文相比。这是有用的协作者和令人沮丧的工具之间的区别。

而且这不只是抽象概念——数据开始堆积起来：

使用带有结构化设计系统的AI的团队报告输出不一致减少62%，工作流效率提高78%。当系统被适当训练时，组件生成速度加快40-90%。这些是团队将AI从命令行工具转变为需要深思熟虑架构的系统后获得的有据可查的结果。

2、上下文的四个层次

如果上下文工程是应用于AI的设计思维，那么我们需要一个框架来定义什么是"好的上下文"。通过研究和实践，出现了四个不同的层次——每个服务于不同功能，每个对于可靠的AI协作都至关重要。

层次1：设计系统（容器）

你的设计系统是容纳其他一切的容器。当为AI结构化时，它提供使一致输出成为可能的基础词汇和规则。

AI实际需要的不是你的Figma文件或PDF导出。它需要：

作为CSS变量的颜色token（例如--color-primary-500）
有清晰比例的间距刻度（例如4px基础单位，1, 2, 3, 4, 6, 8, 12的比例）
展示token使用方式的示例组件
揭示意图的语义命名

最后一点值得强调。名为--color-text-primary的token与#1a1a1a告诉AI的根本不同。第一个传达意图和层次。第二个只是一个值。AI可以推理意图。它不能推理任意的十六进制代码。

最有效的AI设计系统遵循三层架构：

第1层：原始值。 原始值。实际的颜色、间距单位、字体大小。这些很少被直接引用。

第2层：语义。 目的驱动的token，将原始值映射到含义。--color-feedback-error、--spacing-content-gap、--text-heading-large。这是意图所在。

第3层：组件。 预组合的模式，将语义token组合成可重用的解决方案。一个"卡片"将正确的间距、颜色、排版和阴影组合在一起。

研究表明，结构化设计系统使开发速度提高47%，即使没有AI。当AI进入工作流时，优势显著增加，因为AI可以正确解析和应用系统。

层次2：品牌指南（约束）

品牌指南传统上存在于入职后没人读的PDF中。上下文工程将它们转化为AI自动尊重的操作约束。

团队报告品牌一致性提高45%，手动品牌管理时间减少65%，当AI与结构化品牌指南集成时。对于难以在大规模保持一致性的组织来说，这些数字不小。

关键是将指南构建为显式约束，而不是有抱负的文档：

锁定关键元素。 标志、主要颜色、核心排版选择——这些是不可协商的，应该如此标记。
允许显式灵活性。 布局变化、次要颜色应用、定义参数内的消息语调——这些是AI可以探索的领域。
清晰定义边界。 "标题使用Inter Bold，24-48px范围"是可操作的。"标题应该感觉大胆和现代"则不是。

转变是微妙但深刻的：指南成为系统强制执行的规则，而不是设计师参考的文档。AI不会像人类那样忘记指南。但它需要它们被构建为约束，而不是建议。

层次3：用户研究（锚点）

这是大多数团队在与AI合作时低估的层次。用户研究提供锚点，使AI推荐基于现实，而不是通用最佳实践。

没有研究上下文，AI生成变体。有了它，AI生成知情的变体，理解谁在实际使用产品以及什么约束重要。

要包含的关键元素：

可访问性要求。 特定的WCAG级别、已知的用户限制、辅助技术考虑
用户行为模式。 人们实际如何在产品中移动，在哪里花时间，跳过什么
边缘情况和本地化。 从右到左支持、长文本处理、国际用户的文化考虑
人口统计考虑。 年龄范围、技术熟练度、设备偏好、使用情境

这是AI作为"变体生成器"和AI作为"知情协作者"之间的关键区别。变体生成器给你选项，知情协作者给你尊重真实用户约束的选项。

层次4：工作流（分阶段）

最后一个层次解决你如何与AI交互——请求本身的结构。

思维链提示已成为最有效的技术之一。你不是直接要求最终输出，而是将请求构建为步骤：

分析当前状态
识别核心约束
生成三种方法
对照约束评估每种方法并推荐一种

这服务于两个目的。首先，它产生更好的结果，因为当要求展示工作时，AI推理更仔细。其次，对设计师更重要的是，它使推理透明。你可以在过程中发现错误，而不是在最终输出中发现。你可以看到AI优先考虑了哪些约束，哪些被降级。

对于更复杂的战略决策，思维树提示通过同时探索多条推理路径更进一步。你看到决策树，而不仅仅是结论。这对于权衡重要且没有单一"正确"答案的决策特别有价值。

3、命令和上下文的区别

命令方法： "生成5个结账布局。"

你得到什么：基于AI一般训练的通用选项。有些可能有效。大多数不匹配你的系统、品牌或用户。需要大量改进。

上下文方法：

基础： 这是我们的设计token文件和结账模式示例。

约束： 我们使用品牌蓝色（#0052CC）作为主要操作。移动优先必需。WCAG AA合规强制。

现实： 我们用户通常35-55岁，在午休时间通过手机完成交易。常见放弃点是支付输入和配送选择。

过程： 生成三种变体。对于每种，解释它如何解决移动优先约束和已识别的放弃点。然后推荐首先测试哪种以及为什么。

你得到什么：知情的变体，尊重你的系统，理解你的用户，并带有清晰的框架。

在你的下一个AI辅助设计任务之前，运行这个清单：

系统上下文：

你的设计系统是否以有清晰层次的token结构化？
语义命名是否揭示意图（不仅仅是值）？
你有展示token使用方式的示例组件吗？
边缘情况是否被记录（加载状态、空状态、错误）？

品牌上下文：

指南是否构建为显式约束？
你是否将锁定元素与灵活元素分开？
颜色和排版规则是否具体且可操作？
语调和声音是否以AI可应用的方式记录？

用户研究上下文：

用户人口统计是否定义？
可访问性要求是否指定？
是否引用了真实使用数据（而不仅仅是假设）？
关键摩擦点是否识别？

工作流上下文：

你的请求是否分解为清晰的阶段？
成功标准是否在开始前定义？
你是否优先排序了约束（如果需要权衡，什么最重要）？
你有迭代策略吗（你将如何改进）？

4、针对不同需求的三种框架

不是每个请求都需要相同的结构。这里有三种提示框架，匹配不同类型的设计工作：

框架1：基础优先（设计生成）

使用场景：创建新组件、屏幕或视觉解决方案。

系统上下文：
[设计token和组件示例]
品牌约束：
[具体品牌规则和边界]
用户要求：
[可访问性规范、用户研究要点、设备约束]
任务：
[具体设计需求]
成功标准：
[好的输出是什么样的——要具体]

关键是上下文在任务之前。AI顺序处理。它首先看到的东西塑造它如何解释后面的内容。

框架2：推理前进（战略决策）

使用场景：做出架构选择、评估权衡、在方法之间决定。

上下文：
[我们对情况的了解]
约束：
[我们不能改变的]
问题：
[要做的具体决策]
过程：
对于每个可行选项：
- 描述方法
- 根据我们的约束识别优势
- 识别劣势或风险
- 带理由推荐

这个框架优先理解为什么而不是获得什么。输出是一个决策框架，而不仅仅是一个单一决策。

框架3：迭代改进（改进）

使用场景：在以前的工作基础上构建、纳入反馈、发展解决方案。

当前状态：
[先前版本或输出]
反馈：
[什么有效，什么无效，具体问题]
新约束：
[自上次迭代以来的任何变化]
任务：
基于反馈改进。解释什么改变了以及为什么。

注意要求解释变化。这创造了透明度，帮助你理解AI的推理——对于及早发现误解至关重要。

如何知道它在工作

好迹象：

AI输出尊重你的设计系统，无需提醒
变体感觉符合品牌，无需大量修正
可访问性内建，而非事后添加
你在战略上花更多时间，在改进上花更少时间
开发者交接更顺畅

警告信号：

输出需要大量返工才能使用
变体感觉通用或略有偏差
你在过程中不断添加约束
你把AI当作更快（但不可靠）的初级设计师
质量在会话之间差异巨大

需要注意的模式：如果你在做大量修正和重新提示，问题通常是上下文，而不是AI能力。

5、战略影响

组织正在关注理解上下文工程的设计师。不是因为速度，尽管那很重要，而是因为更有价值的东西：控制和一致性。

一半的财富1000强设计高管报告AI对战略决策的影响增加。塑造这种影响的设计师是那些能够构建系统，在大规模产生可靠、有意输出的人。

在高级设计师中出现了两种不同的方法：

工具操作者主要使用AI来获得速度。他们获得更快的输出，但质量不稳定。一致性是持续的挣扎。每个项目都需要重新校准。AI是生产力工具——有用，但不是变革性的。

上下文架构师构建智能引导AI的系统。他们保持对输出的战略所有权。质量可靠，因为系统产生可靠性。AI成为真正的协作者，扩展他们的能力，而不仅仅是加速任务。

对于个人设计师，这解锁：

更清晰地表达设计思维（上下文工程迫使你使隐性知识显性化）
更快的执行而不牺牲质量
在组织AI决策中的战略权威

对于设计团队：

设计系统成为操作基础设施，而不仅仅是文档
迭代周期缩短，同时一致性提高
与开发的交接更清晰
初级设计师通过在结构良好的系统中工作来学习

对于组织：

设计系统真正随AI辅助扩展
减少返工和相关成本
跨接触点更强的品牌完整性
在AI战略对话中的设计领导力（不仅仅是实施）

你构建的每个设计系统、记录的每个约束、有意命名的每个token——那就是上下文架构。你多年来一直在与人类协作者做这项工作。新设计师入职、跨职能团队对齐、跨项目保持一致性——所有这些都需要结构化上下文。

AI只是需要更多精确性。它不能读懂言外之意，也不能通过渗透吸收文化。它需要显式结构，而这正是设计思维所擅长的。

你职业生涯中发展的技能：系统思维、约束管理、信息架构、以人为本的决策——这些正是上下文工程所需的技能。归根结底，并不是真的要学习新东西，而是以新方式使用你已经知道的东西。

原文链接: Context engineering: A repeatable AI workflow for product designers

汇智网翻译整理，转载请标明出处