AI书房
用书来读懂AI
这里收录金京镇律师的AI、法律、产业、历史、政治、文化主题在线书。每本书都按目录、序言、章节、尾声整理,方便连续阅读。
[AI书房] 第21章 四阶段框架:家、生命、手、成长
Claude Code完全掌握
Claude Code完全掌握
第21章 四阶段框架:家、生命、手、成长
金京镇
引言
四块屏幕同时运转。一块在排今天的日程,另一块在写LinkedIn帖子,第三块在检查团队项目进度,第四块在制作YouTube视频的视觉素材。这是美国一位AI自动化顾问每天早上到办公室后看到的场景。四个Agent并行运行,耗时大约2分钟。同样的工作用手动处理,要花25分钟以上。
这位顾问的项目文件夹左侧面板里,密密麻麻排列着几十个文件和文件夹。上下文文件、决策日志、技能文件夹、Agent配置,应有尽有。第一次看到的人很容易被吓到。但这套体系不是一夜之间建成的,而是每天一点点、踏着四个阶段搭建起来的成果。
这四个阶段分别叫做Home(家)、Life(生命)、Hands(手)、Growth(成长)。
第一阶段「家」:项目文件夹结构与claude.md设计
盖楼之前要先平整地基。要打造一个AI执行助理(Executive Assistant),先得为它准备一个栖身之所。这里说的「家」,就是一个项目文件夹。
打开VS Code(Visual Studio Code),在桌面或者任何你喜欢的位置新建一个文件夹。名字随意,但请记住:这个文件夹就是助理的整个工作空间。在VS Code左侧资源管理器里点击「Open Folder」,打开刚才创建的文件夹,一块空白画布就展开了。目前里面还没有任何文件。
[图21-1] 在VS Code中打开空项目文件夹时的界面布局]
现在要往这个空白空间里放入第一个文件。在左侧面板点击「New File」,文件名输入CLAUDE.md。这个文件充当助理的大脑。因为Agent在读取用户消息之前,每次都会先加载这个文件。
如果把所有信息一股脑塞进CLAUDE.md会怎样?每次对话都要加载大量文本,白白浪费模型计数的文本片段(Token)。所以这个文件里只写核心规则和「什么东西在哪里」的路径指引。详细信息放在单独的文件中,让CLAUDE.md扮演路由器(Router)的角色。
# CLAUDE.md 结构示例 ## 角色 本文件夹是用户的执行助理工作空间。 ## 上下文位置 - 用户信息:context/me.md - 工作信息:context/work.md - 团队信息:context/team.md - 当前优先事项:context/priorities.md ## 技能位置 - 参见 .claude/skills/ 子文件夹 ## 沟通风格 - 简洁、直接的语气
[图21-2] CLAUDE.md的路由结构示意图]
起步阶段,CLAUDE.md写10到20行就够了。这个文件会随着助理的成长一起演进,不必急着把它写得尽善尽美。87行左右是比较理想的长度,150行,最多不超过200行。
对Agent说「这个文件夹是你作为我的执行助理工作的空间,请在CLAUDE.md里写一段简要说明」,Agent就会自动撰写初始内容。家的地基就这样打好了。
文件夹结构也可以由Agent自动生成。通常会搭出这样一个骨架:
项目根目录/ ├── CLAUDE.md ├── .claude/ │ ├── skills/ │ ├── agents/ │ └── rules/ ├── context/ │ ├── me.md │ ├── work.md │ ├── team.md │ └── priorities.md ├── decisions/ ├── projects/ ├── references/ ├── templates/ └── archives/
[图21-3] 执行助理项目的标准文件夹结构]
每个文件夹的作用从名字就能猜到。context里放用户和工作相关的信息,decisions里记录重要决策,projects里按项目建子文件夹。不用刻意去背这些结构,问Agent一句「这个文件夹是干什么的」,它就会给你解释。
这里有一条实用建议:把这个项目推到GitHub上,在任何设备上都能拉取仓库、直接使用助理。备份、回滚、版本管理全部自动跟上。当然,一开始只在本地做Git提交也完全没问题,GitHub同步以后再说。
第二阶段「生命」:通过访谈构建上下文
往空房子里搬家具、装满冰箱、在墙上挂照片,这就是第二阶段。是Agent了解用户的时间。
这个过程以访谈形式进行。把预先准备好的引导提示词(Onboarding Prompt)发给Agent,Agent就开始提问。「你叫什么名字?」「你的角色是什么?」「你在哪个时区?」从基础问题起步,然后逐步深入到业务内容、团队构成、当前目标、沟通方式。
这里的核心原则是「坦诚,充分」。你回答得越认真,后面「啊,这个也应该早点告诉它」然后反复解释同一段背景的次数就越少。遇到不知道的问题,说一声「跳过」就行,以后随时可以补。
Agent的提问大致覆盖六个方面:
1. 个人信息:姓名、角色、时区、工作风格 2. 业务与工作:公司名称、业务领域、主要产品或服务 3. 团队:核心协作者、职责分工 4. 优先事项与目标:本季度目标、紧急任务、年度方向 5. 沟通偏好:喜欢简洁回复,还是希望详细说明 6. 希望自动化的工作:重复性事务、想要委托出去的任务
访谈结束后,Agent会根据回答生成四个核心文件。
[图21-4] 基于访谈的上下文文件生成流程图]
这些文件保存在context文件夹中。CLAUDE.md也会自动更新,加入类似「需要用户信息时请读取context/me.md」这样的路径指引。
除此之外还会生成一些附加文件。decisions/log.md里记录重要决策,包含日期、决定内容、原因和背景。每个项目文件夹里会放入项目说明文件。.claude/rules/文件夹里保存沟通风格规则,比如不要使用破折号、内部沟通用轻松语气之类的细节指引。
这一切完成后,Agent会执行一次初始Git提交。第一份快照就此保存下来。
有一点需要记住:这些文件不是一成不变的文档。业务方向变了就更新work.md,新成员加入就更新team.md。对Agent说「记一下这个」,相关信息就会写入对应的文件。
第三阶段「手」:创建第一个技能
房子盖好了,生命注入了,现在该装上手。让Agent不只是思考,而是真正能执行任务。
技能(Skill)是可重复使用的指令集。写好一次,随时可以通过斜杠命令或自然语言调用,而且每次都走同一套流程,所以输出的一致性很高。前面讲过工作流(Workflow)的概念,技能可以理解为工作流的另一个名字。工作流里有工具(Tool),技能里有Python脚本。本质相同。
第一个技能做什么好呢?与项目管理工具对接是个实用的选择。把ClickUp、Notion、Asana等你正在使用的工具的API密钥放进.env文件,然后配置一个技能让Agent能跟这些工具通信。
以研究技能为例,看看创建过程。在计划模式(Plan Mode)下对Agent说:「帮我创建一个研究技能。要用Perplexity API。先创建.env文件。这个技能要做的不是简单的网页搜索,而是结合我的业务背景进行有深度的调研。」
Agent会遍历项目结构,必要时启动子Agent(Subagent)来分析结构,然后带着方案回来。方案中包含以下内容:
[图21-5] 技能的基本结构:YAML前置元数据 + 分步指令]
技能文件的结构很清晰。顶部是YAML(YAML Ain't Markup Language)前置元数据,下面是用Markdown写的分步指令。前置元数据里填写技能名称和描述,Agent只读这部分就能判断该调用哪个技能。完整指令要等技能被选中之后才加载。
这种方式叫做渐进式上下文加载(Progressive Context Loading),是防止Token浪费的关键机制。
技能做好之后要验证一下。输入「用研究技能帮我调查一下波特兰的冰淇淋活动」,Agent就会读取技能、调用Perplexity API、整理结果,然后以报告形式保存到research/文件夹。报告里还附有来源链接。
借助子Agent可以节省开支。主Agent用的是Opus模型,但把研究任务委托给子Agent时,可以指定Haiku这样的轻量模型。调研质量由Perplexity API保证,整理和摘要交给轻量模型,质量不降、费用却减少了。
子Agent以Markdown文件的形式保存在.claude/agents/文件夹中,拥有独立的上下文窗口(Context Window),独立运行。
第四阶段「成长」:在日常使用中让助理持续进化
第四阶段没有需要额外配置的东西。每天使用,本身就是第四阶段。
前面提到的那位AI自动化顾问的助手,并非一开始就具备数十项技能和细密的上下文。第一天,整个项目只有一个空文件夹和CLAUDE.md里的一行字。一个月后,这个项目面貌全变了。文档增多了,决策日志积累起来了,技能被逐步添加,智能体的回答精度肉眼可见地提升了。
成长的秘诀在于反馈循环(Feedback Cycle)。调用技能,观察智能体执行的过程,然后告诉它「这里做得好,那里需要改」,智能体就会修改技能文件。头两三次,产出可能还带着AI生成的痕迹。但重复十次、二十次之后,用户的偏好和业务背景就会深深刻入技能之中。
具体的成长策略如下。
迁移现有工具。如果你在ChatGPT的自定义GPT或Claude项目中保存过系统提示词,可以把那些指令拿过来转化为技能。只需对智能体说「把这段提示词做成技能」就行了。
捕捉重复操作。如果同一条指令你下达了两次以上,它就是技能的候选对象。比如你每次都在叮嘱「不要用破折号」,那这条规则写进技能文件或规则文件里一次,远比反复提醒高效。
观察智能体的工作过程。最初几次,你需要盯着智能体执行技能的全过程。如果它在重复不必要的API调用,可以把常用的ID值硬编码到技能文件里,节省模型消耗的token和时间。这种观察与改进的循环,会加速整个系统的成长。
自由添加新文件夹。创建一个品牌素材(Brand Asset)文件夹,把Logo、字体、品牌指南放进去,内容生成技能就能保持品牌一致性。添加文件夹后,对智能体说「我加了brand-assets文件夹,帮我更新CLAUDE.md」即可。
[图21-6] 助手随时间推移的进化曲线:第1天 vs 第30天]
自动记忆功能也值得一用。对智能体说「记住我总是偏好X」,它会把相关内容保存到合适的文件中,在此后的对话里自动调取。
与现有ChatGPT及自定义GPT的差异
在ChatGPT或Claude的网页界面中保存记忆、设置自定义提示词,生产力确实能提升。但存在天花板。当你心想「要是它还能了解这个背景就好了」的时候,最终还是得自己打字补充说明。达到50%的效果很快,但要接近90%就困难了。
差异出现在以下几个方面。
对整个文件系统的访问权限。自定义GPT只能在对话窗口内运作。而基于代码的执行助手可以读写项目文件夹中的所有文件。me.md、work.md、priorities.md、调研报告、决策日志,智能体在需要的时刻直接打开需要的文件。你不必把所有上下文都粘贴到对话框里。
工具执行能力。自定义GPT生成文本。执行助手则能运行Python脚本、调用API、创建文件、启动子智能体。查看日历并自动锁定时段、从ClickUp获取任务状态,这些操作一句话就能完成。
上下文的持久化与结构化。对话一长,就会撞上上下文窗口的限制。执行助手把重要信息拆分成文件永久保存。即使对话被清空,文件依然存在,下一次会话可以直接衔接之前的上下文。等于拥有了一位不会失忆的秘书。
成长潜力。自定义GPT的系统提示词是静态的,必须手动修改。执行助手则随着使用不断积累:文件越来越多,技能越来越精细,决策记录越来越厚。对智能体说「把这次经验记录下来」,下次遇到类似情况时,它就有了做出更好判断的基础。
[图21-7] 传统ChatGPT模式与执行助手模式对比表]
结语
四个阶段按顺序走,节奏可以自己把握。搭建「家」十分钟就够了,注入「生命」的访谈则越用心,后面越省力。第一个技能从小处起步,每天给一两条反馈意见,慢慢把它养大。
这个框架真正的力量,在第三阶段创建的第一个技能每天早上开始实际运转时才会显现。读取日历、检查项目状态、整理出今天该做什么,这个被称为「早间咖啡」的例程如何改变一整天的节奏,可以在接下来的篇章中一探究竟。
人工智能专家 金京镇律师
AI法律政策专家 · 前国会议员 · 著作等身
如果这本书曾在你身边短暂停留,请支持我们,让下一个故事得以问世。
(自愿赞助账户:农协 302-1096-0948-81 户名:金京镇)
