AI书房

AI书房

用书来读懂AI

这里收录金京镇律师的AI、法律、产业、历史、政治、文化主题在线书。每本书都按目录、序言、章节、尾声整理,方便连续阅读。

2026北京:两个巨人的危险之舞 封面

16篇公开

2026北京:两个巨人的危险之舞

金景珍律师

特朗普-习近平峰会,以及其中发生的事. 目录、序言、13章、结语

本书从霍尔木兹、稀土、台湾、波音、大豆、AI芯片这些场景,追踪特朗普的北京之行。

分享

FacebookXLinkedInThreads
把工作交给AI,然后离开座位 封面

27篇公开

把工作交给AI,然后离开座位

金京镇律师

YOLO模式完全入门. 目录和26章

一本面向初学者的在线书,讲解Claude Code和Codex中的YOLO模式。它说明如何让AI读取文件、编写代码、执行命令,并把回退、Docker沙盒和安全检查放在手边。

分享

FacebookXLinkedInThreads
《AI向人类提出的10个问题》封面

12篇文章

《AI向人类提出的10个问题》

金京镇

目录、序言、10章

《AI向人类提出的10个问题》是金京镇在AI书房公开的在线书。本书围绕AI责任、全球监视、人工智能武器、深度伪造、工作消失、能源、数据和人类身份,整理人工智能正在逼问人类的十个问题。

分享

FacebookXLinkedInThreads
《人工智能AI走上法庭》封面

26篇文章

《人工智能AI走上法庭》

金京镇律师

目录、序言、21章、3篇附录

《人工智能AI走上法庭》是金京镇律师在AI书房公开的在线书。本书从生成式AI训练数据、版权、声音克隆、深度伪造、自动驾驶、医疗和金融算法等争议出发,整理人工智能进入法院之后正在形成的法律前线。

分享

FacebookXLinkedInThreads
《人工智能与社会结构变迁》封面

16篇文章

《人工智能与社会结构变迁》

金京镇

目录、序言、13章、尾声

《人工智能与社会结构变迁》是金京镇在AI书房公开的在线书。本书从劳动、教育、不平等、城市、能源、网络安全、人际关系和民主制度出发,记录AI正在改写社会结构的过程。

分享

FacebookXLinkedInThreads
《2026年美国伊朗战争与全球能源危机》封面

39篇文章

《2026年美国伊朗战争与全球能源危机》

金京镇

目录、序章、36章、尾声

《2026年美国伊朗战争与全球能源危机》是金京镇在AI书房公开的在线书。本书从霍尔木兹海峡、海上保险、石油价格、液化天然气、粮食、美元秩序和韩国能源安全出发,追踪一场战争如何改变全球能源流动。

分享

FacebookXLinkedInThreads
《德米斯·哈萨比斯,谷歌人工智能之父》封面

34篇文章

《德米斯·哈萨比斯,谷歌人工智能之父》

金京镇

目录、序言、31章、尾声

《德米斯·哈萨比斯,谷歌人工智能之父》是金京镇在AI书房公开的在线书。本书沿着哈萨比斯从伦敦童年、国际象棋、游戏开发、脑科学、DeepMind、AlphaGo到AlphaFold的道路,记录人工智能如何进入科学发现的核心。

分享

FacebookXLinkedInThreads
Nano Banana Pro实战提示词手册 cover

24篇文章

Nano Banana Pro实战提示词手册

金京镇

6部、22章、课堂提示词附录

这本在线书围绕Nano Banana Pro的图像生成、编辑、文字渲染、角色一致性、工作场景和变现方法展开,方便课堂和实际工作直接使用。

分享

FacebookXLinkedInThreads
军事人工智能 cover

共17篇公开

军事人工智能

金京镇、金元泰

目录、序言、14章、尾声

一部系统梳理军事人工智能的长篇著作,涵盖自主武器、无人机、指挥控制、后勤、网络防御,以及美国、中国、以色列、韩国和全球国防AI企业的战略与实践。

分享

FacebookXLinkedInThreads
《读脑者:Neuralink与人类最后的革命》封面

21篇文章

《读脑者:Neuralink与人类最后的革命》

金京镇

目录、序章、18章、尾声

《读脑者:Neuralink与人类最后的革命》是金京镇在AI书房公开的在线书。本书追踪Neuralink、脑机接口、脑数据、医疗革命、神经权利和人类增强,记录人类大脑开始连接机器之后的法律与文明问题。

分享

FacebookXLinkedInThreads
《格鲁吉亚历史文化旅行》封面

24篇文章

《格鲁吉亚历史文化旅行》

金京镇

目录、序言、17章、4篇附录、尾声

《格鲁吉亚历史文化旅行》是金京镇在AI书房公开的在线书。本书从第比利斯、卡赫季、卡兹别克、高加索雪山、八千年葡萄酒、东正教、民主化、战争和旅行路线出发,记录格鲁吉亚的历史与现实。

分享

FacebookXLinkedInThreads
《一千个祈祷,一座山:读懂亚美尼亚》封面

13篇文章

《一千个祈祷,一座山:读懂亚美尼亚》

金京镇

目录、序言、10章、尾声

《一千个祈祷,一座山:读懂亚美尼亚》是金京镇在AI书房公开的在线书。本书从亚美尼亚高原、亚拉腊山、古代王国、世界第一个基督教国家、中世纪修道院、现代悲剧、离散社群和旅行指南出发,阅读亚美尼亚。

分享

FacebookXLinkedInThreads
从卖茶少年到总理 cover

共13篇公开

从卖茶少年到总理

金京镇

目录、序言、10章、尾声

一部政治传记,追踪纳伦德拉·莫迪从瓦德讷格尔卖茶少年、RSS组织者、古吉拉特邦首席部长到三任印度总理的轨迹,并由此理解现代印度、韩印关系与崛起大国的风险。

分享

FacebookXLinkedInThreads
《马来西亚:掌控马六甲海峡者掌控世界》封面

23篇文章

《马来西亚:掌控马六甲海峡者掌控世界》

金京镇

目录、序言、20章、尾声

《马来西亚:掌控马六甲海峡者掌控世界》是金京镇在AI书房公开的在线书。本书从马来半岛、马六甲王国、殖民地、联邦君主制、法律制度、城市旅行和产业结构出发,阅读马来西亚的地缘价值。

分享

FacebookXLinkedInThreads
《韩东勋留给韩国的那些痕迹》封面

13篇文章

《韩东勋留给韩国的那些痕迹》

金京镇

目录、12章

《韩东勋留给韩国的那些痕迹》是金京镇在AI书房公开的在线书。本书围绕韩东勋、韩国政治、法务部、检察改革、政治记录和受害者救济,整理他在韩国社会与国家制度中留下的公共足迹。

分享

FacebookXLinkedInThreads
《AI课堂,成绩将会改变》封面

26篇文章

《AI课堂,成绩将会改变》

金京镇

目录、序言、24节

金京镇AI书房在线图书,说明AI如何支持小学、初中、高中学习、教学、评价和教育公平。

分享

FacebookXLinkedInThreads
《PALANTIR:战争、监视与人工智能》封面

16篇文章

《PALANTIR:战争、监视与人工智能》

金京镇律师

目录、序言、14章

《PALANTIR:战争、监视与人工智能》是金京镇律师在AI书房公开的在线书。本书从PayPal黑帮、9·11之后的情报失败、乌克兰战场、五角大楼改革和预测性治安出发,追踪数据公司如何进入国家安全与企业决策的核心。

分享

FacebookXLinkedInThreads
超越玻璃天花板 cover

共39篇公开

超越玻璃天花板

金京镇

目录、序章、31章、尾声、5篇附录

一部追踪高市早苗从奈良成长、进入政坛、三次挑战自民党总裁并成为日本首位女性首相的政治传记。

分享

FacebookXLinkedInThreads
《韩东勋的故事》封面

39篇文章

《韩东勋的故事》

金京镇

目录、序章、36章、尾声

《韩东勋的故事》是金京镇在AI书房公开的在线书。本书从戒严之夜、检察官生涯、法务行政、政治选择、民生现场和个人面貌出发,记录韩东勋在韩国公共生活中的轨迹。

分享

FacebookXLinkedInThreads
人工智能选举 cover

14篇文章

人工智能选举

金京镇

目录、作者序、11章、结语

这本在线书写竞选信息、宣传材料、数字竞选、数据分析、团队运营、虚假信息防御、法律风险和可直接使用的提示词。

分享

FacebookXLinkedInThreads
《人工智能战斗机,人工智能空军》封面

43篇文章

《人工智能战斗机,人工智能空军》

金京镇

目录、序言、40章、尾声

《人工智能战斗机,人工智能空军》是金京镇在AI书房公开的在线书。本书围绕AI战斗机、无人作战飞机、CCA、MUM-T、第六代战斗机和未来空军,记录人工智能正在怎样改变空战、国防产业和军事伦理。

分享

FacebookXLinkedInThreads
山姆·奥特曼传:人工智能革命的开拓者 cover

22篇文章

山姆·奥特曼传:人工智能革命的开拓者

金京镇、金京兰

目录、序言、7部、20章

这本在线传记写山姆·奥特曼的成长、创业、Y Combinator、OpenAI、ChatGPT、董事会风波,以及他在人工智能时代承担的责任。

分享

FacebookXLinkedInThreads
关于北极航道的七个误解封面

10篇文章

关于北极航道的七个误解

金京镇

目录、序言、7章、尾声

金京镇AI书房在线图书,梳理关于北极航道的速度、定期航线、保险、安全规则、全年通航、碳减排和基础设施的七个常见误解。

分享

FacebookXLinkedInThreads
《世界各国在行政领域引入人工智能的案例》封面

25篇文章

《世界各国在行政领域引入人工智能的案例》

金京镇

目录、23章、尾声

金京镇AI书房在线图书,介绍公共部门AI导入、各国战略、行政服务、治理框架与未来政策课题。

分享

FacebookXLinkedInThreads
《Claude Cowork与智能体使用手册》封面

11篇文章

《Claude Cowork与智能体使用手册》

金京镇

目录、序言、8章、尾声

《Claude Cowork与智能体使用手册》是金京镇在AI书房公开的在线书。本书整理文件整理、财务数据、营销销售、研究、沟通、人事法务、软件开发和系统联动自动化场景。

分享

FacebookXLinkedInThreads
《Claude Code完全掌握》封面

41篇文章

《Claude Code完全掌握》

金京镇

目录、40章

《Claude Code完全掌握》是金京镇在AI书房公开的在线书。本书围绕Claude Code、智能体工作流、MCP、技能、部署、GitHub、自动化和商业化,整理把AI从聊天工具变成工作系统的方法。

分享

FacebookXLinkedInThreads
《黄仁勋的故事》封面

16篇文章

《黄仁勋的故事》

金京镇

目录、序言、13章、尾声

《黄仁勋的故事》是金京镇在AI书房公开的在线书。本书沿着黄仁勋的移民经历、NVIDIA创业、GPU革命、CUDA生态、AI工厂和物理AI,记录一位企业家如何站到人工智能产业的中心。

分享

FacebookXLinkedInThreads
法律实务与人工智能封面

16篇文章

法律实务与人工智能

金京镇

目录、序言、14部

金京镇AI书房在线图书,从律师实务角度整理法律检索、文书起草、证据分析、合同审查、NotebookLM以及生成式AI工作流程。

分享

FacebookXLinkedInThreads
您好,我是金京镇封面

10篇文章

您好,我是金京镇

金京镇

目录、序言、推荐语、6章、结语

金京镇AI书房在线图书。内容涵盖成长经历、科技议政活动、议员外交、立法斗争、东大门愿景以及韩国人口断崖的解决方案。

分享

FacebookXLinkedInThreads

[AI书房] 第11章 检索增强生成与语义存储:构建长期记忆

Claude Code完全掌握
Author
金京镇
Date
2026-05-06 13:03
Views
64

Claude Code完全掌握

Claude Code完全掌握

第11章 检索增强生成与语义存储:构建长期记忆

金京镇

引言

我把一份68页的吸尘器使用手册PDF丢给Claude Code,问它:「告诉我怎么清洗滤芯。」智能体短暂检索之后,用文字逐步讲解了操作方法。文字下方还附上了手册里的拆解示意图。物理设备的操作说明,图比文字清楚得多,这个判断是智能体自己做出的。

68页的文档不可能一次性塞进智能体的阅读范围,它是怎么从正确的页面找到正确信息的?秘密就在于检索增强生成(Retrieval-Augmented Generation,RAG)。

什么是检索增强生成

AI智能体有一个天生的短板:训练数据里没有的信息,它就不知道。公司内部手册、上周写的会议纪要、今天早上拍的现场照片,这些数据根本不存在于模型的训练过程中。把所有文档塞进一次阅读范围也是一种办法,但文档超过几十页,就会撞上模型的token上限。

检索增强生成是绕过这个问题的一套架构,由三个步骤组成。

检索(Retrieval),,从外部数据存储中找出与用户问题相关的信息。不是通读整份文档,而是只挑出与问题对应的片段。

增强(Augmentation),,把检索到的片段附加到智能体的提示词中。智能体现在可以像「刚刚读过」一样使用这些原本不知道的信息。

生成(Generation),,基于增强后的上下文生成回答。智能体的推理能力与外部数据结合,产出单靠自身无法达到的回答质量。

[图11-1] 检索增强生成的三个步骤:检索 → 增强 → 生成 流程图]

打个比方,这就像开卷考试。学生(智能体)不需要背下所有课本。考试时能翻开需要的那一页就够了。不过,快速判断该翻哪一页,再把页面上的信息和自己的知识融合起来写出答案,这仍然是学生自己的能力。

在检索增强生成中,决定「该翻哪一页」的技术,就是嵌入(Embedding)。

嵌入的概念

嵌入是将文本转换为数值向量(Vector)的过程。「向量」这个词听着有点数学味,但核心很好懂:用一串数字来表达一句话的含义。

「好想喝杯咖啡」和「想点一杯拿铁」,用词不同,意思却接近。嵌入模型(Embedding Model)会把这两句话转换成相近的数值向量。而「今天股市下跌了」则会被转换成完全不同的向量,因为含义不同。

把这些向量放到多维空间里,含义相近的句子会聚在一起,含义不同的句子会彼此远离。这就是基于语义相似度(Semantic Similarity)检索的原理。用户问「滤芯清洗方法」,系统先把这个问题转换成向量,再从预先存好的文档片段向量中找出距离最近的那些。

关键词不需要完全匹配,只要语义相通就能检索到。文档里写的是「集尘器清洗流程」,照样能被「滤芯清洗方法」这个问题命中。

[图11-2] 嵌入空间中语义相近的句子聚成簇的可视化]

在检索增强生成中,嵌入承担的角色可以这样理解:先把文档切成小片段(chunk);每个片段通过嵌入模型转换成向量;把向量存入数据库;有问题进来时,问题也被转换成向量;从已存的向量中找到离问题向量最近的那些,交给智能体。

使用Google Gemini多模态嵌入

到这里为止,讲的都是文本。但现实中的数据不只有文本。手册里有拆解示意图,现场报告里附着照片,培训资料里包含视频。

Google推出的Gemini Embedding 2是一个多模态嵌入模型(Multimodal Embedding Model),能把文本、图像、视频、音频全部放进同一个向量空间。

用几个具体场景来看看这个模型带来了什么变化。

吸尘器手册场景,,把68页PDF整体嵌入。不只是文本片段,示意图也被转换成向量。问「滤芯清洗方法」,返回的结果既有文字说明,也有对应的示意图。光看文字很难定位的零件位置,通过图片一目了然。

屋顶维修公司场景,,把过去的13张施工照片嵌入。每张照片关联了费用、工期、投入人数等元数据(Metadata)。上传一张新的屋顶照片,系统返回五个相似的历史施工案例,附带相似度评分,可以作为报价参考。

[图11-3] 多模态嵌入空间:文本、图像、视频按语义分布的2D可视化]

多模态嵌入真正厉害的地方在于,不同类型的数据共存于同一个空间。笑脸薯条的照片落在「食物」区域,弹吉他的金毛犬视频落在「娱乐」区域,Claude Code使用演示视频落在「技术」区域。数据类型不同,AI照样能识别语义,把它们放到正确的位置。如果所有数据都是屋顶照片,系统会自动按水灾损坏、老化、结构缺陷等细分类别归类。

截至目前,视频支持120秒以内的MP4或MOV文件,图像每次请求最多处理6张PNG或JPEG。音频同样支持;对于音频,提供准确的描述性元数据可以提高检索精度。

Pinecone语义存储实战演练

嵌入后的向量需要存在某个地方,并且能被检索。这个存储介质就是向量数据库(Vector Database),Pinecone是目前使用最广泛的向量数据库服务之一。

整个实战流程如下。

第一步:环境准备

在VS Code中新建一个文件夹,打开Claude Code。切换到规划模式(Plan Mode),对智能体下达指令:

「用Google Gemini的新Embedding 2模型,搭建一个可以往Pinecone向量数据库中存储和检索文本、图像、视频的系统。在.env文件里预留Pinecone API密钥、Gemini API密钥和OpenRouter API密钥的位置。」

智能体会设计项目结构、整理依赖列表、给出分步计划。

一共需要三个API密钥。Pinecone用于访问向量存储,Gemini用于调用嵌入模型,OpenRouter用于调用聊天模型(生成回答)。Pinecone可以从免费Starter方案起步,Gemini API密钥在Google AI Studio申请,OpenRouter是一个通过单一API访问多种模型的服务。

第二步:数据嵌入

在.env文件中填入三个密钥并保存。把要嵌入的文件放进data文件夹,文本文件、图像、视频可以混在一起。告诉智能体「数据准备好了,存进Pinecone吧」,智能体就会在Pinecone中创建索引,把每个文件嵌入后存储进去。

这个过程中智能体做的事情是:自动识别每个文件的类型,选择合适的嵌入方式。文本被切成片段后嵌入,图像的视觉语义被转换成向量,视频的画面和音频经过分析后也被转换成向量。

[图11-4] 实战流水线:原始文件 → 嵌入模型 → Pinecone索引]

第三步:搭建聊天界面

告诉智能体「帮我做一个可以在本机验证的聊天Web应用」。智能体会构建一个Web应用并在localhost上运行。在浏览器里输入问题,系统从Pinecone检索相关向量,再根据检索结果生成回答。

实际验证时,问「怎样获取workflow客户?」,系统会从文本文件中找到相关内容并作答。说「给我看弹吉他的金毛犬视频」,系统找到那段视频的元数据,在页面内嵌播放。

第四步:迭代改进

第一次的结果未必完美。可能图片没有返回,也可能视频描述不够充分。这时把问题告诉智能体,它会补充元数据或修改应用。说「给视频加上更好的描述,重新嵌入」,智能体就会删掉旧向量,用改进后的元数据重新存储。

整个过程在30分钟内完成。如果用n8n这类无代码工具搭建同样的多模态向量存储,往往需要数小时甚至数天。因为分块(Chunking)策略设计、图像捕获与存储方式配置、检索结果格式化,全部要手动完成。Claude Code只靠自然语言指令就能搞定这一切。

检索增强生成为智能体工作流带来的变化

没有检索增强生成的智能体,只能在自身训练数据的范围内作答。它只参考一次性读入窗口内的信息,窗口之外的世界对它而言等于不存在。

装备了检索增强生成的智能体则不同。它能读取公司那份68页的操作手册,能检索数百张施工照片档案,能从上季度的会议纪要中找到某项决策的来龙去脉。智能体的知识边界从训练数据的围墙,扩展到了组织所拥有的全部数据。

在智能体工作流中,检索增强生成有多种应用场景。

客户支持自动化,,将产品手册和FAQ做嵌入处理后,针对客户提问生成引用了精确页码和图片的回答。遇到「之前有没有类似的咨询?」这种问题,还能检索历史工单记录来作答。

内部知识管理,,将团队的项目文档、决策日志、品牌规范做嵌入处理。新入职的同事问「我们公司Logo的使用规则是什么?」,系统就能从品牌规范中定位到对应章节并给出回答。

科研辅助,,将论文、报告、市场调研资料做嵌入处理。问一句「这个领域最近有什么动向?」,系统就能检索相关资料并生成摘要,同时附上原始出处和置信度评分,方便核实。

[图11-5] 检索增强生成应用前后智能体知识范围对比示意图]

这里的关键在于领域专业知识(Subject Matter Expertise)的作用。比起搭建检索增强生成管道的技术能力,「用什么数据、怎么描述数据」才是决定结果质量的核心。正如屋顶维修案例所展示的,照片附带的元数据越贫乏,检索结果就越贫乏。

一张标注了「这是一栋使用10年的沥青瓦屋顶遭受冰雹损害的案例,维修费用450万韩元,工期3天」的照片,和一张只打了「屋顶照片」标签的照片,两者的检索价值完全不在一个量级。

技术实现能力的价值正在缩减。我们已经看到,n8n上需要数天才能搭好的管道,Claude Code在30分钟内就建完了。拼装JSON请求体、配置HTTP调用这些技术细节,交给智能体处理就行。而清晰描述流程的能力、准确刻画数据含义的能力、发现漏洞并明确指出的能力,仍然属于人的领地。

赋予智能体长期记忆,说到底就是给它接上一个数据库。那么接下来,我们看看如何赋予智能体可反复执行的熟练技能。教会它一次,它就能随时以同样的品质执行,,一种可复用的行为模式。

人工智能专家 金京镇律师

AI法律政策专家 · 前国会议员 · 著有多部作品

如果这本书曾在您身边停留片刻,请支持我们,让下一个故事得以问世。

(自愿赞助账户:农协 302-1096-0948-81 户名:金京镇)

金京镇

律师 · 前国会议员 · AI政策研究者

kimkj.com

© 2026 金京镇. All rights reserved.

#金京镇 #AI书房 #ClaudeCode #智能体 #AI工作流 #MCP #GitHub #自动化 #Vercel #AI商业化
滚动至顶部
kimkj.com 首页