AI书房
用书来读懂AI
这里收录金京镇律师的AI、法律、产业、历史、政治、文化主题在线书。每本书都按目录、序言、章节、尾声整理,方便连续阅读。
[AI书房] 第2章 教育现场的变化与适应
人工智能与社会结构变迁
第2章 教育现场的变化与适应
金京镇
1. 死记硬背式教育的终结与以提问为核心的教育转型
2026年春天,首尔江南区一所小学的教室里,一个十一岁的女孩盯着平板电脑屏幕。屏幕上,AI导师抛出了一个问题:「如果罗马帝国有了电力,奴隶经济会发生怎样的变化?」女孩想了大约三十秒,反过来问机器:「奴隶减少的话,斗兽场的观众席是谁来建的?」机器在0.8秒内展开了三条建筑劳动力的替代路径,女孩选了其中一条,继续追问下去。这个场景里没有任何需要背诵的东西。罗马灭亡的年份、斗兽场的高度,机器里全都有。女孩做的,是机器自己做不到的事,从意想不到的角度抛出问题。
哈佛大学物理系2025年的实验为这个场景提供了数据支撑。使用AI导师的学生掌握的知识量是传统主动学习课堂学生的两倍以上,用时反而更短。同年的全球调查显示,学生使用AI的比例从前一年的66%跃升至92%。截至2026年初,据估算86%的高等教育学生已将AI作为主要的研究和头脑风暴伙伴。课堂的重心已经倾斜了,从传递信息的场所,变成了设计问题的场所。
Google DeepMind的Demis Hassabis认为,人工智能具备人类全部认知能力的时间点将在五到十年内到来。AlphaFold已经在蛋白质结构预测上开始破解疾病治疗和能源问题的线索,这是他的论据。在这样的环境下,课堂上学生该做的不是背标准答案,而是构思能引导机器给出最优解的问题,并从机器给出的答案中辨别哪些可用、哪些是胡说。苏格拉底2500年前展示的原理,披上了技术的外衣回来了。答案不是思考的本质,问题才是。
问题在于,评价体系没有跟上这一转变。用标准化试卷填写正确答案的方式,无法衡量与人工智能协作解决复杂问题的能力。UNESCO调查显示,全球450多所学校和大学中,制定了AI使用指南的只有区区10%。试卷停留在20世纪,学生手握21世纪的工具,教师则在两者之间找不到方向。从拥有知识的时代过渡到运用知识的时代,需要的不是沿着既定路线顺从前行的惯性,而是探索新路径的好奇心。截至2026年初,仅美国就新增了193个AI相关本科项目和310个硕士项目,卡内基梅隆大学早在2018年就率先开设了AI本科学位。UCSD为新设的AI专业招收了150名新生,计划到2029年扩展到1000名本科生的规模。大学已经嗅到了变化的气息。但如果教育无法回应这一需求,学校就会变成博物馆。
2. 大学学历溢价减半与简历时代的终结
2026年4月,盖洛普、沃尔顿家族基金会和GSV Ventures联合发布了一份名为「AI悖论(The AI Paradox)」的报告,用数字捕捉了Z世代的心理状态。对AI感到兴奋的比例从前一年的36%暴跌至22%,感到愤怒的比例则从22%飙升至31%。表示抱有希望的比例从27%降到了18%。情绪最激烈的年龄段是刚毕业或即将毕业的20岁出头的年轻人。盖洛普首席教育研究员Zach Hrynowski这样解读:「这是一个交了四年学费拿到毕业证,却发现AI正在颠覆自己所在行业的世代。」
这种愤怒有据可依。2025年底的调查结果显示,AI相关技能能带来23%的薪资溢价,而学士学位带来的溢价仅为8%。81%的雇主认为应该把技能放在学历前面,但52%仍然选择录用有学位的人,因为觉得风险更低。这组矛盾的数据精确地标定了大学学历的当前位置:作为信号的价值仍在,但这个信号的性价比正在快速下降。
Hashed的金瑞准代表诊断说,大学长期垄断的三项功能正在逐一剥离:信息、人脉、筛选。过去,这三者捆绑在同一个套餐里。信息方面,MIT OpenCourseWare、YouTube、GitHub已经开始替代;人脉方面,开源社区和黑客马拉松正在创造新的握手方式;筛选方面,GitHub的Star数和实际用户量在某些场景下成了比4.5绩点更高分辨率的信号。金代表坦言,看到他所接触的开发特色高中出身人才的成长速度,确实让人不得不认真反思大学是否仍然是最优的默认选项。
Michael Spence的信号理论在这里值得重新审视。教育之所以有价值,不是因为它直接提升了生产力,而是因为本身生产力就高的人需要用学历来证明这一点。如果这个模型成立,学位就不是学习的证据,而是学习能力的信号。一旦出现更快、更便宜、更难伪造的信号,学位的价格就会被削减。IBM、苹果、谷歌在部分岗位取消学历要求,不是在否定教育的价值,而是因为学历原本衡量的东西现在可以被更直接地衡量了。Peter Thiel把大学称为泡沫,根源是同一个问题意识:价格超过价值的状态能永远维持吗?在美国学生贷款总额突破一万亿美元的现实面前,这个问题不是修辞,而是会计。
高盛报告预测的未来十年3亿个岗位被自动化吸纳,让这个问题更加尖锐。新员工从事的重复性、结构化工作正在快速移交给机器智能,前辈带后辈、在实践中逐步积累技能的师徒式路径正在断裂。比起简历上漂亮的学历,能用AI工具即时产出成果的能力,正在成为招聘的核心标尺。简历需要从罗列过去成就的文件,转变为证明自己能与机器协作解决未来复杂问题的作品集。大学更本质的问题在于时间结构:把成长最快阶段的人才,锁在几十年前的范式编排的课程表和期中、期末考试的节奏里。借用金瑞准代表的话说:「把高速巴士停在毕业证这个站台的那一刻,重新汇入主车道可能要再花四年。」
3. 补习班存在理由的变化:从提高成绩到管理焦虑
晚上十点,大峙洞补习街的灯火依旧通明。穿梭于楼宇之间的家长们脸上带着一种微妙的焦躁,但焦躁的性质变了。五年前的担心是「孩子数学能不能拿到一等?」,现在变成了「等这孩子毕业的时候,这个职业还存在吗?」。学费收据上的科目仍然写着语文、英语、数学,但实际购买的商品是焦虑的缓解。孩子的未来越不透明,报班就越像是心理保险,而非理性投资。
金瑞准代表在「30道裂缝」备忘录中用冷峻的语言概括了这一现象:「Agent导师能实时分析每个学生的薄弱环节。但补习班真正卖的是孩子托管和家长焦虑管理,一个卖安心而非成绩的行业,Agent很难撼动。」四个AI模型独立评估的三年内实现概率为45%。技术上足以替代补习班的核心功能,但补习班真正售卖的产品,即心理保险,机器无法提供。
2026年盖洛普调查测量了这种焦虑的温度。Z世代K-12学生中,74%回答「AI有可能让学习变得更困难」;已经步入职场的Z世代成年人中,83%表达了同样的担忧。相信AI能加快学习速度的比例从前一年的53%降至46%。家长们的焦虑是这些数字投下的影子。眼看着子女一代感受到的不确定性,报班成了唯一能抓住的行动。
1830年代的纽约,Benjamin Day创办的『纽约太阳报(The Sun)』通过刺激大众的焦虑和好奇心来赚取广告收入,开创了注意力经济的原型。补习街的运作逻辑,接近于把这套结构翻译成教育的语言。将「在机器智能代劳一切的时代,人类仍有不可替代之处」这一希望商品化,每当这种希望动摇,就推出新的课程。编程教育流行就开编程班,提示词工程成为话题就开提示词班。内容在变,结构不变:感知家长的焦虑,给焦虑贴上标签,再把贴了标签的焦虑转化为学费。
当教育的目的不再是一个人的成长,而是沦为在平台竞争社会中求生存的零件加工时,补习班就不再是提高成绩的场所,而是一个庞大的焦虑管理中心。这种结构危险的原因很清楚:焦虑是无法被消除的。机器智能越发展,焦虑的总量就越大,补习费的总额也随之膨胀。孩子的能力提升了多少并不重要,家长感受到的焦虑是否减轻了,才是续费的标准。就像斯金纳箱里的鸽子对间歇性奖励做出反应不断按按钮一样,家长们对焦虑这一刺激做出反应,涌向补习街。补习街的营收与教育成果无关,与焦虑的总量成正比。而人工智能越发展,焦虑的源头就越不会枯竭。
4. 过滤AI输出错误的能力为何至关重要
2026年4月ICLR学会上发表的论文「推理陷阱(The Reasoning Trap)」揭示了一个令人不安的事实:模型的推理能力越强,工具幻觉(tool hallucination)的比例也随之上升。越聪明,就越能把错的说得像真的。考虑到已有96%的企业将AI智能体投入实际业务,这几乎是一声警报。
数据很具体。截至2026年,针对37个模型的基准测试中,幻觉率分布在15%到52%之间。在医疗病例摘要中,未使用缓解提示时幻觉率高达64.1%,即使应用了缓解技术也只能降到43%。法律领域更为严峻。据斯坦福监管研究所的研究,大型语言模型在具体法律问题上产生幻觉的概率为69%至88%。换言之,四次回答中有三次会捏造不存在的判例或歪曲法条。
伦敦一家大型律所的律师Sarah Lawden的日常工作是这些数字的现实版本。她惊叹于AI能在几分钟内分析三年的WhatsApp聊天记录和大量会议纪要的速度,但她从不盲信机器给出的答案。在法律服务中,机器的一个小错误可能直接导致客户机密泄露或法律特权被损害。她工作时间中相当一部分用于核验机器生成的文件是否具备法律效力、是否符合个人信息保护法规。重心已经从生产(production)转移到了审校(editing)和验证(verification)。
金瑞准代表在提示词基准测试随笔中把这种能力想象成考试的形式。最难的部分是给出一份故意埋入缺陷的AI输出,要求考生找出其中的错误。「看似合理却微妙地出了偏差的分析,逻辑自洽却前提错误的推理。把AI自信满满地端出来的错误答案照单全收,这是这个时代最危险的陷阱,而过滤这些错误的能力才是提示词能力真正的核心。」2026年CHI学会上发表了一项针对48名10至14岁儿童的幻觉识别教育实验。让孩子们亲手搭建AI聊天机器人,同时提供幻觉检测的脚手架,前后测试显示,他们的AI知识、幻觉识别能力和构建可信聊天机器人的信心都有了显著提升。孩子们自发地发展出了搜索不一致之处并与外部来源交叉验证的多层策略。
比解复杂公式更重要的,是验证机器给出的答案是否站得住脚。这将成为与人工智能共存时代新的知识权威。因为对机器输出承担责任的主体,只有人类。机器是出色的助手,但不能成为做决定的主体。守住这条边界的能力,将成为专业人士新的资质。哪怕幻觉率17%的顶级模型,每六次回答中仍有一次出错。在这个现实面前,不加验证地全盘接受就是职业自杀。
5. 提示词能力测评将催生新的教育不平等
同样的ChatGPT,同样的模型,同样的价格,有人只拿到一行摘要,有人却提取出论文级别的分析。制造这种差距的,就是提示词能力。金瑞准代表确信这将成为21世纪最重要的生产力指标。而这里面藏着一道令人不安的阴影。
提示词能力与批判性思维、问题结构化能力、元认知深度紧密相连。这些能力在很大程度上取决于教育环境和文化资本。要提出好问题,首先得见过好问题。输入「帮我制定营销策略」的人,得到的是博客帖子水平的泛泛之谈。从目标客户的心理画像到竞品定位图谱,再到分渠道ROI假设,层层结构化地抛出的人,得到的是一份可执行的战略文档。这个差距随着模型变强而拉大。工具的天花板越高,操控工具的那双手之间的差异就被指数级放大。
据向联合国大会报告的数据,全球有118个国家在人工智能竞赛中完全落后,三分之一的人口连基本的互联网都用不上。富裕国家的学生使用先进模型和无限算力磨练提示词技术,发展中国家的学生却还在为电力供应和网速发愁。在AI技能能带来23%薪资溢价的世界里,提示词能力可能不是阶层流动的阶梯,而是又一堵歧视的墙。
韩国的情况没有不同。2026年盖洛普调查中,Z世代职场人士的48%认为在工作中使用AI的风险大于收益,比前一年的37%猛增了11个百分点。信任AI辅助完成的工作的人不到十分之三,信任完全由AI完成的工作的人几乎为零。一个有意思的悖论是:对技术的不信任越强烈,那些能熟练驾驭这项技术的少数人的溢价就越高。多数人回避的工具,在少数人手里被用得游刃有余,市场就会给他们标上更高的价格。
金瑞准代表拿『龙珠』里的战斗力探测器来打比方。「战斗力5,垃圾。」粗糙但强大的数字,把复杂战斗能力的所有维度压缩成一个数值,让即时判断成为可能。不是高考分数或学历,而是一个能预测这个人与AI协作时输出质量的数字,很快就会被需要。这场考试当然是开卷的,使用AI是前提。不让用AI来衡量能力,就像不让用计算器来测数学水平一样不合时宜。
不过真正的问题也许不在分数本身。基准测试归根结底是社会「看重什么」的一面镜子。正因为有了高考,韩国社会重视记忆力和解题速度,补习产业围绕这一衡量标准长成了庞然大物。一旦提示词基准测试出现,教育、招聘、晋升的标准都将在它之上重新排列。测量塑造现实。那么,这个新的衡量标准造就的世界,真的会比现在更公平吗?在差距不是线性而是指数级扩大的结构里,对这个问题保持乐观,很难。