AI书房

AI书房

用书来读懂AI

这里收录金京镇律师的AI、法律、产业、历史、政治、文化主题在线书。每本书都按目录、序言、章节、尾声整理,方便连续阅读。

把工作交给AI,然后离开座位 封面

27篇公开

把工作交给AI,然后离开座位

金京镇律师

YOLO模式完全入门. 目录和26章

一本面向初学者的在线书,讲解Claude Code和Codex中的YOLO模式。它说明如何让AI读取文件、编写代码、执行命令,并把回退、Docker沙盒和安全检查放在手边。

分享

Facebook X LinkedIn Threads
《AI向人类提出的10个问题》封面

12篇文章

《AI向人类提出的10个问题》

金京镇

目录、序言、10章

《AI向人类提出的10个问题》是金京镇在AI书房公开的在线书。本书围绕AI责任、全球监视、人工智能武器、深度伪造、工作消失、能源、数据和人类身份,整理人工智能正在逼问人类的十个问题。

Facebook X LinkedIn Threads Telegram
《人工智能AI走上法庭》封面

26篇文章

《人工智能AI走上法庭》

金京镇律师

目录、序言、21章、3篇附录

《人工智能AI走上法庭》是金京镇律师在AI书房公开的在线书。本书从生成式AI训练数据、版权、声音克隆、深度伪造、自动驾驶、医疗和金融算法等争议出发,整理人工智能进入法院之后正在形成的法律前线。

Facebook X LinkedIn Threads Telegram
《人工智能与社会结构变迁》封面

16篇文章

《人工智能与社会结构变迁》

金京镇

目录、序言、13章、尾声

《人工智能与社会结构变迁》是金京镇在AI书房公开的在线书。本书从劳动、教育、不平等、城市、能源、网络安全、人际关系和民主制度出发,记录AI正在改写社会结构的过程。

Facebook X LinkedIn Threads Telegram
《2026年美国伊朗战争与全球能源危机》封面

39篇文章

《2026年美国伊朗战争与全球能源危机》

金京镇

目录、序章、36章、尾声

《2026年美国伊朗战争与全球能源危机》是金京镇在AI书房公开的在线书。本书从霍尔木兹海峡、海上保险、石油价格、液化天然气、粮食、美元秩序和韩国能源安全出发,追踪一场战争如何改变全球能源流动。

Facebook X LinkedIn Threads Telegram
《德米斯·哈萨比斯,谷歌人工智能之父》封面

34篇文章

《德米斯·哈萨比斯,谷歌人工智能之父》

金京镇

目录、序言、31章、尾声

《德米斯·哈萨比斯,谷歌人工智能之父》是金京镇在AI书房公开的在线书。本书沿着哈萨比斯从伦敦童年、国际象棋、游戏开发、脑科学、DeepMind、AlphaGo到AlphaFold的道路,记录人工智能如何进入科学发现的核心。

Facebook X LinkedIn Threads Telegram
Nano Banana Pro实战提示词手册 cover

24篇文章

Nano Banana Pro实战提示词手册

金京镇

6部、22章、课堂提示词附录

这本在线书围绕Nano Banana Pro的图像生成、编辑、文字渲染、角色一致性、工作场景和变现方法展开,方便课堂和实际工作直接使用。

Facebook X LinkedIn Threads Telegram
军事人工智能 cover

共17篇公开

军事人工智能

金京镇、金元泰

目录、序言、14章、尾声

一部系统梳理军事人工智能的长篇著作,涵盖自主武器、无人机、指挥控制、后勤、网络防御,以及美国、中国、以色列、韩国和全球国防AI企业的战略与实践。

FacebookXLinkedInThreadsTelegram
《读脑者:Neuralink与人类最后的革命》封面

21篇文章

《读脑者:Neuralink与人类最后的革命》

金京镇

目录、序章、18章、尾声

《读脑者:Neuralink与人类最后的革命》是金京镇在AI书房公开的在线书。本书追踪Neuralink、脑机接口、脑数据、医疗革命、神经权利和人类增强,记录人类大脑开始连接机器之后的法律与文明问题。

Facebook X LinkedIn Threads Telegram
《格鲁吉亚历史文化旅行》封面

24篇文章

《格鲁吉亚历史文化旅行》

金京镇

目录、序言、17章、4篇附录、尾声

《格鲁吉亚历史文化旅行》是金京镇在AI书房公开的在线书。本书从第比利斯、卡赫季、卡兹别克、高加索雪山、八千年葡萄酒、东正教、民主化、战争和旅行路线出发,记录格鲁吉亚的历史与现实。

Facebook X LinkedIn Threads Telegram
《一千个祈祷,一座山:读懂亚美尼亚》封面

13篇文章

《一千个祈祷,一座山:读懂亚美尼亚》

金京镇

目录、序言、10章、尾声

《一千个祈祷,一座山:读懂亚美尼亚》是金京镇在AI书房公开的在线书。本书从亚美尼亚高原、亚拉腊山、古代王国、世界第一个基督教国家、中世纪修道院、现代悲剧、离散社群和旅行指南出发,阅读亚美尼亚。

Facebook X LinkedIn Threads Telegram
从卖茶少年到总理 cover

共13篇公开

从卖茶少年到总理

金京镇

目录、序言、10章、尾声

一部政治传记,追踪纳伦德拉·莫迪从瓦德讷格尔卖茶少年、RSS组织者、古吉拉特邦首席部长到三任印度总理的轨迹,并由此理解现代印度、韩印关系与崛起大国的风险。

FacebookXLinkedInThreadsTelegram
《马来西亚:掌控马六甲海峡者掌控世界》封面

23篇文章

《马来西亚:掌控马六甲海峡者掌控世界》

金京镇

目录、序言、20章、尾声

《马来西亚:掌控马六甲海峡者掌控世界》是金京镇在AI书房公开的在线书。本书从马来半岛、马六甲王国、殖民地、联邦君主制、法律制度、城市旅行和产业结构出发,阅读马来西亚的地缘价值。

Facebook X LinkedIn Threads Telegram
《韩东勋留给韩国的那些痕迹》封面

13篇文章

《韩东勋留给韩国的那些痕迹》

金京镇

目录、12章

《韩东勋留给韩国的那些痕迹》是金京镇在AI书房公开的在线书。本书围绕韩东勋、韩国政治、法务部、检察改革、政治记录和受害者救济,整理他在韩国社会与国家制度中留下的公共足迹。

Facebook X LinkedIn Threads Telegram
《PALANTIR:战争、监视与人工智能》封面

16篇文章

《PALANTIR:战争、监视与人工智能》

金京镇律师

目录、序言、14章

《PALANTIR:战争、监视与人工智能》是金京镇律师在AI书房公开的在线书。本书从PayPal黑帮、9·11之后的情报失败、乌克兰战场、五角大楼改革和预测性治安出发,追踪数据公司如何进入国家安全与企业决策的核心。

Facebook X LinkedIn Threads Telegram
《韩东勋的故事》封面

39篇文章

《韩东勋的故事》

金京镇

目录、序章、36章、尾声

《韩东勋的故事》是金京镇在AI书房公开的在线书。本书从戒严之夜、检察官生涯、法务行政、政治选择、民生现场和个人面貌出发,记录韩东勋在韩国公共生活中的轨迹。

Facebook X LinkedIn Threads Telegram
人工智能选举 cover

14篇文章

人工智能选举

金京镇

目录、作者序、11章、结语

这本在线书写竞选信息、宣传材料、数字竞选、数据分析、团队运营、虚假信息防御、法律风险和可直接使用的提示词。

Facebook X LinkedIn Threads Telegram
《人工智能战斗机,人工智能空军》封面

43篇文章

《人工智能战斗机,人工智能空军》

金京镇

目录、序言、40章、尾声

《人工智能战斗机,人工智能空军》是金京镇在AI书房公开的在线书。本书围绕AI战斗机、无人作战飞机、CCA、MUM-T、第六代战斗机和未来空军,记录人工智能正在怎样改变空战、国防产业和军事伦理。

Facebook X LinkedIn Threads Telegram
山姆·奥特曼传:人工智能革命的开拓者 cover

22篇文章

山姆·奥特曼传:人工智能革命的开拓者

金京镇、金京兰

目录、序言、7部、20章

这本在线传记写山姆·奥特曼的成长、创业、Y Combinator、OpenAI、ChatGPT、董事会风波,以及他在人工智能时代承担的责任。

Facebook X LinkedIn Threads Telegram
关于北极航道的七个误解封面

10篇文章

关于北极航道的七个误解

金京镇

目录、序言、7章、尾声

金京镇AI书房在线图书,梳理关于北极航道的速度、定期航线、保险、安全规则、全年通航、碳减排和基础设施的七个常见误解。

Facebook X LinkedIn Threads Telegram
《世界各国在行政领域引入人工智能的案例》封面

25篇文章

《世界各国在行政领域引入人工智能的案例》

金京镇

目录、23章、尾声

金京镇AI书房在线图书,介绍公共部门AI导入、各国战略、行政服务、治理框架与未来政策课题。

Facebook X LinkedIn Threads Telegram
《Claude Cowork与智能体使用手册》封面

11篇文章

《Claude Cowork与智能体使用手册》

金京镇

目录、序言、8章、尾声

《Claude Cowork与智能体使用手册》是金京镇在AI书房公开的在线书。本书整理文件整理、财务数据、营销销售、研究、沟通、人事法务、软件开发和系统联动自动化场景。

Facebook X LinkedIn Threads Telegram
《Claude Code完全掌握》封面

41篇文章

《Claude Code完全掌握》

金京镇

目录、40章

《Claude Code完全掌握》是金京镇在AI书房公开的在线书。本书围绕Claude Code、智能体工作流、MCP、技能、部署、GitHub、自动化和商业化,整理把AI从聊天工具变成工作系统的方法。

Facebook X LinkedIn Threads Telegram
《黄仁勋的故事》封面

16篇文章

《黄仁勋的故事》

金京镇

目录、序言、13章、尾声

《黄仁勋的故事》是金京镇在AI书房公开的在线书。本书沿着黄仁勋的移民经历、NVIDIA创业、GPU革命、CUDA生态、AI工厂和物理AI,记录一位企业家如何站到人工智能产业的中心。

Facebook X LinkedIn Threads Telegram
法律实务与人工智能封面

16篇文章

法律实务与人工智能

金京镇

目录、序言、14部

金京镇AI书房在线图书,从律师实务角度整理法律检索、文书起草、证据分析、合同审查、NotebookLM以及生成式AI工作流程。

Facebook X LinkedIn Threads Telegram
您好,我是金京镇封面

10篇文章

您好,我是金京镇

金京镇

目录、序言、推荐语、6章、结语

金京镇AI书房在线图书。内容涵盖成长经历、科技议政活动、议员外交、立法斗争、东大门愿景以及韩国人口断崖的解决方案。

Facebook X LinkedIn Threads Telegram

[AI书房] 第11章 Atari冲击

德米斯·哈萨比斯,谷歌人工智能之父
Author
金京镇
Date
2026-05-06 11:11
Views
54

德米斯·哈萨比斯,谷歌人工智能之父

德米斯·哈萨比斯,谷歌人工智能之父

第11章 Atari冲击

金京镇

用游戏学习的AI。2013年伦敦深夜,DeepMind狭小的办公室里弥漫着一种紧张与疲惫交织的气息。窗外是伦敦冰冷的夜色街景,但德米斯·哈萨比斯和同事们的目光,全部锁定在显示器上那些闪烁跳动的粗糙像素上。屏幕里运行的,是一台1970年代的遗物,Atari 2600游戏机。

没有华丽的画面,没有宏大的音效,只是一块粗朴的8位像素屏幕。但他们盯着看的,绝不是一款普通的复古游戏。那是人工智能的历史,不,是人类制造工具的方式发生根本性转变的瞬间。他们创造的这个人工智能代理,后来被称为DQN(Deep Q-Network),当时就像一个刚出生的婴儿。

研究团队没有教给这个AI哪怕一条游戏规则。哪个是敌机哪个是友军,分数怎么获得,甚至通关需要做什么,统统没有告诉它。AI得到的只有两样东西:一是充当人眼角色的屏幕像素信息(视觉数据),二是游戏分数(奖励)上升或下降的信号。

「把分数搞高。」这是给AI的唯一本能,唯一的指令。早期阶段的AI表现简直一塌糊涂。

屏幕里的球拍乱晃一气,飞来的球它躲都来不及,只会毫无意义地狂按按钮。比第一次摸到游戏手柄的三岁小孩还不如。但哈萨比斯和研究团队并不失望。

他们在等,等秩序从这团随机的混沌中生长出来的那个瞬间。深度学习这颗人工智能的大脑,与强化学习这套胡萝卜加大棒的机制结合到一起,他们屏息凝视,等待它真正运转起来。时间一点点过去,不可思议的事情发生了。

经过成千上万次试错,AI开始自行识别屏幕上像素的规律。「这个白点(球)往

下落的时候,把我的白色长条(球拍)移到它下面,那个叫分数的数字就会往上涨。」AI在没有任何人教导的情况下,自己推断出了因果关系。这和过去那种执行预设指令的计算机程序完全不在一个层次上。

那是「学习」。人类认识世界的方式,也就是通过经验自行领悟的过程,正在被机器重现。这一刻,哈萨比斯长久以来梦想的「通用学习算法」的可能性,得到了验证。

下国际象棋就只会国际象棋,下围棋就只会围棋,为某个特定游戏硬编码规则的AI,离开那个游戏就什么都不会。打败国际象棋冠军的深蓝,让它玩井字棋,它连规则都理解不了。但DQN不一样。玩「太空侵略者」的那套代码,不做任何修改,就能玩「Pong」,就能玩「Breakout(打砖块)」。

只是把屏幕的像素给它看,AI就自己掌握了那个世界的物理规律和游戏规则。这是人工智能从封闭世界的专家,迈向开放世界的学习者的第一步。在「打砖块(Breakout)」中,AI自己发现的穿隧策略,成了整个项目的高光时刻。

2013年,就在Google收购DeepMind之前,哈萨比斯需要通过这个演示,向拉里·佩奇和Google高管们证明DeepMind的价值。而证明的那一刻,连AI研究者自己都始料未及。训练开始大约十分钟后,DQN已经能相当熟练地接住球了。换作人类,算是个水平不错的业余玩家。

球来了稳稳接住,一块一块地敲掉砖墙。研究人员点了点头。「运行得不错,达到人类水平了。」

他们觉得这已经是足够好的成果了。但AI没有停下来。训练进行到两小时,屏幕里AI的动作出现了微妙的变化。

它不再满足于把球接住就好,而是开始用球拍边缘精准地将球弹出特定角度。四小时过后,谁都没有教过、谁都没有预料到的

画面出现了。AI执拗地集中攻击砖墙的一侧边缘。反反复复把球往同一个位置送,终于在墙壁最边上凿穿了一条垂直通道。

通道一打开,AI立刻把球送进那条窄缝。球进入砖墙背后的空间,开始在墙壁和顶部天花板之间疯狂弹射。伴随着密集的碰撞声,大片砖块瞬间哗啦啦塌落,分数呈指数级暴涨。

这就是「穿隧(Tunneling)」策略。据说只有高手才懂的秘技,AI自己摸索了出来。目睹这一幕的研究人员先是沉默,随即爆发出欢呼。

这不是在刷分。这是AI进行了「战略思考」的证据。「眼前老老实实接球更安全,但冒着风险去凿穿一侧的墙,之后能拿到巨大的回报。」

这么复杂的因果关系和长远规划,AI仅凭像素的运动和记分板的变化就领悟到了。哈萨比斯回忆这一刻时说:「就好像亲眼看到了AI在思考。」那不是程序员写进去的代码,而是数据和经验催生出的涌现式智能。

这次「穿隧」事件给了DeepMind团队坚定的信念。确信自己走的路是对的,也相信终有一天,这种智能不只能在游戏里凿穿砖墙,还能在科学难题这堵巨大的高墙上凿出一条隧道。2013年,这项成果在NIPS(现NeurIPS)深度学习工作坊上首次公开,经过补充完善后,于2015年登上了世界级科学期刊『Nature』的封面。

论文的标题是『Human-level control through deep reinforcement learning(通过深度强化学习实现人类水平的控制)』。科学界,尤其是AI圈受到的冲击,只能用「震撼」来形容。在那之前,AI学术界的主流仍然习惯于由人类精心设计规则的方式。

还有一种流行的看法认为,深度学习在图像识别这类静态任务上表现出色,但在游戏这种需要连续决策的动态环境中很难奏效。

强化学习在理论上很漂亮,但要解决现实中的复杂问题,太不稳定了。这是当时的定论。然而伦敦一家小小的创业公司,把所有成见都打碎了。这篇论文之所以令人震惊,关键在于「通用性(Generality)」。

他们做出的同一个算法网络(DQN),在Atari 2600的49款游戏中,有29款超过了人类专家的水平。拳击、弹球、太空侵略者,规则和目标完全不同的游戏,同一颗大脑全学会了。这是一个强烈的信号:AI有可能从专用工具进化为通用工具。

一篇计算机科学论文,而且是关于玩游戏的AI的论文,竟然登上『Nature』封面,这件事本身就不同寻常。它标志着AI研究已经超越了工程试验的范畴,进入了探究智能本质的自然科学领域。全世界的研究者争相分析DQN的源代码,Google则为了抢先占据这个方向,押下了巨额赌注。

Atari冲击终结了AI研究的寒冬,成为点燃深度学习黄金时代的引爆器。而这一切的中心,是哈萨比斯那句「我要破解智能」的执拗追寻。为什么是游戏? 对游戏难度与象征意义的计算。游戏不只是娱乐。

它是人类为了测量和训练智能而发明的,精巧至极的「实验室」。他常说:「游戏是现实世界的微缩模型(Microcosm)。」现实世界太复杂,噪声太多,结果出来得太慢。在现实中让AI去学炒股,或者让机器人学走路,代价高昂且充满风险。但游戏不同。安全,可以无限重复,而且目标明确(胜利或得分)。

哈萨比斯用数学方法衡量游戏的难度,据此设计了AI的进阶路线。Atari游戏是处理二维平面像素信息的阶段,用来验证视觉皮层早期的信息处理能力。

围棋(Go)是「完全信息博弈(Perfect Information Game)」的顶峰。棋盘上没有任何隐藏信息。双方看着彼此所有的落子,比拼的是纯粹的算计、直觉和模式识别能力。围棋的可能局面数比宇宙中的原子还多,因此

这是在考验AI能否征服超越计算能力的「直觉」领域。哈萨比斯的目光投向了围棋之后。现实世界不像棋盘,不会把所有信息都摊开给你看。

对方在想什么,明天天气怎样,帘子后面藏着什么,全都不知道,却必须做出决策。这就是「不完全信息博弈(Imperfect Information Game)」。扑克和星际争霸就属于这一类。哈萨比斯的计划是:用Atari证明「感知」,用AlphaGo证明「直觉」,末尾把AI推入最接近现实的不确定世界,也就是「星际争霸II」。

这不只是做一个会玩游戏的AI,而是一套必要的训练过程,目标是打造出能在充满不确定性的现实世界中提出科学假说、设计实验的AI,即「科学家AI」。征服星际争霸II(AlphaStar):不完全信息环境下的实时策略。2019年1月,DeepMind再次震动了世界。这回的舞台不是棋盘,而是即时战略模拟游戏(RTS)「星际争霸II」。

如果说AlphaGo是静态回合制游戏的王者,那么「AlphaStar」必须成为在瞬息之间做出数百个决策的动态战场指挥官。星际争霸II对AI来说堪称噩梦级课题。第一,存在「战争迷雾(Fog of War)」。

玩家只能看到自己单位所在的区域。对手在建什么,兵力往哪调,一概看不见。所以AI必须不断通过侦察(Scouting)收集情报,对看不见的对手行为进行预测和推理。这是一种在信息不足的条件下建立假说并加以验证的高级智能行为。

第二,「实时(Real-time)」的压力。围棋允许你思考下一步,星际争霸却一刻不停地推进。第三,长时间跨度(Long time horizon)的问题。开局多造一个农民的决定,可能在二十分钟后左右一场大规模战斗的胜负。

AI必须看到数千、数万帧之后的未来,计算当前行为可能引发的蝴蝶效应。

AlphaStar以压倒性的优势击败了职业选手TLO(Dario Wünsch)和MaNa(Grzegorz Komincz)。人们猜测AlphaStar是靠惊人的鼠标点击速度(APM)取胜的,但DeepMind把AI的点击速度限制在了人类水平。AlphaStar展现出来的不是反应速度。

而是令人脊背发凉的「判断力」。AlphaStar通过侦察掌握对手的体系,随即灵活调整兵种搭配。劣势时果断撤退,一旦发现对手破绽就毫不犹豫地扑上去。

与MaNa对局中展现的「闪烁追猎者」操作精准到人类无法模仿,但更惊人的是它对整个战场的战略视野。当然也有局限。MaNa在AlphaStar视野之外持续骚扰时,AlphaStar一度显得手忙脚乱。

但DeepMind很快做了修正,AlphaStar最终达到了宗师(Grandmaster)级别。对哈萨比斯而言,AlphaStar的胜利是一个有力的证据:AI能够在不确定、复杂且瞬息万变的环境中,也就是「现实世界」中,制定复杂战略并达成目标。Atari Breakout(打砖块)游戏画面

人工智能专家 金京镇律师

AI法律政策专家 · 前国会议员 · 著有多部专著

如果这本书曾在你身边短暂停留,请支持我们,让下一个故事也能与世界见面。

(自愿赞助账户:农协 302-1096-0948-81 户名:金京镇)

金京镇

律师 · 前国会议员 · AI政策研究者

kimkj.com

© 2026 金京镇. All rights reserved.

#金京镇 #AI书房 #德米斯哈萨比斯 #DeepMind #GoogleDeepMind #AlphaGo #AlphaFold #人工智能 #科学AI
滚动至顶部
kimkj.com 首页