AI书房
用书来读懂AI
这里收录金京镇律师的AI、法律、产业、历史、政治、文化主题在线书。每本书都按目录、序言、章节、尾声整理,方便连续阅读。
[AI书房] 第15章 可解释AI(XAI)
人工智能战斗机,人工智能空军
第三部 AI如何学习战斗
第15章 可解释AI(XAI)
金京镇
1988年7月3日,波斯湾。美国海军宙斯盾巡洋舰文森斯号(USS Vincennes)的战斗信息中心(CIC)里,一场悲剧正在酝酿。雷达屏幕上出现了一个身份不明的航迹。舰长和船员们神经紧绷,因为当时与伊朗的军事对峙已到了白热化程度。计算机系统将那个航迹判定为伊朗空军的F-14战斗机。舰长下令发射导弹。
然而那不是F-14。那是伊朗航空655号班机,一架民用客机。机上290名乘客和机组人员全部遇难。事后调查发现,计算机系统显示了错误信息,而在极度紧张的状态下,船员们照单全收。
为什么会发生这样的悲剧?当时的系统只会说「那是F-14」。它不解释为什么判定为F-14,不说明自己有多大把握,也不提示是否存在其他可能。船员们没有任何手段去验证机器的话。这就是所谓的「黑箱(Black Box)」问题。
黑箱,就是一个无法看到内部的黑色盒子。你输入数据,它吐出结果,但中间发生了什么,无从得知。现代深度学习人工智能也是如此。数百万个参数错综复杂地交织在一起,连开发者都经常说不清为什么会得出那样的结论。
对战斗机飞行员来说,信任等于性命。如果我的僚机突然脱离编队急转弯,我会抓起无线电喊:「你干什么!」如果僚机回答「三点钟方向发现SAM(地对空导弹)发射!正在规避!」,我会立刻理解并跟着做规避机动。因为他解释了原因。
但如果僚机是一架人工智能无人机呢?它突然朝敌阵中心猛冲过去,而我的雷达上什么也没有。这是天才战术,还是系统故障,还是被黑客入侵了?那一瞬间我会陷入恐惧。无法理解的行为,和叛变没有区别。
2020年,DARPA的阿尔法空战试验(AlphaDogfight Trials)中,赫伦系统公司(Heron Systems)的人工智能「猎隼(Falco)」以5比0完胜人类飞行员「撞击手(Banger)」。结果令人震惊,但过程同样诡异。猎隼展示了人类飞行员绝不会采用的机动方式:正面朝敌机冲去同时开火的「迎头攻击(Head-on)」战术,每秒几十次
微幅抖动操纵杆。撞击手赛后这样说:「那家伙的射击精度不可思议。但我根本预测不了它为什么做那种机动,下一步又会干什么。」
在仿真环境里,人工智能做了蠢事坠毁了,按一下重置键就行。但在真实战场上呢?我身边飞行的人工智能无人机突然朝平民村庄发射导弹,我怎么判断那是在打击敌人的伪装据点,还是故障了?
为了解决这个问题,XAI(eXplainable AI,可解释人工智能)应运而生。它是一种让人工智能用人能听懂的话解释自己「为什么」做出某个决定的技术。
DARPA从2016年开始推进XAI项目。他们的目标很明确:「在保持高性能的同时构建可解释的模型,让人类能够理解人工智能伙伴、恰当地信任它并有效地管理它。」说起来容易,做起来难。
过去的人工智能只会说「这是敌方坦克,概率97%」。XAI则会这样说:「这是一辆T-90坦克。判断依据如下:炮塔外形与T-90数据库的匹配度为95%;红外传感器捕捉到的发动机热分布呈现柴油发动机的特征;周围护卫车辆的队形与俄军装甲部队的战术编组一致。」
有了这样的解释,飞行员才能验证人工智能的判断。如果人工智能是因为荒唐的理由识别了目标(比如因为树影的形状),飞行员可以说「这蠢机器又搞错了」,然后取消攻击。
2025年4月,美国空军发布了『关于人工智能的条令文件(AFDN 25-1)』。该文件明确要求在军事人工智能开发中使用「透明且可解释的算法」,并进行「定期审计和评估」。只有当数据可获取、可理解时,才能在此基础上构建军事应用程序。
「信任校准(Trust Calibration)」这个概念同样关键。对人工智能不能过度信任,也不能完全不信。过度信任,文森斯号的悲剧就会重演。完全不信,就会关掉或无视人工智能,白白浪费它的能力。人工智能必须坦诚地表明自己的确信程度。当它说「该目标有99%的概率是敌方」时,和它说「该目标为敌方的概率是60%,识别结果不确定」时,人类的应对方式应当不同。
法国国防企业泰雷兹(Thales)打出了「TrUE AI」的口号。
透明的(Transparent)、可理解的(Understandable)、合乎伦理的(Ethical)人工智能。他们正在开发一种技术,使人工智能的决策过程可追溯,一旦发生事故,就能像分析飞机黑匣子那样回溯人工智能的思考过程。
澳大利亚空军与波音联合研发的MQ-28「幽灵蝙蝠(Ghost Bat)」无人机也在聚焦这个问题。有人战斗机飞行员向自己的僚机幽灵蝙蝠下达任务时,必须能一眼看出无人机处于什么状态、是否正确理解了命令。这需要一种能将复杂数据转化为直观图形的界面。
2024年5月,美国空军部长弗兰克·肯德尔亲自登上了由人工智能驾驶的X-62A VISTA战斗机。在时速超过550英里(约880公里)的空战机动过程中,肯德尔部长坐在后座。飞行结束后他说:「我觉得可以把武器发射决策交给人工智能了。」但这份信任,是在经过数千小时的仿真和测试、人工智能能够解释自己为什么做出那些机动之后,才建立起来的。
XAI也有局限。生成解释需要额外的计算。战斗机必须在毫秒级别做出决策的场景中,不能因为生成解释而耽误时间。过于复杂的解释反而会让飞行员困惑。「炮塔外形曲率为0.73,热分布标准差为2.4」这种话只对工程师有意义。飞行员需要的是「那是坦克,打!」
对抗性攻击(Adversarial Attack)的威胁也存在。如果敌人摸清了我方人工智能的弱点怎么办?比如发现我方人工智能严重依赖炮塔外形识别,就可以给坦克罩上伪装网来扭曲炮塔轮廓。还可以在图像中添加人眼不可见的细微图案来欺骗人工智能。XAI公开了人工智能的判断依据,反过来也可能等于告诉敌人我们的弱点在哪里。
伦理问题同样悬而未决。人工智能提供了解释,不等于免除了责任。如果人工智能说「目标的热信号模式与敌方战斗机94%匹配」,但实际上那是一架民用客机,谁来承担责任?是写代码的程序员?是按下发射按钮的飞行员?还是决定部署人工智能的指挥官?
红十字国际委员会(ICRC)和美国国防部都将可解释性列为自主武器系统开发和使用中的核心要素。「有意义的人类控制(Meaningful Human Control)」原则被反复强调。但当高超音速导弹呼啸而来、数百架无人机蜂拥而至的瞬间,人类还有介入的时间吗?恐怕没有。届时我们也许不得不对人工智能说「你自己拿主意吧」,把权限交出去。
所以XAI不只是回答「你现在为什么这么做」这种实时提问。它是在部署人工智能之前,在成千上万种场景中进行测试,预先验证它在什么情况下会做出什么判断。它是让人工智能能够坦诚地说「这个情况超出了我的学习范围,人类,请您来决定」。
作为战斗机飞行员,我热爱机器。F-16的发动机在背后轰鸣时,电传操纵系统精确地翻译我指尖每一个细微动作时,我感觉自己和机器融为一体。但那是因为我理解这台机器。发动机声音稍有异常我就能察觉,操纵杆的反馈和平时不一样我立刻就能感到。
人工智能也应当如此。当我能理解人工智能的思路,当人工智能能向我解释它的想法时,我们才真正成为一个「团队」。到那时,我愿意放开操纵杆,看着人工智能展示的战术画面来指挥作战。
没有解释的智能,在战场上与疯狂无异。我们需要的不是黑箱里的幽灵,而是可以背靠背作战的战友。XAI,正是我们为打造这样的战友所付出的努力。