分享人工智能相关新闻和分析的板块。
人工智能战斗机 – 第二部:阿尔法空战:空中格斗的图灵测试
Author
김 경진
Date
2026-02-25 22:22
Views
49
第二部:阿尔法空战:空中格斗的图灵测试
1. DARPA的挑战:人工智能能否击败人类飞行员?
2019年秋天,五角大楼某处提出了一个问题:机器能在空中击败人类战斗机飞行员吗?这并非简单的好奇心。美国国防高级研究计划局——通常被称为DARPA——提出的这个问题,与七十年前艾伦·图灵问出"机器能思考吗"一样,是一个根本性的挑战。
DARPA是一个奇特的组织。表面上看像是官僚化的政府机构,实际上更像是疯狂科学家的游乐场。互联网就诞生于此。GPS也是从这里走向世界的。隐身战斗机的种子也是他们播下的。说它是唯一一个敢于押注不可能、失败了也没关系的政府机构,一点都不过分。
这一次,他们向空中格斗——这一长期由人类本能和直觉主导的领域——发起了挑战。名为"空战进化"(Air Combat Evolution,简称ACE)的项目就此启动。项目经理是丹·雅沃尔塞克上校,呼号"动物"。作为前F-16飞行员,他比任何人都了解战斗机飞行员的心理。战斗机飞行员是怎样的人?他们是以握住操纵杆与敌人搏斗为荣的人。让他们把性命交给机器,近乎是一种侮辱。
"动物"上校决定正面突破这种抵触。他用一个历史类比来解释这一挑战的意义。1939年,美国陆军参谋长乔治·马歇尔将军问骑兵司令约翰·赫尔将军,如何应对德国的闪电战。赫尔将军的回答是这样的:把马装上拖车运到前线以保存体力,然后在战场上压倒坦克。当然,历史并没有按他的想法发展。骑兵消失了,坦克主宰了战场。
"动物"发出警告:如果今天的战斗机飞行员不想成为21世纪的骑兵,就必须接受人工智能这辆新坦克。但如何打破飞行员的不信任呢?百闻不如一见。"动物"决定让人工智能在一对一空战中击败人类顶尖高手。这就是"阿尔法空战试验"(AlphaDogfight Trials)诞生的背景。
为什么偏偏选择近距格斗?现代空战正在向视距外导弹发射方式转变,称为BVR交战。那为什么要选择二战式的近距格斗?这有深层原因。
第一,近距格斗是一个封闭世界的问题。就像围棋一样,规则明确但可能性几乎无限。这种环境非常适合人工智能通过强化学习来提升能力。DARPA将近距格斗视为通往更复杂空战任务的入口。
第二,近距格斗是OODA循环的极限试验场。观察、定向、决策、行动——这一决策过程在近距格斗中于瞬息之间完成。在这里超越人类,就证明了人工智能的运算速度和判断力已经超越了人类的生理极限。
第三,它也是建立信任的起点。飞行员从训练初期就通过近距格斗来打磨基本功。如果人工智能能在这一最基本、最本能的领域压倒人类,飞行员将不得不认可其能力。
约翰·霍普金斯应用物理实验室(APL)在此次比赛中扮演了核心角色。他们建造了一个名为"斗兽场"(Colosseum)的AI竞技场——名字取自古罗马角斗士搏杀的圆形竞技场。该系统将开源飞行动力学软件JSBSim与APL开发的中间件、自主算法和可视化软件相结合,能够以超过实时的速度运行模拟。人工智能代理在这片虚拟天空中死去又重生数千万次,在此过程中学会了战斗。
2019年8月,DARPA选出了八支队伍。这被称为"精英八强"的团队来自不同背景——从洛克希德·马丁和波音这样的国防巨头,到赫伦系统公司(Heron Systems)和PhysicsAI这样的小型AI专业企业,再到佐治亚理工研究所这样的大学研究团队。他们的任务是开发完美理解F-16飞行动力学、执行基本战斗机动追咬敌机尾部、并用航炮击落对手的算法。导弹被排除在外。只有飞机的机动性能和航炮瞄准能力决定胜负——这是最原始的战斗形式。
比赛分三个阶段进行。2019年11月的第一次试验本质上是表演赛。当时的AI连飞行都做不好,频频坠地。研究人员后来回忆:"早期阶段,AI甚至不知道怎么操控飞机。不坠毁就算成功了。"但仅仅几个月后,情况就发生了剧变。
到2020年1月的第二次试验时,AI已经开始模仿人类飞行员使用的基本战术。新冠疫情延长了项目周期,5月增加了虚拟的第2.5次试验,到8月的决赛阶段,AI已经开始展示人类想象不到的机动。
DARPA副局长大卫·霍尼在开幕致辞中说:"在构建这个项目时,有一些必须回答的重要问题。我们需要了解AI自主算法是否能在空对空战斗这一极其苛刻的环境中真正发挥作用。"
比赛引起了巨大关注。来自93个国家的约一万人注册观看,另有五千人申请参与。阿尔法空战试验的独特之处在于采用了电子竞技赛事的形式。APL团队设立了一个"控制区"角落,以ESPN的体育中心为蓝本打造解说空间。空战和自主技术专家讨论了AI与近距格斗的基础知识、AI和人类飞行员的训练方法,提供了兼具教育性和趣味性的分析与解说。
这不仅仅是一场技术竞赛。这是人类长期垄断的天空霸权的首次正式考验。在OODA循环的速度竞赛中,AI能否超越人类?在人类直觉主导的领域,机器计算能否获胜?2020年8月,全世界都在等待答案。
2. 赫伦系统的旋风:以强化学习武装的AI
最强大的夺冠热门无疑是洛克希德·马丁。F-22猛禽、F-35闪电II——打造了现役最强战斗机的他们,对战斗机物理学和空战教义的了解无人能及。数十年积累的航空动力学专业知识、数千名工程师、天文数字般的研究预算。怎么看他们都占据优势。
相比之下,赫伦系统公司是一家只有约30名员工的小型软件企业。他们从未制造过战斗机,也从未驾驶过战斗机。这家总部位于马里兰州的小公司能与国防巨头并肩,本身就显得不可思议。但他们有一件秘密武器:对深度强化学习近乎狂热的执着与投入。
强化学习的原理很简单。选择一个动作,观察结果,获得奖励或惩罚,下一次选择更好的动作。以疯狂的速度不断重复。这类似于幼儿学走路——摔倒,爬起来,再摔倒,再爬起来。但AI与幼儿不同。它不知疲倦,不会沮丧,一天可以摔倒再爬起来数百万次。
赫伦系统的方法与传统国防企业截然不同。洛克希德·马丁和极光飞行科学等团队试图将战斗机飞行员的知识灌输给AI——教它"咬住敌机尾巴"、"保存能量"等规则,这就是所谓的专家系统方法。赫伦却不同。他们什么都不教AI。而是把它丢进虚拟环境中,让它不断地杀戮与被杀。
赫伦的AI代理名叫"猎隼"(Falco),取自猎鹰。猎隼通过自我对弈——在虚拟空间中不断与自己战斗——来成长。昨天的自己开发新战术击败今天的自己,明天的自己又打破那些战术,如此无限循环。
据赫伦的机器学习工程师本·贝尔介绍,猎隼在大约五周时间内,对阵由102个不同AI代理组成的联赛,进行了数十亿次近距格斗,累计超过40亿个模拟步骤。换算成人类飞行时间,相当于积累了约30年以上的飞行经验。考虑到真实飞行员一辈子很难超过2,000至3,000小时,这是超越物理时间限制的压缩时间的胜利。
在这个过程中出现了一个有趣的现象。在早期学习阶段,AI努力模仿人类教官教授的标准机动——管理能量、保持转弯率,教科书式的动作。但随着学习的深入,AI开始抛弃人类教义,转而在模拟引擎物理定律允许的范围内追求极限效率。
人类飞行员试图平稳地控制飞机以保持对敌机的视觉追踪。赫伦的AI不同。它对操纵面进行持续的、微小的、粗暴的修正——每秒数十次调整。这是人类双手不可能做到的动作。通过这种方式,它创造出令人难以置信的精确射击角度。
赫伦系统成功的背后有两项精妙的技术:奖励塑造和课程学习。奖励塑造为AI提供更频繁的反馈——不仅在击落敌机时给予奖励,在占据有利位置或接近敌机尾部时也给予小奖励。课程学习从简单的对手开始,逐步增加难度,就像从小学升到中学再到高中。
APL开发的敌方AI代理在复杂性方面涵盖了广泛的范围。最简单的"僵尸"以直线水平飞行模拟巡航导弹。基础代理"洛基"执行基于时间的微小高度和速度变化。脚本代理"BUD FSM"能识别交战状态并执行预定反应。最高级别的强化学习代理"AlphaMav0"完全通过自我对弈开发,无需人类输入,模拟专家级飞行员。
比赛第三天,半决赛和决赛进行时,赫伦系统的AI展示了一项令人震惊的战术:正面攻击——迎头射击。这意味着与敌机正面相对冲锋并开炮。人类飞行员因碰撞风险将这一机动视为禁忌——通常不在135度以上的角度射击。相互碰撞的风险很大,被摧毁敌机的碎片可能被吸入自己的发动机。但对于没有死亡恐惧的AI来说,这是获胜概率最高的公式。
半决赛对阵极光团队时,赫伦一开战就以可怕的速度直扑敌机正面。解说员格洛克震惊了:"赫伦毫不犹豫。战斗一开始就露出杀气,直奔对手鼻子。"
在与洛克希德·马丁的决赛中,赫伦将这一战术发挥得淋漓尽致。洛克希德的AI反映了人类教义——管理能量、抢占位置,动作优雅而正统。赫伦的AI拒绝这种绅士般的战斗。它像疯狗一样扑上去撕咬每一个破绽。它的航炮精度惊人——炮口仿佛像磁铁一样吸附在敌机上。一旦锁定,绝不松手。在一闪而过的瞬间给予敌机致命打击。在人类眼中认为不可能射击的角度,AI的计算中却是命中概率超过90%的机会。
大卫击败了歌利亚。赫伦系统在决赛中以16胜4负的压倒性优势击败洛克希德·马丁,登上冠军宝座。30人的小团队击败了拥有数万名工程师的国防巨头。这一事件表明,数据学习能力可能比领域知识更重要。训练AI的方法论比制造战斗机的经验更具决定性。
赫伦系统的旋风证明了AI能够超越对人类的简单模仿,通过数据和模拟创造出人类从未发现的新的胜利语法。而现在,最后的对手——人类飞行员——正在等待着他们。
3. 人类对AI:5比0
在全世界通过YouTube直播观看的注视下,2020年8月20日下午,重头戏开始了。代表人类出战的飞行员呼号是"砰手"(Banger)。他是美国空军武器学校毕业生,仅F-16飞行时间就超过2,000小时,是老兵中的老兵。他隶属于华盛顿特区空军国民警卫队,由于行动安全原因未公开全部身份,但他是美国空军最顶尖的飞行员之一。他不仅飞行技术精湛,更是研究和教授无数战术的教官。
"砰手"戴上VR头盔,坐进了模拟器。APL团队开发的ADT VR系统旨在为飞行员提供与AI代理获得的一致信息。除了传统的平视显示器外,VR头盔还呈现了特殊组件以增强对威胁和相对位置的态势感知。这是一场公平的战斗——至少在信息方面是如此。
在过去几天里,"砰手"一直在观看AI的比赛并分析它们的模式。赫伦在初期正面攻击方面很强。避开那个区域,把战斗拖入持久战,迫使对方进行能量对抗。这就是人类的战略,源自数千小时飞行经验的判断。
比赛共进行五个回合,从不同高度的中立条件开始。第一回合以中立交汇开始——两架飞机正面相向交叉。通常的人类飞行员会展开转弯竞赛以咬住对方尾部。如预期,"砰手"试图避开赫伦的正面交锋,降低高度同时转弯。但赫伦的反应比预想快得多。它以人类肉眼难以追踪的速度转向机头,切入"砰手"的盲区。交叉后,在人类未预料的时机急剧转向并锁定射击角度。"砰手"还没来得及判断情况就被击中了。第一次交战瞬间以赫伦的胜利告终。解说员们目瞪口呆:"AI的反应速度完全摧毁了OODA循环。"当人类还在观察和判断时,AI已经完成了决策和行动。
第二和第三回合,"砰手"改变了战术。他试图利用AI不依赖视觉而拥有完美状态信息这一点,用激烈的机动来逃脱AI的预判——急剧改变高度,进行垂直机动来扰乱AI。但赫伦的反应就像提前知道"砰手"的动作一样。无论"砰手"做什么机动,猎隼都即时反应——以毫秒级速度切入"砰手"的转弯半径内侧,或在"砰手"建立射击位置之前率先开火。赫伦的航炮无误差地击中"砰手"的飞机。
"砰手"无法掩饰困惑:"作为战斗机飞行员训练的标准动作根本不管用。"
第四和第五回合,"砰手"尝试了极端低空机动,冒着撞地风险引诱AI。他下降到1,300英尺——约400米——这是人类会感到撞地恐惧的高度。但对AI来说,恐惧是不存在的。第五次交战中,"砰手"使用激进的平面外机动在初始交汇中幸存并延长了战斗。但赫伦毫不动摇。它冷静地保持高度,占据从上往下俯瞰的有利位置,紧追不舍,最终锁定"砰手"的尾部将其击落。
最终比分5比0。人类完败。更令人震惊的是内容——人类飞行员始终未能对AI发出一次有效攻击。所有时间都花在了规避机动上,而即便如此最终也未能成功。
"砰手"浑身是汗地走出模拟器,在采访中坦率地讲述了这次令人震惊的经历。"作为战斗机飞行员训练的标准内容不起作用了,"他解释说,"我们在动态环境中进行复杂的物理计算。我试图解决角度和各种接近速度、空速差等问题,以到达能够对敌机使用武器的位置。"
关于赫伦的瞄准能力,他叹为观止:"赫伦的瞄准能力优于其他任何对手。"他说自己试图通过机动来躲避AI的射击,但AI计算了他的每一个微小动作,顽强地保持瞄准。纳秒级的调整能力,加上两架飞机之间完美的状态信息,使其能够进行极其精确的控制。
"砰手"坦言,AI将飞机置于可能与对方碰撞的位置让他感到不安。"高偏角航炮射击也是如此。AI可以利用这一点。"AI将飞机放在人类感到不舒服的位置,并从人类不会尝试的角度射击。
"动物"上校分析了这一结果:"AI程序精确飞行的能力,使其能够无视人类空军飞行员所训练的飞行安全规则。这最终在模拟战斗中提供了优势。"
这个5比0的结果传递的信息超越了技术本身。空战中人类至上的前提可以被打破。这种打破不是来自装备差距,而是来自决策差距。一旦被打破就难以逆转,因为AI不是记忆战术,而是学习战术。
老兵感受到的真正冲击是认知负荷的极限。人类同时进行飞行控制、搜索敌机、战术判断、通信等,消耗巨大的精神能量。但AI并行处理所有这一切,毫不疲倦。人类凭直觉判读的,AI用概率判读——并以残酷的一致性执行。
"砰手"震惊的原因不是他一生习得的感觉变得无用了,而是那种感觉不再是决定性优势了。人类依然优秀,但优秀的定义正在改变。
然而"砰手"并未绝望。他在承认AI能力的同时,留下了重要的洞见:"这不是终点。如果我们能让这项技术为我们所用,我们将成为战场上无敌的团队。"解说员格洛克也持同样看法:"我们信任有效的东西。"飞行员们开始从恐惧AI转向思考:如果这样的AI做我的僚机,该多令人安心。
这场对决录得超过44万次观看量,被航空航天界和五角大楼认定为改变游戏规则的事件。DARPA战略技术办公室主任蒂姆·格雷森博士说:"这些结果展示了未来空战系统和包含人机共生概念的巨大潜力。"
阿尔法空战试验改写了空战历史。它证明了AI不仅仅是辅助工具,还可以成为超越人类的致命战斗员。但同时也暴露了局限性——AI的强大仅存在于模拟的受控环境和完美信息条件下。
5比0的记分牌不仅仅是一个数字。它是即将到来时代的预告,也是对人类飞行员发出的严肃警告。今后,飞行员的价值将从谁飞得更好转向谁监督和设计得更好。AI执行机动,人类设计任务、规则和责任。这不是降级——而是角色的转移。
现在的任务是将这个玻璃盒中的天才带到粗犷而不可预测的真实天空中。在模拟中学到的东西能在现实中复现吗?在没有完美信息的世界里,AI还能击败人类吗?寻找答案的旅程即将启程。
4. ACE项目与X-62A VISTA:从模拟走向真实天空
2020年8月的某一天,全世界航空专家在屏幕前屏住呼吸,目睹赫伦系统的人工智能以5比0完胜人类老兵飞行员。然而爱德华兹空军基地的试飞员们摇了摇头。"那只是电子游戏。"
他们的冷嘲是有道理的。模拟器中的天空永远是干净的。风按照数学公式吹拂,传感器不会撒谎,通信链路不会中断。最重要的是,犯了错只需按下重置键即可。在那个世界里,AI基于完美信息作战——可以精确到毫秒级别掌握敌机的位置、速度和方向。
然而真实战场截然不同。传感器上噪声如雪花般涌来,通信被敌方电子战截断,大气颠簸着飞机。虚拟世界中不存在的重力加速度压在飞行员脖子上,坠毁不是游戏结束,而是意味着死亡。
DARPA正是为了弥合这一鸿沟而行动的。2019年启动的ACE项目——全称"空战进化"(Air Combat Evolution)。该项目的目标不仅仅是让AI驾驶飞机。而是要发展人类飞行员信任AI并共同组队作战的能力。DARPA将空战作为"挑战问题"。理由是:如果能在空战的极端速度和不确定性中建立信任,其他领域将更容易解决。
ACE项目分为三个阶段。第一阶段用18个月在模拟环境中验证和开发核心能力——阿尔法空战试验就是这一阶段的一部分。第二阶段用16个月进行无人机飞行测试,将算法转移到小型无人机上。第三阶段是在实际战斗机规模的飞机上进行测试。
这一计划的核心是一架独特的战斗机:X-62A VISTA——可变飞行模拟试验飞机(Variable In-flight Simulator Test Aircraft)。外观上看起来像一架普通的F-16D双座战斗机。但其内部是一个完全不同的世界。由洛克希德·马丁的臭鼬工厂与卡尔斯潘公司合作打造的这架怪异飞机,仅通过更改软件设置就能模拟其他飞机的飞行特性。想要F-35的操控感?设置即可。想要再现MQ-9无人机的运动?再调整设置。就像变色龙根据周围环境改变颜色一样,VISTA可以在空中变换自己的身份。
DARPA在这架由爱德华兹空军基地美国空军试飞员学校持有的独一无二的飞机上,安装了名为SACS的系统——自主控制模拟系统(System for Autonomous Control of Simulation)。这个接口让AI代理能够直接连接飞机的飞控计算机,控制副翼、方向舵、升降舵和发动机推力。
当然,安全措施必不可少。你不能把一架价值数十亿的战斗机操纵杆随便交给刚诞生的AI。AI可能出现Bug导致飞机俯冲坠地,或试图超出飞机结构极限的机动。为此,后座安排了人类安全飞行员,一旦AI试图进行危险机动或失控,该飞行员可立即介入夺回控制权。飞控计算机设定了安全包线,当AI试图超过9G机动或俯冲向地面时,软件会自动阻止。
2022年12月,历史性的飞行在加利福尼亚爱德华兹空军基地上空开始。12月1日至16日,X-62A进行了12次AI控制的飞行,在天空中度过了超过17小时。那些在模拟器中经历了数千万次试错学习的代码块,现在正在控制真实的喷气发动机推力、管理升力,飞越物理意义上的天空。
这个过程并非一帆风顺。在模拟中完美的AI在遇到真实世界的乱流时出现了轻微颤抖,传感器数据延迟导致反应变慢。有些天AI过于被动,有些天它试图超出飞机极限的机动,触发了安全切断装置。
但VISTA测试的真正价值在于快速迭代。通常,验证新的战斗机软件需要数月——修改代码、地面验证、获得飞行许可、再次飞行。ACE团队通过VISTA每天更新代码。如果上午飞行中发现AI错误,工程师午餐时间修正代码、运行模拟,下午飞行中立即应用。爱德华兹基地试飞学校的教官们证实:"过去需要一年的修正在一天内就解决了。"工程师可以在几分钟内更换X-62A上搭载的自主算法,飞行员可以在几小时内测试不同团队的AI。
2023年9月,那一天终于到来了。在爱德华兹空军基地上空,AI驾驶的X-62A与人类驾驶的F-16战斗机进行了真正的空中格斗。想象一下:在600米高空,两架战斗机以1,900公里/小时的相对速度相向冲锋。当距离缩小到仅600米时,人类飞行员感受到本能的紧张,而AI毫无波动地计算最优位置。
最初是防御性机动,但很快升级为争相咬住对方尾部的攻击性机动。高潮是两架飞机正面相向的大角度机头对机头交战。
这不是按照剧本演练的飞行。两架战斗机真的在拼命机动试图击落对方。X-62A前后座都有人类飞行员,但他们没有触碰操纵杆。他们仅担任安全监控角色。AI在没有人类干预的情况下自主判断情况并控制飞机。
在21次测试飞行中,团队修改了超过10万行飞行相关软件。AI飞行更精确,在安全规定的边缘运行,并凭借计算机更快的观察-定向-决策-行动循环展示出更快的反应。当人类飞行员为后续射击而机动但有机会却不尝试正面射击或机会射击时,AI则尽可能快地开火。这最终造成了差距。
美国空军以国家安全为由未公开具体胜负结果。但参与测试人员的证词表明,AI的性能稳定得令人惊讶。首席试飞员比尔·格雷评价说:"X-62A通过解决近距格斗这一极其复杂的问题,证明了非确定性AI可以安全地应用于航空航天系统。"
从飞行员的角度来看,这种变化的体感是确切的。在模拟器中与AI对战时,会残留一种对手被困在游戏规则中的感觉。但转到X-62A后,AI不再是像素和向量。它是一个数吨重的金属块从你身旁呼啸而过,它产生的尾流和闭合角可能使你的飞机失速。速度不是数字而是冲击,G力不是屏幕上的而是压在颈椎上的。
DARPA ACE项目经理赖安·赫夫龙中校强调:"在所有领域,研究只能按工具允许的速度推进。VISTA的最新升级使其成为更有效的测试平台,实现了AI自主技术的快速集成和安全测试。这使我们将AI自主技术的实际规模飞行测试提前了至少一年。"
ACE项目和X-62A VISTA实验留下的信息很明确。如果阿尔法空战展示了可能性,那么ACE创造了可验证的现实。空战的图灵测试不仅仅在于胜负——而在于能否在通过现实世界的安全和信任标准的同时进行那场战斗。X-62A实实在在地跨过了那道门槛。模拟器中的天才重生为现实世界的战士。
5. 肯德尔部长登机:将武器发射交给AI飞行员
坐进驾驶舱的那一刻,所有争论突然安静下来。在会议室里争论自主性如何、伦理如何是容易的事。关上座舱盖滑向跑道时,那些话语全部重新获得了分量——因为现在回答的不是概念,而是重力。
2024年5月2日,一位七十多岁的老人站在加利福尼亚爱德华兹空军基地灼热的跑道上。他是美国空军部长弗兰克·肯德尔。他不是一个简单的行政官员。作为冷战时期的陆军军官,他一生都是国防技术工程师和采办专家。他来这里不是简单地视察,而是决心冒着生命危险亲自登上AI驾驶的战斗机,以决定他所推动的AI无人战斗机项目的命运。
他登上的正是经历了无数次测试的X-62A VISTA。肯德尔坐在前座,安全飞行员占据后座。盾牌AI公司(Shield AI)为这次飞行搭载了基于强化学习的人工智能。盾牌AI是2021年收购赫伦系统的公司——就是那个赫伦系统,2020年在阿尔法空战中以5比0击败人类飞行员的AI的创造者。搭载的自主代理是那个冠军AI的直系后代。
座舱盖关闭,发动机轰鸣点火。起飞后不久,肯德尔部长迎来了历史性时刻:他将控制权移交给了AI。"我的操纵杆上有一个按钮,基本上就是启动了自动化,"他后来解释说。当他们进入爱德华兹上空的训练空域时,扮演假想敌的有人驾驶F-16战斗机逼近。
肯德尔搭乘的X-62A立即进入战斗模式。战斗开始了,但肯德尔和后座安全飞行员都没有碰操纵杆和油门。飞机自主地猛烈盘旋,为咬住敌机尾部而机动。AI带着肯德尔做出了最高5G的剧烈机动。体重变为五倍的压力。对于七十多岁的老人来说,这绝非轻松的负担。在这种压力下,AI冷静地计算敌机的预测轨迹,不断扭转飞机以抢占有利位置。
时速超过885公里的闪电般机动接连不断。两架飞机在约300米内相互追逐,几乎正面相遇,扭转翻滚以迫使对方进入脆弱位置。高空中的近距并非人际关系中的近距。两架飞机在300米内鼻尖对鼻尖旋转,各自等待对方的失误——在这个距离上,一个小错误就意味着立即死亡。
每当对手的火控雷达试图锁定时,AI就巧妙地进行规避机动,同时寻找反击机会。人类飞行员驾驶的F-16猛烈攻击,但X-62A的AI不露破绽。它反而在人类无法预测的时机发动反击并占据优势。
约一小时的激烈飞行结束后返回基地,肯德尔部长面色潮红。他从驾驶舱走下时面带微笑。在随后召开的新闻发布会上,他发表了全世界瞩目的声明:"飞行中看到的足以让我相信,可以将战争中是否发射武器的决定权交给这个仍在学习中的AI。"
这一声明立即引发争议。武器控制专家和人道主义组织对AI有朝一日可能在没有额外人类协商的情况下自主投放致命炸弹深表关切。国际红十字委员会警告说:"将生死决定交给传感器和软件存在广泛而严重的担忧。"但肯德尔强调,使用武器时系统中始终会有人类监督。"没有这项技术才是安全风险。在这个时间点上,我们必须拥有它。"
从飞行员的角度看,武器发射不是按一个按钮那么简单。武器发射是一连串责任,涵盖战术、识别、交战规则、友军位置、弹种的后续爆炸效果。空战中的发射决定往往必须在一秒内做出,但那一秒内包含的判断要素比想象的要复杂得多。传感器可能被欺骗,目标可能使用欺骗手段,数据链可能中断,人类可能误判。AI并非不会误判——而是误判的形式不同。人类因疲劳和恐惧而动摇,AI可能在训练分布之外表现出奇怪的确信。因此,将武器发射交给AI的问题不在于AI是否更聪明,而在于我们能用什么安全机制来封堵其失误模式。
肯德尔的登机演示也是向国会和国防预算官员发出的强烈信号。美国空军已经判断,仅靠F-35和下一代战斗机无法抵挡中国的数量优势。解决方案就是有人-无人协同体系:一架有人战斗机率领三到五架AI控制的无人战斗机编队。空军计划到2028年至少部署1,000架以上的AI无人战斗机。F-35或下一代战斗机指挥多架AI僚机,将危险任务交给AI,人类在后方指挥。
肯德尔补充说:"这是一个变革性时刻。几十年来我们只能想象的自主空战潜力现在已成为现实。不久的将来,空军将分为两类:采用这项技术的空军,和因为没有采用而败给他们的空军。"
盾牌AI产品高级副总裁布雷特·达西解释说:"我们已经证明了从实验室到真实飞机的路径——不仅是将技术带到那里,还证明了我们团队支持必要的法规合规、测试和验证的方法。"据他介绍,搭载的自主系统不是为民用而建的,也不是为了从A点飞到B点。它是为了执行更精密的任务而建的:动态推理敌人在哪里、敌人在做什么、以及如何定位自己的飞机以同时满足安全和武器效能。
VISTA的军方操作人员表示,世界上没有其他国家拥有这样的AI喷气机。软件先在模拟器中用数百万个数据点学习,然后在实际飞行中测试结论,而实际性能数据又反馈到模拟器中让AI进一步学习——形成良性循环。中国也有AI,但没有迹象表明它找到了在模拟器之外进行此类测试的方法。就像初次学习战术的初级军官一样,有些经验只能在空中获得,VISTA的试飞员们如此说道。
首席试飞员比尔·格雷的话总结了这一切:"在真正飞起来之前,一切都是猜测。弄清楚这一点花的时间越长,部署有用系统的时间就越长。"
自2023年9月首次AI控制格斗飞行以来,VISTA已执行了约24次类似飞行。但该项目从每次交战中学习得如此之快,以至于在VISTA上测试的某些AI版本已经在空对空战斗中击败了人类飞行员。
这个基地的飞行员知道,他们在某种意义上可能正在训练自己的继任者,或者在塑造一个需要更少飞行员的未来结构。但他们也说,如果美国自己没有AI控制飞机的舰队,他们不想在天空中面对拥有AI控制飞机的敌人。"我们必须继续奔跑。而且必须跑快,"肯德尔说。
冷静地说,这一事件的真正信息不是"AI发射武器",而是系统朝着AI发射武器方向演进的激励太强了。速度、成本、生存力——战场变得太快,人类无法每次都参与决策循环;在有人-无人混合编队中,人类直接控制每次武器发射的方式存在可扩展性的极限。
未来的现实图景大致如下:和平时期和灰色地带,人类控制加强,AI主要以推荐和预警模式运行。高强度战时,人类预先设定政策和红线,AI在有限条件下扩大交战权限。最终阶段,从"人类始终按下按钮"转向"人类设计不需要按下按钮的条件"。
肯德尔在驾驶舱里看到的,正是这一转变的第一页。人们可能还没有准备好阅读那一页,但天空已经翻到了下一章。
如果1947年查克·耶格尔驾驶X-1突破音障开启了超音速时代,那么2024年弗兰克·肯德尔驾驶X-62A开启了AI空战时代。那一天,机器在没有人类帮助的情况下独自飞上天空,与人类对决,并从人类领袖那里获得了合格的评价。天空的主宰权不再仅属于人类。算法王牌的时代已经从跑道上腾空而起。
#DARPA_阿尔法空战试验 #AlphaDogfight试验2020 #DARPA_ACE项目 #赫伦系统AI空战 #Heron_Systems强化学习 #AI空中格斗模拟 #人类对人工智能飞行员 #阿尔法空战5比0 #Banger飞行员AI对决 #强化学习战斗机AI #X62A_VISTA自主飞行 #X62A_AI空战2023 #VISTA_F16_AI飞行员 #爱德华兹空军基地AI测试 #弗兰克肯德尔AI战斗机登机 #Frank_Kendall_X62A #肯德尔部长自主武器发射 #DARPA_ACE第三阶段 #AI_BFM空中格斗机动 #深度强化学习战斗 #EpiSci_AI战斗 #盾牌AI自主空战 #Calspan_X62A_VISTA #AI飞行员武器发射权限 #人工智能自主飞行员信任 #模拟走向真实天空 #AI战斗机图灵测试 #无人战斗机自主交战 #阿尔法空战决赛结果 #AI对TopGun飞行员 #空中格斗AI算法 #强化学习数百万次虚拟战斗 #AI驾驶F16飞行测试 #ACE项目实战部署 #自主空中作战系统 #AI僚机战斗实验 #DARPA自主战斗机项目 #AI空对空战斗 #金京镇AI战斗机 #金京镇天空主宰者 #金京镇人工智能战斗机著作 #金京镇AI霸权战争 #金京镇AI国防政策 #金京镇LAWS自主杀伤性武器 #金京镇AI军事技术著作 #金京镇AI政策 #金京镇AI行政革命 #金京镇国防产业AI #金京镇无人机战争未来
1. DARPA的挑战:人工智能能否击败人类飞行员?
2019年秋天,五角大楼某处提出了一个问题:机器能在空中击败人类战斗机飞行员吗?这并非简单的好奇心。美国国防高级研究计划局——通常被称为DARPA——提出的这个问题,与七十年前艾伦·图灵问出"机器能思考吗"一样,是一个根本性的挑战。
DARPA是一个奇特的组织。表面上看像是官僚化的政府机构,实际上更像是疯狂科学家的游乐场。互联网就诞生于此。GPS也是从这里走向世界的。隐身战斗机的种子也是他们播下的。说它是唯一一个敢于押注不可能、失败了也没关系的政府机构,一点都不过分。
这一次,他们向空中格斗——这一长期由人类本能和直觉主导的领域——发起了挑战。名为"空战进化"(Air Combat Evolution,简称ACE)的项目就此启动。项目经理是丹·雅沃尔塞克上校,呼号"动物"。作为前F-16飞行员,他比任何人都了解战斗机飞行员的心理。战斗机飞行员是怎样的人?他们是以握住操纵杆与敌人搏斗为荣的人。让他们把性命交给机器,近乎是一种侮辱。
"动物"上校决定正面突破这种抵触。他用一个历史类比来解释这一挑战的意义。1939年,美国陆军参谋长乔治·马歇尔将军问骑兵司令约翰·赫尔将军,如何应对德国的闪电战。赫尔将军的回答是这样的:把马装上拖车运到前线以保存体力,然后在战场上压倒坦克。当然,历史并没有按他的想法发展。骑兵消失了,坦克主宰了战场。
"动物"发出警告:如果今天的战斗机飞行员不想成为21世纪的骑兵,就必须接受人工智能这辆新坦克。但如何打破飞行员的不信任呢?百闻不如一见。"动物"决定让人工智能在一对一空战中击败人类顶尖高手。这就是"阿尔法空战试验"(AlphaDogfight Trials)诞生的背景。
为什么偏偏选择近距格斗?现代空战正在向视距外导弹发射方式转变,称为BVR交战。那为什么要选择二战式的近距格斗?这有深层原因。
第一,近距格斗是一个封闭世界的问题。就像围棋一样,规则明确但可能性几乎无限。这种环境非常适合人工智能通过强化学习来提升能力。DARPA将近距格斗视为通往更复杂空战任务的入口。
第二,近距格斗是OODA循环的极限试验场。观察、定向、决策、行动——这一决策过程在近距格斗中于瞬息之间完成。在这里超越人类,就证明了人工智能的运算速度和判断力已经超越了人类的生理极限。
第三,它也是建立信任的起点。飞行员从训练初期就通过近距格斗来打磨基本功。如果人工智能能在这一最基本、最本能的领域压倒人类,飞行员将不得不认可其能力。
约翰·霍普金斯应用物理实验室(APL)在此次比赛中扮演了核心角色。他们建造了一个名为"斗兽场"(Colosseum)的AI竞技场——名字取自古罗马角斗士搏杀的圆形竞技场。该系统将开源飞行动力学软件JSBSim与APL开发的中间件、自主算法和可视化软件相结合,能够以超过实时的速度运行模拟。人工智能代理在这片虚拟天空中死去又重生数千万次,在此过程中学会了战斗。
2019年8月,DARPA选出了八支队伍。这被称为"精英八强"的团队来自不同背景——从洛克希德·马丁和波音这样的国防巨头,到赫伦系统公司(Heron Systems)和PhysicsAI这样的小型AI专业企业,再到佐治亚理工研究所这样的大学研究团队。他们的任务是开发完美理解F-16飞行动力学、执行基本战斗机动追咬敌机尾部、并用航炮击落对手的算法。导弹被排除在外。只有飞机的机动性能和航炮瞄准能力决定胜负——这是最原始的战斗形式。
比赛分三个阶段进行。2019年11月的第一次试验本质上是表演赛。当时的AI连飞行都做不好,频频坠地。研究人员后来回忆:"早期阶段,AI甚至不知道怎么操控飞机。不坠毁就算成功了。"但仅仅几个月后,情况就发生了剧变。
到2020年1月的第二次试验时,AI已经开始模仿人类飞行员使用的基本战术。新冠疫情延长了项目周期,5月增加了虚拟的第2.5次试验,到8月的决赛阶段,AI已经开始展示人类想象不到的机动。
DARPA副局长大卫·霍尼在开幕致辞中说:"在构建这个项目时,有一些必须回答的重要问题。我们需要了解AI自主算法是否能在空对空战斗这一极其苛刻的环境中真正发挥作用。"
比赛引起了巨大关注。来自93个国家的约一万人注册观看,另有五千人申请参与。阿尔法空战试验的独特之处在于采用了电子竞技赛事的形式。APL团队设立了一个"控制区"角落,以ESPN的体育中心为蓝本打造解说空间。空战和自主技术专家讨论了AI与近距格斗的基础知识、AI和人类飞行员的训练方法,提供了兼具教育性和趣味性的分析与解说。
这不仅仅是一场技术竞赛。这是人类长期垄断的天空霸权的首次正式考验。在OODA循环的速度竞赛中,AI能否超越人类?在人类直觉主导的领域,机器计算能否获胜?2020年8月,全世界都在等待答案。
2. 赫伦系统的旋风:以强化学习武装的AI
最强大的夺冠热门无疑是洛克希德·马丁。F-22猛禽、F-35闪电II——打造了现役最强战斗机的他们,对战斗机物理学和空战教义的了解无人能及。数十年积累的航空动力学专业知识、数千名工程师、天文数字般的研究预算。怎么看他们都占据优势。
相比之下,赫伦系统公司是一家只有约30名员工的小型软件企业。他们从未制造过战斗机,也从未驾驶过战斗机。这家总部位于马里兰州的小公司能与国防巨头并肩,本身就显得不可思议。但他们有一件秘密武器:对深度强化学习近乎狂热的执着与投入。
强化学习的原理很简单。选择一个动作,观察结果,获得奖励或惩罚,下一次选择更好的动作。以疯狂的速度不断重复。这类似于幼儿学走路——摔倒,爬起来,再摔倒,再爬起来。但AI与幼儿不同。它不知疲倦,不会沮丧,一天可以摔倒再爬起来数百万次。
赫伦系统的方法与传统国防企业截然不同。洛克希德·马丁和极光飞行科学等团队试图将战斗机飞行员的知识灌输给AI——教它"咬住敌机尾巴"、"保存能量"等规则,这就是所谓的专家系统方法。赫伦却不同。他们什么都不教AI。而是把它丢进虚拟环境中,让它不断地杀戮与被杀。
赫伦的AI代理名叫"猎隼"(Falco),取自猎鹰。猎隼通过自我对弈——在虚拟空间中不断与自己战斗——来成长。昨天的自己开发新战术击败今天的自己,明天的自己又打破那些战术,如此无限循环。
据赫伦的机器学习工程师本·贝尔介绍,猎隼在大约五周时间内,对阵由102个不同AI代理组成的联赛,进行了数十亿次近距格斗,累计超过40亿个模拟步骤。换算成人类飞行时间,相当于积累了约30年以上的飞行经验。考虑到真实飞行员一辈子很难超过2,000至3,000小时,这是超越物理时间限制的压缩时间的胜利。
在这个过程中出现了一个有趣的现象。在早期学习阶段,AI努力模仿人类教官教授的标准机动——管理能量、保持转弯率,教科书式的动作。但随着学习的深入,AI开始抛弃人类教义,转而在模拟引擎物理定律允许的范围内追求极限效率。
人类飞行员试图平稳地控制飞机以保持对敌机的视觉追踪。赫伦的AI不同。它对操纵面进行持续的、微小的、粗暴的修正——每秒数十次调整。这是人类双手不可能做到的动作。通过这种方式,它创造出令人难以置信的精确射击角度。
赫伦系统成功的背后有两项精妙的技术:奖励塑造和课程学习。奖励塑造为AI提供更频繁的反馈——不仅在击落敌机时给予奖励,在占据有利位置或接近敌机尾部时也给予小奖励。课程学习从简单的对手开始,逐步增加难度,就像从小学升到中学再到高中。
APL开发的敌方AI代理在复杂性方面涵盖了广泛的范围。最简单的"僵尸"以直线水平飞行模拟巡航导弹。基础代理"洛基"执行基于时间的微小高度和速度变化。脚本代理"BUD FSM"能识别交战状态并执行预定反应。最高级别的强化学习代理"AlphaMav0"完全通过自我对弈开发,无需人类输入,模拟专家级飞行员。
比赛第三天,半决赛和决赛进行时,赫伦系统的AI展示了一项令人震惊的战术:正面攻击——迎头射击。这意味着与敌机正面相对冲锋并开炮。人类飞行员因碰撞风险将这一机动视为禁忌——通常不在135度以上的角度射击。相互碰撞的风险很大,被摧毁敌机的碎片可能被吸入自己的发动机。但对于没有死亡恐惧的AI来说,这是获胜概率最高的公式。
半决赛对阵极光团队时,赫伦一开战就以可怕的速度直扑敌机正面。解说员格洛克震惊了:"赫伦毫不犹豫。战斗一开始就露出杀气,直奔对手鼻子。"
在与洛克希德·马丁的决赛中,赫伦将这一战术发挥得淋漓尽致。洛克希德的AI反映了人类教义——管理能量、抢占位置,动作优雅而正统。赫伦的AI拒绝这种绅士般的战斗。它像疯狗一样扑上去撕咬每一个破绽。它的航炮精度惊人——炮口仿佛像磁铁一样吸附在敌机上。一旦锁定,绝不松手。在一闪而过的瞬间给予敌机致命打击。在人类眼中认为不可能射击的角度,AI的计算中却是命中概率超过90%的机会。
大卫击败了歌利亚。赫伦系统在决赛中以16胜4负的压倒性优势击败洛克希德·马丁,登上冠军宝座。30人的小团队击败了拥有数万名工程师的国防巨头。这一事件表明,数据学习能力可能比领域知识更重要。训练AI的方法论比制造战斗机的经验更具决定性。
赫伦系统的旋风证明了AI能够超越对人类的简单模仿,通过数据和模拟创造出人类从未发现的新的胜利语法。而现在,最后的对手——人类飞行员——正在等待着他们。
3. 人类对AI:5比0
在全世界通过YouTube直播观看的注视下,2020年8月20日下午,重头戏开始了。代表人类出战的飞行员呼号是"砰手"(Banger)。他是美国空军武器学校毕业生,仅F-16飞行时间就超过2,000小时,是老兵中的老兵。他隶属于华盛顿特区空军国民警卫队,由于行动安全原因未公开全部身份,但他是美国空军最顶尖的飞行员之一。他不仅飞行技术精湛,更是研究和教授无数战术的教官。
"砰手"戴上VR头盔,坐进了模拟器。APL团队开发的ADT VR系统旨在为飞行员提供与AI代理获得的一致信息。除了传统的平视显示器外,VR头盔还呈现了特殊组件以增强对威胁和相对位置的态势感知。这是一场公平的战斗——至少在信息方面是如此。
在过去几天里,"砰手"一直在观看AI的比赛并分析它们的模式。赫伦在初期正面攻击方面很强。避开那个区域,把战斗拖入持久战,迫使对方进行能量对抗。这就是人类的战略,源自数千小时飞行经验的判断。
比赛共进行五个回合,从不同高度的中立条件开始。第一回合以中立交汇开始——两架飞机正面相向交叉。通常的人类飞行员会展开转弯竞赛以咬住对方尾部。如预期,"砰手"试图避开赫伦的正面交锋,降低高度同时转弯。但赫伦的反应比预想快得多。它以人类肉眼难以追踪的速度转向机头,切入"砰手"的盲区。交叉后,在人类未预料的时机急剧转向并锁定射击角度。"砰手"还没来得及判断情况就被击中了。第一次交战瞬间以赫伦的胜利告终。解说员们目瞪口呆:"AI的反应速度完全摧毁了OODA循环。"当人类还在观察和判断时,AI已经完成了决策和行动。
第二和第三回合,"砰手"改变了战术。他试图利用AI不依赖视觉而拥有完美状态信息这一点,用激烈的机动来逃脱AI的预判——急剧改变高度,进行垂直机动来扰乱AI。但赫伦的反应就像提前知道"砰手"的动作一样。无论"砰手"做什么机动,猎隼都即时反应——以毫秒级速度切入"砰手"的转弯半径内侧,或在"砰手"建立射击位置之前率先开火。赫伦的航炮无误差地击中"砰手"的飞机。
"砰手"无法掩饰困惑:"作为战斗机飞行员训练的标准动作根本不管用。"
第四和第五回合,"砰手"尝试了极端低空机动,冒着撞地风险引诱AI。他下降到1,300英尺——约400米——这是人类会感到撞地恐惧的高度。但对AI来说,恐惧是不存在的。第五次交战中,"砰手"使用激进的平面外机动在初始交汇中幸存并延长了战斗。但赫伦毫不动摇。它冷静地保持高度,占据从上往下俯瞰的有利位置,紧追不舍,最终锁定"砰手"的尾部将其击落。
最终比分5比0。人类完败。更令人震惊的是内容——人类飞行员始终未能对AI发出一次有效攻击。所有时间都花在了规避机动上,而即便如此最终也未能成功。
"砰手"浑身是汗地走出模拟器,在采访中坦率地讲述了这次令人震惊的经历。"作为战斗机飞行员训练的标准内容不起作用了,"他解释说,"我们在动态环境中进行复杂的物理计算。我试图解决角度和各种接近速度、空速差等问题,以到达能够对敌机使用武器的位置。"
关于赫伦的瞄准能力,他叹为观止:"赫伦的瞄准能力优于其他任何对手。"他说自己试图通过机动来躲避AI的射击,但AI计算了他的每一个微小动作,顽强地保持瞄准。纳秒级的调整能力,加上两架飞机之间完美的状态信息,使其能够进行极其精确的控制。
"砰手"坦言,AI将飞机置于可能与对方碰撞的位置让他感到不安。"高偏角航炮射击也是如此。AI可以利用这一点。"AI将飞机放在人类感到不舒服的位置,并从人类不会尝试的角度射击。
"动物"上校分析了这一结果:"AI程序精确飞行的能力,使其能够无视人类空军飞行员所训练的飞行安全规则。这最终在模拟战斗中提供了优势。"
这个5比0的结果传递的信息超越了技术本身。空战中人类至上的前提可以被打破。这种打破不是来自装备差距,而是来自决策差距。一旦被打破就难以逆转,因为AI不是记忆战术,而是学习战术。
老兵感受到的真正冲击是认知负荷的极限。人类同时进行飞行控制、搜索敌机、战术判断、通信等,消耗巨大的精神能量。但AI并行处理所有这一切,毫不疲倦。人类凭直觉判读的,AI用概率判读——并以残酷的一致性执行。
"砰手"震惊的原因不是他一生习得的感觉变得无用了,而是那种感觉不再是决定性优势了。人类依然优秀,但优秀的定义正在改变。
然而"砰手"并未绝望。他在承认AI能力的同时,留下了重要的洞见:"这不是终点。如果我们能让这项技术为我们所用,我们将成为战场上无敌的团队。"解说员格洛克也持同样看法:"我们信任有效的东西。"飞行员们开始从恐惧AI转向思考:如果这样的AI做我的僚机,该多令人安心。
这场对决录得超过44万次观看量,被航空航天界和五角大楼认定为改变游戏规则的事件。DARPA战略技术办公室主任蒂姆·格雷森博士说:"这些结果展示了未来空战系统和包含人机共生概念的巨大潜力。"
阿尔法空战试验改写了空战历史。它证明了AI不仅仅是辅助工具,还可以成为超越人类的致命战斗员。但同时也暴露了局限性——AI的强大仅存在于模拟的受控环境和完美信息条件下。
5比0的记分牌不仅仅是一个数字。它是即将到来时代的预告,也是对人类飞行员发出的严肃警告。今后,飞行员的价值将从谁飞得更好转向谁监督和设计得更好。AI执行机动,人类设计任务、规则和责任。这不是降级——而是角色的转移。
现在的任务是将这个玻璃盒中的天才带到粗犷而不可预测的真实天空中。在模拟中学到的东西能在现实中复现吗?在没有完美信息的世界里,AI还能击败人类吗?寻找答案的旅程即将启程。
4. ACE项目与X-62A VISTA:从模拟走向真实天空
2020年8月的某一天,全世界航空专家在屏幕前屏住呼吸,目睹赫伦系统的人工智能以5比0完胜人类老兵飞行员。然而爱德华兹空军基地的试飞员们摇了摇头。"那只是电子游戏。"
他们的冷嘲是有道理的。模拟器中的天空永远是干净的。风按照数学公式吹拂,传感器不会撒谎,通信链路不会中断。最重要的是,犯了错只需按下重置键即可。在那个世界里,AI基于完美信息作战——可以精确到毫秒级别掌握敌机的位置、速度和方向。
然而真实战场截然不同。传感器上噪声如雪花般涌来,通信被敌方电子战截断,大气颠簸着飞机。虚拟世界中不存在的重力加速度压在飞行员脖子上,坠毁不是游戏结束,而是意味着死亡。
DARPA正是为了弥合这一鸿沟而行动的。2019年启动的ACE项目——全称"空战进化"(Air Combat Evolution)。该项目的目标不仅仅是让AI驾驶飞机。而是要发展人类飞行员信任AI并共同组队作战的能力。DARPA将空战作为"挑战问题"。理由是:如果能在空战的极端速度和不确定性中建立信任,其他领域将更容易解决。
ACE项目分为三个阶段。第一阶段用18个月在模拟环境中验证和开发核心能力——阿尔法空战试验就是这一阶段的一部分。第二阶段用16个月进行无人机飞行测试,将算法转移到小型无人机上。第三阶段是在实际战斗机规模的飞机上进行测试。
这一计划的核心是一架独特的战斗机:X-62A VISTA——可变飞行模拟试验飞机(Variable In-flight Simulator Test Aircraft)。外观上看起来像一架普通的F-16D双座战斗机。但其内部是一个完全不同的世界。由洛克希德·马丁的臭鼬工厂与卡尔斯潘公司合作打造的这架怪异飞机,仅通过更改软件设置就能模拟其他飞机的飞行特性。想要F-35的操控感?设置即可。想要再现MQ-9无人机的运动?再调整设置。就像变色龙根据周围环境改变颜色一样,VISTA可以在空中变换自己的身份。
DARPA在这架由爱德华兹空军基地美国空军试飞员学校持有的独一无二的飞机上,安装了名为SACS的系统——自主控制模拟系统(System for Autonomous Control of Simulation)。这个接口让AI代理能够直接连接飞机的飞控计算机,控制副翼、方向舵、升降舵和发动机推力。
当然,安全措施必不可少。你不能把一架价值数十亿的战斗机操纵杆随便交给刚诞生的AI。AI可能出现Bug导致飞机俯冲坠地,或试图超出飞机结构极限的机动。为此,后座安排了人类安全飞行员,一旦AI试图进行危险机动或失控,该飞行员可立即介入夺回控制权。飞控计算机设定了安全包线,当AI试图超过9G机动或俯冲向地面时,软件会自动阻止。
2022年12月,历史性的飞行在加利福尼亚爱德华兹空军基地上空开始。12月1日至16日,X-62A进行了12次AI控制的飞行,在天空中度过了超过17小时。那些在模拟器中经历了数千万次试错学习的代码块,现在正在控制真实的喷气发动机推力、管理升力,飞越物理意义上的天空。
这个过程并非一帆风顺。在模拟中完美的AI在遇到真实世界的乱流时出现了轻微颤抖,传感器数据延迟导致反应变慢。有些天AI过于被动,有些天它试图超出飞机极限的机动,触发了安全切断装置。
但VISTA测试的真正价值在于快速迭代。通常,验证新的战斗机软件需要数月——修改代码、地面验证、获得飞行许可、再次飞行。ACE团队通过VISTA每天更新代码。如果上午飞行中发现AI错误,工程师午餐时间修正代码、运行模拟,下午飞行中立即应用。爱德华兹基地试飞学校的教官们证实:"过去需要一年的修正在一天内就解决了。"工程师可以在几分钟内更换X-62A上搭载的自主算法,飞行员可以在几小时内测试不同团队的AI。
2023年9月,那一天终于到来了。在爱德华兹空军基地上空,AI驾驶的X-62A与人类驾驶的F-16战斗机进行了真正的空中格斗。想象一下:在600米高空,两架战斗机以1,900公里/小时的相对速度相向冲锋。当距离缩小到仅600米时,人类飞行员感受到本能的紧张,而AI毫无波动地计算最优位置。
最初是防御性机动,但很快升级为争相咬住对方尾部的攻击性机动。高潮是两架飞机正面相向的大角度机头对机头交战。
这不是按照剧本演练的飞行。两架战斗机真的在拼命机动试图击落对方。X-62A前后座都有人类飞行员,但他们没有触碰操纵杆。他们仅担任安全监控角色。AI在没有人类干预的情况下自主判断情况并控制飞机。
在21次测试飞行中,团队修改了超过10万行飞行相关软件。AI飞行更精确,在安全规定的边缘运行,并凭借计算机更快的观察-定向-决策-行动循环展示出更快的反应。当人类飞行员为后续射击而机动但有机会却不尝试正面射击或机会射击时,AI则尽可能快地开火。这最终造成了差距。
美国空军以国家安全为由未公开具体胜负结果。但参与测试人员的证词表明,AI的性能稳定得令人惊讶。首席试飞员比尔·格雷评价说:"X-62A通过解决近距格斗这一极其复杂的问题,证明了非确定性AI可以安全地应用于航空航天系统。"
从飞行员的角度来看,这种变化的体感是确切的。在模拟器中与AI对战时,会残留一种对手被困在游戏规则中的感觉。但转到X-62A后,AI不再是像素和向量。它是一个数吨重的金属块从你身旁呼啸而过,它产生的尾流和闭合角可能使你的飞机失速。速度不是数字而是冲击,G力不是屏幕上的而是压在颈椎上的。
DARPA ACE项目经理赖安·赫夫龙中校强调:"在所有领域,研究只能按工具允许的速度推进。VISTA的最新升级使其成为更有效的测试平台,实现了AI自主技术的快速集成和安全测试。这使我们将AI自主技术的实际规模飞行测试提前了至少一年。"
ACE项目和X-62A VISTA实验留下的信息很明确。如果阿尔法空战展示了可能性,那么ACE创造了可验证的现实。空战的图灵测试不仅仅在于胜负——而在于能否在通过现实世界的安全和信任标准的同时进行那场战斗。X-62A实实在在地跨过了那道门槛。模拟器中的天才重生为现实世界的战士。
5. 肯德尔部长登机:将武器发射交给AI飞行员
坐进驾驶舱的那一刻,所有争论突然安静下来。在会议室里争论自主性如何、伦理如何是容易的事。关上座舱盖滑向跑道时,那些话语全部重新获得了分量——因为现在回答的不是概念,而是重力。
2024年5月2日,一位七十多岁的老人站在加利福尼亚爱德华兹空军基地灼热的跑道上。他是美国空军部长弗兰克·肯德尔。他不是一个简单的行政官员。作为冷战时期的陆军军官,他一生都是国防技术工程师和采办专家。他来这里不是简单地视察,而是决心冒着生命危险亲自登上AI驾驶的战斗机,以决定他所推动的AI无人战斗机项目的命运。
他登上的正是经历了无数次测试的X-62A VISTA。肯德尔坐在前座,安全飞行员占据后座。盾牌AI公司(Shield AI)为这次飞行搭载了基于强化学习的人工智能。盾牌AI是2021年收购赫伦系统的公司——就是那个赫伦系统,2020年在阿尔法空战中以5比0击败人类飞行员的AI的创造者。搭载的自主代理是那个冠军AI的直系后代。
座舱盖关闭,发动机轰鸣点火。起飞后不久,肯德尔部长迎来了历史性时刻:他将控制权移交给了AI。"我的操纵杆上有一个按钮,基本上就是启动了自动化,"他后来解释说。当他们进入爱德华兹上空的训练空域时,扮演假想敌的有人驾驶F-16战斗机逼近。
肯德尔搭乘的X-62A立即进入战斗模式。战斗开始了,但肯德尔和后座安全飞行员都没有碰操纵杆和油门。飞机自主地猛烈盘旋,为咬住敌机尾部而机动。AI带着肯德尔做出了最高5G的剧烈机动。体重变为五倍的压力。对于七十多岁的老人来说,这绝非轻松的负担。在这种压力下,AI冷静地计算敌机的预测轨迹,不断扭转飞机以抢占有利位置。
时速超过885公里的闪电般机动接连不断。两架飞机在约300米内相互追逐,几乎正面相遇,扭转翻滚以迫使对方进入脆弱位置。高空中的近距并非人际关系中的近距。两架飞机在300米内鼻尖对鼻尖旋转,各自等待对方的失误——在这个距离上,一个小错误就意味着立即死亡。
每当对手的火控雷达试图锁定时,AI就巧妙地进行规避机动,同时寻找反击机会。人类飞行员驾驶的F-16猛烈攻击,但X-62A的AI不露破绽。它反而在人类无法预测的时机发动反击并占据优势。
约一小时的激烈飞行结束后返回基地,肯德尔部长面色潮红。他从驾驶舱走下时面带微笑。在随后召开的新闻发布会上,他发表了全世界瞩目的声明:"飞行中看到的足以让我相信,可以将战争中是否发射武器的决定权交给这个仍在学习中的AI。"
这一声明立即引发争议。武器控制专家和人道主义组织对AI有朝一日可能在没有额外人类协商的情况下自主投放致命炸弹深表关切。国际红十字委员会警告说:"将生死决定交给传感器和软件存在广泛而严重的担忧。"但肯德尔强调,使用武器时系统中始终会有人类监督。"没有这项技术才是安全风险。在这个时间点上,我们必须拥有它。"
从飞行员的角度看,武器发射不是按一个按钮那么简单。武器发射是一连串责任,涵盖战术、识别、交战规则、友军位置、弹种的后续爆炸效果。空战中的发射决定往往必须在一秒内做出,但那一秒内包含的判断要素比想象的要复杂得多。传感器可能被欺骗,目标可能使用欺骗手段,数据链可能中断,人类可能误判。AI并非不会误判——而是误判的形式不同。人类因疲劳和恐惧而动摇,AI可能在训练分布之外表现出奇怪的确信。因此,将武器发射交给AI的问题不在于AI是否更聪明,而在于我们能用什么安全机制来封堵其失误模式。
肯德尔的登机演示也是向国会和国防预算官员发出的强烈信号。美国空军已经判断,仅靠F-35和下一代战斗机无法抵挡中国的数量优势。解决方案就是有人-无人协同体系:一架有人战斗机率领三到五架AI控制的无人战斗机编队。空军计划到2028年至少部署1,000架以上的AI无人战斗机。F-35或下一代战斗机指挥多架AI僚机,将危险任务交给AI,人类在后方指挥。
肯德尔补充说:"这是一个变革性时刻。几十年来我们只能想象的自主空战潜力现在已成为现实。不久的将来,空军将分为两类:采用这项技术的空军,和因为没有采用而败给他们的空军。"
盾牌AI产品高级副总裁布雷特·达西解释说:"我们已经证明了从实验室到真实飞机的路径——不仅是将技术带到那里,还证明了我们团队支持必要的法规合规、测试和验证的方法。"据他介绍,搭载的自主系统不是为民用而建的,也不是为了从A点飞到B点。它是为了执行更精密的任务而建的:动态推理敌人在哪里、敌人在做什么、以及如何定位自己的飞机以同时满足安全和武器效能。
VISTA的军方操作人员表示,世界上没有其他国家拥有这样的AI喷气机。软件先在模拟器中用数百万个数据点学习,然后在实际飞行中测试结论,而实际性能数据又反馈到模拟器中让AI进一步学习——形成良性循环。中国也有AI,但没有迹象表明它找到了在模拟器之外进行此类测试的方法。就像初次学习战术的初级军官一样,有些经验只能在空中获得,VISTA的试飞员们如此说道。
首席试飞员比尔·格雷的话总结了这一切:"在真正飞起来之前,一切都是猜测。弄清楚这一点花的时间越长,部署有用系统的时间就越长。"
自2023年9月首次AI控制格斗飞行以来,VISTA已执行了约24次类似飞行。但该项目从每次交战中学习得如此之快,以至于在VISTA上测试的某些AI版本已经在空对空战斗中击败了人类飞行员。
这个基地的飞行员知道,他们在某种意义上可能正在训练自己的继任者,或者在塑造一个需要更少飞行员的未来结构。但他们也说,如果美国自己没有AI控制飞机的舰队,他们不想在天空中面对拥有AI控制飞机的敌人。"我们必须继续奔跑。而且必须跑快,"肯德尔说。
冷静地说,这一事件的真正信息不是"AI发射武器",而是系统朝着AI发射武器方向演进的激励太强了。速度、成本、生存力——战场变得太快,人类无法每次都参与决策循环;在有人-无人混合编队中,人类直接控制每次武器发射的方式存在可扩展性的极限。
未来的现实图景大致如下:和平时期和灰色地带,人类控制加强,AI主要以推荐和预警模式运行。高强度战时,人类预先设定政策和红线,AI在有限条件下扩大交战权限。最终阶段,从"人类始终按下按钮"转向"人类设计不需要按下按钮的条件"。
肯德尔在驾驶舱里看到的,正是这一转变的第一页。人们可能还没有准备好阅读那一页,但天空已经翻到了下一章。
如果1947年查克·耶格尔驾驶X-1突破音障开启了超音速时代,那么2024年弗兰克·肯德尔驾驶X-62A开启了AI空战时代。那一天,机器在没有人类帮助的情况下独自飞上天空,与人类对决,并从人类领袖那里获得了合格的评价。天空的主宰权不再仅属于人类。算法王牌的时代已经从跑道上腾空而起。
#DARPA_阿尔法空战试验 #AlphaDogfight试验2020 #DARPA_ACE项目 #赫伦系统AI空战 #Heron_Systems强化学习 #AI空中格斗模拟 #人类对人工智能飞行员 #阿尔法空战5比0 #Banger飞行员AI对决 #强化学习战斗机AI #X62A_VISTA自主飞行 #X62A_AI空战2023 #VISTA_F16_AI飞行员 #爱德华兹空军基地AI测试 #弗兰克肯德尔AI战斗机登机 #Frank_Kendall_X62A #肯德尔部长自主武器发射 #DARPA_ACE第三阶段 #AI_BFM空中格斗机动 #深度强化学习战斗 #EpiSci_AI战斗 #盾牌AI自主空战 #Calspan_X62A_VISTA #AI飞行员武器发射权限 #人工智能自主飞行员信任 #模拟走向真实天空 #AI战斗机图灵测试 #无人战斗机自主交战 #阿尔法空战决赛结果 #AI对TopGun飞行员 #空中格斗AI算法 #强化学习数百万次虚拟战斗 #AI驾驶F16飞行测试 #ACE项目实战部署 #自主空中作战系统 #AI僚机战斗实验 #DARPA自主战斗机项目 #AI空对空战斗 #金京镇AI战斗机 #金京镇天空主宰者 #金京镇人工智能战斗机著作 #金京镇AI霸权战争 #金京镇AI国防政策 #金京镇LAWS自主杀伤性武器 #金京镇AI军事技术著作 #金京镇AI政策 #金京镇AI行政革命 #金京镇国防产业AI #金京镇无人机战争未来