AI书房
用书来读懂AI
这里收录金京镇律师的AI、法律、产业、历史、政治、文化主题在线书。每本书都按目录、序言、章节、尾声整理,方便连续阅读。
[AI书房] 第8章 Blindsight与Convoy:下一阶段
读脑者:Neuralink与人类最后的革命
第8章 Blindsight与Convoy:下一阶段
金京镇
一、FDA突破性医疗器械认定与视觉恢复项目
2024年9月17日傍晚,埃隆·马斯克在加利福尼亚州弗里蒙特的Neuralink总部写下一条简短的消息。他发布在X平台上的那句话不过寥寥数语:「Blindsight获得了FDA突破性医疗器械认定。」
这句话在全球视障群体中瞬间传开。对那些长年生活在黑暗中的人来说,这不是一条普通的监管新闻,而是黎明将至的信号弹。
Blindsight这个名字本身就是一个悖论。在神经科学中,这个术语原本指的是视觉皮层受损的患者虽然在意识层面看不见任何东西,却能在无意识中对视觉信息作出反应的奇特现象。Neuralink将这个名字赋予自己的项目,绝非偶然。
他们要做的事情是彻底绕过眼睛这个生物学输入装置,将影像直接射入大脑的视觉皮层。没有眼睛也能看见。视神经断了也能看见。从出生就不知光为何物的人也能看见。这就是Blindsight的承诺。
要理解FDA突破性医疗器械认定制度,需要先了解美国医疗监管的背景。这项制度创设于2012年,是一种优先审评资格,授予那些有潜力治疗危及生命或造成不可逆残疾的疾病的器械。获得认定后,企业可以与FDA专家进行更紧密的协商,临床试验设计获得更大灵活性,审评周期也会缩短。但这并不是上市批准。它只是站上了起跑线,而非冲过了终点。
Neuralink获得这项认定,背后是多年积累的动物实验数据。研究人员在猴子的视觉皮层植入电极并施加电刺激,反复验证动物在没有实际光源的情况下是否能感知光点。根据2025年夏季更新公布的信息,一只猴子已经携带视觉植入体健康生活了三年以上。Neuralink的工程师报告称,这只猴子对注入大脑的人工视觉信号的识别和反应准确率超过66%。
每当有人问这个项目的灵感从何而来,马斯克的回答总是一样的。星际迷航。他会提到电视剧里的角色乔迪·拉福吉。乔迪天生失明,却通过一种叫做VISOR的装置获得了比常人更宽广的视觉光谱。
马斯克的愿景走得更远:红外线、紫外线、甚至雷达波段都能看到的超人视觉。当然,那是遥远未来的事。正如他坦率承认的那样,早期版本的Blindsight将像雅达利游戏机的低分辨率画面一样粗糙。
但即便是这种粗糙,对某些人来说也是奇迹。全球约有20亿人患有视力障碍,其中超过4300万人完全失明。对于视神经受损或失去眼球的患者,现有的人工视网膜技术毫无用处。Argus II等既有装置需要视网膜保留部分功能才能工作。Blindsight跨越了这一限制,完全跳过眼睛,直接接入大脑枕叶。摄像头替代眼睛,计算机替代视神经,植入体直接刺激脑细胞。
2025年初,马斯克在威斯康星州一场公开活动中回答观众提问时给出了具体时间表:「六到十二个月内,我们将为第一位人类患者植入视觉植入体。」按照他的说法,2025年末或2026年初将完成这台历史性的手术。一个从出生起就看不见的人,生平第一次感知到光。那将是用工程力量重现圣经式奇迹的场景。
怀疑论者也发出了警告。大脑将人工电信号解读为有意义图像的过程极其艰难。先天失明者的视觉皮层从未处理过视觉信息,那片区域很可能已经被重新布线,用来处理听觉或触觉。施加电刺激时,大脑究竟会把它解读为光,还是当作无意义的噪声,没有人能打包票。FDA的认定承认了这项挑战已经走上了科学上合理的轨道,但终点线仍然遥远。
Blindsight项目抛出的问题不止于技术层面。如果这项技术成功了,我们或许需要重新定义「看见」的含义。只有视网膜接收、视神经传导的才算视觉吗?还是说,只要大脑通过任何途径处理了光学信息,那就是视觉?一个从出生就不知光为何物的人第一次看到的世界,和我们看到的世界是同一个吗?抑或是一种全新的知觉?这些问题还没有答案。要找到答案,首先得有人睁开眼睛。
二、通过视觉皮层刺激实现人工视觉的原理
1929年,德国神经科学家奥特弗里德·弗尔斯特有了一个惊人的发现。他在脑部手术中用电刺激患者的枕叶,患者明明闭着眼睛,却说看到了光点。他把这种现象命名为光幻视(phosphene)。从那一刻起,科学家们开始追问:如果电流能制造一个光点,那能不能制造足够多的光点来拼出一幅画?
光幻视的原理并不复杂。视觉皮层的神经元在进化中被设定为:接收到来自视网膜的电信号就解读为光。关键在于,神经元无法分辨信号的来源。无论信号来自视网膜还是电极,只要适当强度和模式的电刺激到达神经元,大脑就会把它识别为光。就像按下钢琴键,琴锤击弦发出声音一样,电极刺激神经元,光点就会出现。
1960年代和1970年代,基于这一原理的视觉假体研究正式起步。英国的贾尔斯·布林德利和美国的威廉·多贝尔进行了开创性实验。布林德利在1968年为一位52岁的失明女性患者的视觉皮层植入了80个电极。每当单个电极被激活,患者就能在视野的特定位置看到光点。多贝尔在此基础上发展出64通道系统,使患者能够在1.5米距离辨认15厘米大小的字母。这是视觉假体可行性的历史性证明。
然而这些早期尝试遇到了根本性瓶颈。电极数量太少。80个电极只能产生80个点,相当于一块8×10像素的显示屏。想想今天的智能手机屏幕提供数百万像素,就能想象当时技术所能呈现的图像有多粗糙。表面电极需要很大电流,长时间刺激有组织损伤的风险。手术本身也很危险,是需要打开颅骨的大手术,感染和出血风险都很高。
Neuralink的Blindsight正是站在这段历史之上。半个世纪积累的神经科学知识与21世纪的微工程技术在这里汇合。最大的区别在于电极数量。Neuralink的N1芯片容纳1024个以上的电极。正在开发的视觉恢复专用S2芯片预计将提供1600个以上的通道,是布林德利时代的20倍分辨率。
电极的设计也完全不同了。比头发还细的柔性电极丝能深入脑组织内部。视觉皮层并不只在大脑后方的表面。大部分视觉处理区域隐藏在被称为距状裂的深沟内侧。负责中央视野的神经元位于脑表面,但负责周边视野的神经元在这条沟的里面。传统的
表面电极无法触及这些区域。Neuralink的手术机器人R1能够精确插入电极丝,抵达深层皮质区域。
让我们沿着系统的工作流程走一遍。患者佩戴内置摄像头的特制眼镜,摄像头拍摄周围环境。影像数据传输到腰间的小型计算机。计算机从复杂画面中提取最关键的信息:轮廓、边界、障碍物的位置。这些信息被转换成电刺激模式,以无线方式传送到颅骨内的植入体。植入体通过数千个电极刺激视觉皮层的神经元。大脑将这些刺激识别为光点。点汇成线,线汇成形。
2020年发表的贝勒医学院研究在这个过程中提出了重要突破。丹尼尔·约瑟尔团队使用动态刺激代替静态刺激。不是同时激活多个电极,而是按顺序依次激活,像画线一样勾勒形状。就像用手指在别人背上写字,对方能读出那个字一样,给大脑施加移动的刺激比静止的点更容易被识别为形状。用这种方法,失明的参与者每分钟能识别86个图形。
然而最大的挑战不在技术,而在大脑的适应。先天失明者的大脑从未处理过视觉信息。那片区域并非空置,而是已经被回收用于其他感官,可能正在更精细地处理听觉或触觉。
对这样的大脑施加视觉刺激时,大脑会把它解读为光、解读为声音、还是体验为一种全新的感觉,没有人知道。
Neuralink团队试图用人工智能来解决这个问题。系统学习每位患者的大脑对不同刺激模式的反应,开发出个人化的最优刺激策略。机器适应大脑的同时,大脑也在适应机器,这是一个双向互动的过程。这可能不是几周或几个月,而是几年才能完成的长期康复历程。人工视觉不是像按开关那样瞬间获得的。它是一种需要缓慢地、艰苦地习得的能力,就像学一门新语言。
人工视觉的原理最终指向一个哲学问题:看见,到底是什么?摄像头拍摄、计算机处理、电极刺激、大脑识别,这算不算看见?这个问题的答案,恐怕在第一位Blindsight患者睁开眼睛的那一刻也不会揭晓。只有那个人自己知道自己经历的是什么,而即便如此,他也无法将它完整地传达给我们。因为语言是建立在共享经验之上的。一种全新的经验所需要的语言,尚不存在。
三、Convoy:机械臂控制与运动功能恢复
2025年1月的某天,Neuralink的X账号发布了一段30秒的视频。画面中,一只机械臂站在白板前。机械臂拿起马克笔,缓缓移动。一笔、两笔、三笔。字母出现了:C-O-N-V-O-Y。视频没有任何文字说明,只附了三个表情符号:爱心、机械臂、钢笔。但技术圈立刻读懂了其中的含义。有人仅凭思维控制机械臂写出了字。
Convoy这个词有护送、同行的意思。Neuralink将这个名字赋予新的临床试验项目,意味深长。如果说Telepathy项目是控制数字世界,那么Convoy就是控制物理世界。从移动屏幕上的光标,进一步到在现实世界中拿起物品、打开门、把杯子送到嘴边。对四肢瘫痪的患者来说,这是有尊严的日常生活的回归。
项目始于2024年11月。Neuralink宣布获得了FDA对新可行性研究的批准。这项研究允许现有的PRIME Study参与者交叉入组,评估N1植入体控制辅助机械臂的能力。Neuralink表示,这是恢复物理自由的重要第一步,不仅是数字自由。
要理解机械臂控制与鼠标光标控制的区别,需要了解自由度(degrees of freedom)这个概念。鼠标光标在二维平面上移动,只有X轴和Y轴两个方向。机械臂在三维空间中运动,还要加上手腕旋转、手指动作、抓握力度的调节。人的手臂有7个以上的自由度。要同时控制这一切,必须从大脑中读取复杂得多的信号。
2025年10月,一位名叫尼克·雷(Nick Wray)的参与者在Convoy研究中展示了令人震惊的成果。他因渐冻症(ALS)四肢瘫痪,是Neuralink的第八位植入体接受者。经过连续三天每天八小时的训练,他开始像使用自己的手臂一样操控机械臂。他拿起杯子送到嘴边喝水。在一项中风患者手部灵巧度测试中,他在五分钟内将39个圆柱体移到桌面上。在另一项测试中,他翻转了5块拼图。他形容这段经历是「人生中最不可思议的事之一」。
机械臂控制的原理是Telepathy项目的延伸。N1芯片记录运动皮层中神经元的放电模式。当患者想要伸出手臂时,当他想要握拢手指时,特定模式的电信号就会产生。尽管脊髓损伤导致真实的手臂无法动弹,但大脑中的运动计划仍然在生成。人工智能算法实时解码这些模式,将指令传送给机械臂。
这里的关键是解码算法的学习过程。一开始,计算机不知道脑信号代表什么含义。患者想象某个特定动作,系统记录此时产生的神经信号,这个过程重复数百、
数千次。计算机从这些数据中找出规律:向前伸臂时的模式、向右移动时的模式、握拳时的模式。随着时间推移,算法越来越精准,患者也越来越自如地操控机械臂。
但机械臂控制中缺少一个决定性要素:感觉反馈。我们拿杯子时能控制力度不把杯子捏碎,靠的是指尖感受到的压力。没有感觉地操控机械臂,就像麻醉了双手去弹钢琴。按键可以按下去,但强弱无法调节。
Neuralink正在开发双向脑机接口来解决这个问题。在机械手指尖安装压力传感器,将传感器捕获的信息回传到大脑的感觉皮层。患者用机械臂抓取物体时,触感被转换为电刺激送入大脑。这还处于早期阶段,但一旦成功,患者将把机械臂感受为自己真实的手臂。
Convoy项目的终极目标超越了机械臂。它要与数字桥(Digital Bridge)技术结合:将大脑的运动指令无线传输到脊髓下部的刺激器,使瘫痪患者真正的四肢重新动起来。瑞士洛桑联邦理工学院的团队已经通过脊髓刺激让瘫痪患者重新行走。如果Neuralink能用无线方式重建大脑与脊髓之间断裂的桥梁,坐在轮椅上的患者将有望用自己的双腿重新站起来。
第二位PRIME Study参与者Alex的案例同样值得关注。他因脊髓损伤导致颈部以下瘫痪,植入Neuralink芯片后,用安装在轮椅上的机械臂完成了日常动作:开关按钮、开门、拿起软椒盐卷饼送进嘴里。他还用CAD软件做3D设计,玩反恐精英游戏。这不只是医疗技术的进步,而是找回失去的生活主权的过程。
Convoy提出的问题发人深省。机械臂是我身体的一部分,还是一件工具?当患者开始把机械臂感知为自己的手臂时,它是假肢那样的辅助器具,还是延展的身体?如果大脑直接控制它并接收来自它的感觉,那边界在哪里?我们或许需要重新定义人与机器的关系。
四、语音恢复技术获突破性医疗器械认定(2025年)
布拉德·史密斯(Bradford G. Smith)在渐冻症夺走他的声音之前,留下了很多话。和家人的对话、电话录音、YouTube视频的旁白。那些声音以数字文件的形式保存了下来。2024年,他成为Neuralink的第三位人类临床参与者。芯片植入他颅骨的时候,他已经无法说话。几个月后,他重新开口了。用的是自己的声音。
2025年5月,Neuralink宣布其语音恢复技术获得了FDA突破性医疗器械认定。这项认定针对的是因渐冻症(ALS)、脑卒中、脊髓损伤、脑瘫、多发性硬化症等疾病导致重度言语障碍的患者。这是继Blindsight之后的第二项突破性医疗器械认定。Neuralink至此围绕运动控制(Telepathy)、视觉恢复(Blindsight)、语音恢复三条主轴,构建起了神经假体的完整版图。
要理解语音恢复的原理,首先要知道说话在大脑中是怎样发生的。我们说话时,被称为布洛卡区的语言中枢负责规划要说的内容。这个计划被传递到运动皮层,转化为驱动嘴唇、舌头、下颌、声带的精密指令。每时每刻都有数十块肌肉精确协同,产生我们想要的声音。速度超过每分钟150个词。
渐冻症患者的运动神经元在缓慢死去。控制肌肉的神经连接逐一断裂。但布罗卡区和运动皮层依然在工作。当患者想说「你好」的时候,大脑仍然能生成完整的运动计划。只是这个计划无法传达到肌肉罢了。Neuralink的语音恢复技术绕过了这条断裂的通路,直接从大脑中读取言语计划,输出到外部设备。
过去的辅助沟通设备依赖眼动追踪或肌肉信号。斯蒂芬·霍金使用的系统就是典型代表。患者移动眼球,在屏幕上逐个选择字母。这种方式很慢,每分钟大约10到30个单词。自然对话根本不可能实现。这是一种需要等待和忍耐的交流。对方必须安静地等患者拼完一整句话。开玩笑、即兴聊天,想都不敢想。
脑机接口有可能打破这道速度的墙。直接从大脑读取语言信号,就不再需要移动眼球或收缩肌肉这些中间步骤。斯坦福大学和加州大学戴维斯分校的研究团队已经成功将脑信号解码到每分钟62至78个单词的水平。这已经接近自然对话的速度。Neuralink计划利用1,024个以上的高密度通道,把这个速度推得更高。
布拉德·史密斯的案例展示了这项技术走到了哪一步。他的颅骨内,发丝般细的电极线深入脑组织。1,024个电极实时记录神经元的活动。人工智能算法对这些信号进行解读,把他试图说话时产生的神经模式转换成文字。到这一步,其他研究团队也做到了。
Neuralink更进一步的地方,在于将这项技术与语音合成结合起来。布拉德健康时留下的语音录音被输入人工智能进行学习。他的语调、音色、说话习惯。AI根据这些数据重建布拉德的声音。当大脑解码出的文字输入合成语音引擎后,输出的不是机械的机器人声音,而是布拉德自己的声音。
他用这项技术录制了YouTube视频的旁白,和家人开玩笑。马斯克公开的视频中,他和孩子们一起玩马里奥赛车。Neuralink联合创始人DJ Seo回忆说,那个瞬间令人难以置信地动容。技术把一个人的身份还给了他。
FDA将语音恢复技术认定为突破性医疗器械,这是该领域的转折点。这一认定意味着监管机构承认该技术有可能带来具有临床意义的效果。当然,前路仍然漫长。解码准确率需要提高,错误率需要降低,长期使用的安
全性需要验证。这项技术未必对每位患者都同样有效。每个人的大脑不同,疾病的进展程度也不同。
但方向是清晰的。终有一天,被困在沉默中的人们会重新开口说话。用自己的声音。马斯克或许会说,这不是语言的终结,而是进化。想到什么就能立刻说出来的世界。再进一步,甚至不需要嘴唇运动的意图,直接将纯粹的思想传递给他人。概念性心灵感应的时代。那还是很远的未来。
眼下最要紧的,是病床上的患者。想叫出至亲的名字却叫不出口的人。想说谢谢、对不起、我爱你,却说不出来的人。对他们而言,语音恢复技术是打开灵魂牢笼的钥匙。大脑与机器的连接正在推倒沉默的高墙,让失去的声音重新回荡在这个世界。FDA的突破性医疗器械认定,是那份回响能触达更多人的希望标记。
