AI书房
用书来读懂AI
这里收录金京镇律师的AI、法律、产业、历史、政治、文化主题在线书。每本书都按目录、序言、章节、尾声整理,方便连续阅读。
[AI书房] 第20章 主要法律问题的综合整理
人工智能AI走上法庭
第六部 AI诉讼与法律战略的未来
第20章 主要法律问题的综合整理
金京镇律师
一、著作权:合理使用与训练数据对价之争
2025年11月12日,纽约南区联邦地方法院法官西德尼·斯坦向OpenAI下达命令,要求其提交两千万条ChatGPT对话记录。OpenAI的律师提出了抗辩:用户隐私会受到侵害。法官没有采纳。他的逻辑很直白,,ChatGPT用户是自愿输入对话内容的,不是被窃听的。
这个场景折射出AI著作权战争的真实面貌。2023年《纽约时报》起诉OpenAI时,很多人把它看作新闻机构和科技企业之间一场普通的纠纷。两年过去,这场诉讼已经演变为动摇全球AI产业法律根基的地震。十六起著作权诉讼被合并为一起多地区诉讼(MDL)。《纽约时报》、《芝加哥论坛报》、《纽约每日新闻》、调查报道中心,悉数在列。原告律师们到底在找什么?他们要的是「反刍(regurgitation)」的证据。
什么是反刍?就是AI把学到的内容原封不动地吐出来。学生读完一本书,用自己的话做总结,没问题。但如果把整本书背下来抄在试卷上,那就是抄袭。《纽约时报》的律师已经拿出了证据,证明ChatGPT几乎原样输出了该报的文章。一个字、一个逗号都一样的文本。他们想要更多证据。两千万条对话记录里,一定藏着他们需要的东西。
(1) 美国判例中偏向企业的倾向
美国法院历来对技术创新持宽容态度。这种宽容在法律上的表达,就是「合理使用(Fair Use)」。要理解合理使用,可以想象一座图书馆。从图书馆借书来读,合法。把书中某个段落引用到报告里,也合法。但把整本书复印了拿去卖,那就违法了。合理使用,就是划定这条边界的法律原则。
OpenAI的主张是这样的:我们是在读书,不是在复印。就像人类作家读了几千本书之后形成自己的文风一样,AI也是通过「学习」数据来创造新内容。这叫「转化性使用(Transformative Use)」。当年Google扫描了全世界图书馆的藏书,法院也予以许可。Google Books判决,成了AI企业们拿来当盾牌的先例。但2025年的法庭风向已经变了。2025年4月4日,斯坦法官驳回了OpenAI大部分驳回申请。直接侵权主张、帮助侵权主张、商标淡化主张,全部进入审判程序。法官的信号很清楚:「是否构成合理使用,需要在审判中查明。」这不是对企业有利的裁定。这是一个「还不知道」的裁定。
还有一个更关键的先例:汤森路透诉ROSS Intelligence案。ROSS是一家法律AI初创公司,他们用Westlaw的法律数据库训练模型,做出了一款竞品。2025年2月,特拉华联邦法院驳回了ROSS的合理使用抗辩。法官的逻辑很简洁:你们用竞争对手的数据做了一个竞品,这不是转化性使用,这是市场替代。
市场替代。合理使用四项标准中分量最重的一项。AI是否替代了原作?这正是《纽约时报》的核心主张。人们现在不去《纽约时报》网站了,而是问ChatGPT:「今天有什么新闻?」ChatGPT基于《纽约时报》的报道作答。付费订阅模式的崩塌,这就是市场替代。
(2) 欧洲判例中保护著作权人的倾向
大西洋对岸的氛围截然不同。欧盟于2024年8月施行了全球首部综合性AI监管法,,『EU AI法(AI Act)』。该法要求通用AI模型提供者公开训练所用数据的详细摘要。透明义务。美国没有这样的法律。
德国慕尼黑地方法院的GEMA诉OpenAI案,是欧洲风向的缩影。GEMA是德国音乐著作权协会。2024年底,法院裁定OpenAI在训练聊天机器人的过程中违反了德国著作权法。争议焦点是「文本与数据挖掘(TDM)」例外条款。EU数字单一市场著作权指令允许以研究为目的的TDM,但对于商业目的的TDM,著作权人可以行使「退出(Opt-out)」权利。法院认定OpenAI的行为属于商业目的,而著作权人已经明确表示了反对。
英国正在审理的Getty Images诉Stability AI案同样值得关注。Getty Images是全球最大的图片代理机构。他们主张Stability AI的图像生成工具Stable Diffusion未经授权学习了其一千两百万张照片。有一项耐人寻味的证据:AI生成的图像中,出现了Getty Images水印的变形痕迹。AI连水印都一起「学」了。这可能构成直接复制的证据。
中国法院在保护著作权人方面也相当积极。2024年,广州互联网法院在「奥特曼」案中判定AI服务提供者承担直接侵权责任。杭州互联网法院在LoRA模型案中判令赔偿三万元。中国法院的态度很明确:AI平台不是单纯的工具提供者,它们必须主动采取措施,防止用户侵犯他人著作权。
(3) 许可协商模式的兴起
2025年12月11日,华特迪士尼向OpenAI投资十亿美元,同时将两百多个迪士尼角色授权给OpenAI的视频生成平台「Sora」。米老鼠、灰姑娘、达斯·维达、尤达,都在其中。这个场景颇具讽刺意味。仅仅六个月前,迪士尼和环球影业还在以著作权侵权为由起诉Midjourney。现在他们却在给AI公司投钱。
发生了什么?迪士尼CEO鲍勃·艾格的话提供了线索:「没有哪一代人成功阻止过技术进步,我们也不打算这样做。如果变革注定要来,不如主动搭上这班车。」这不是投降,这是交易。
许可协议的关键在于「控制」。迪士尼获得了决定其角色在Sora平台上如何使用的权利。暴力、政治、成人内容一律禁止。演员的肖像和声音也被排除在外。迪士尼与OpenAI组建了联合运营委员会,监控用户生成的内容。与其放任无序的未授权使用,不如换成可控的付费使用,,这是一笔划算的账。
OpenAI已经与多家媒体企业签署了许可协议。美联社、Axel Springer(Politico和Bild的母公司)、新闻集团(《华尔街日报》和《泰晤士报》的母公司)、康泰纳仕(《纽约客》《Vogue》《连线》)、Reddit。总金额达数亿美元。而《纽约时报》、《芝加哥论坛报》等则继续打官司。媒体行业已经分裂为「谈判派」和「诉讼派」。
这种分裂背后有经济逻辑。诉讼是赌博。不知道要拖多少年,即使胜诉,赔偿金额也难以预测。许可协议则是确定的现金收入,法律风险也随之消除。但协议里暗藏陷阱。大型媒体企业有资格坐上谈判桌,个体作家和无名艺术家却没有这个力量。数据的价值与持有量成正比。小创作者在这个新经济秩序中,面临被边缘化的风险。
AI著作权的未来最终分成两条路:法庭上的交锋和谈判桌上的交易。两条路都在试图回答同一个问题,,当机器用人类创造的数据生产价值时,这份价值归谁所有?在答案明确之前,著作权战争不会停歇。
二、就业:AI代理人责任的扩散
德里克·莫布利向一百多家公司投了简历,一次面试机会都没拿到。
他是黑人,四十多岁,曾被诊断患有焦虑症。有一天他发现了一个奇怪的规律:他投过简历的所有公司,都在使用一款叫「Workday」的人力资源管理软件。拒信到达的时间也很蹊跷,,凌晨一点五十分,投递简历后不到一个小时。不可能有人在那个时间审阅简历。
莫布利恍然大悟。拒绝他的不是人,是算法。
2023年2月,莫布利在加利福尼亚北区联邦地方法院起诉了Workday。指控的理由是基于种族、年龄和残障的歧视。这场诉讼成为全球AI就业歧视领域的首个大规模法律试验场。
(1) 供应商责任认定的全球扩散
Workday的第一道防线很简明:「我们不是雇主。」在传统劳动法中,禁止歧视的义务由雇主承担。就像用Microsoft Word写的文件出了问题不会去起诉微软一样,起诉开发招聘软件的公司,在逻辑上说不通,,这是Workday的主张。
丽塔·林法官没有接受这套逻辑。2024年7月,她驳回了Workday的驳回申请,作出了一项重要裁定:Workday不是单纯的「工具」。Workday的软件并非机械地执行雇主设定的标准,而是自主地评估、推荐和淘汰求职者。这是在实质性地参与决策。因此,Workday可以被视为雇主的「代理人(Agent)」,受联邦民权法的约束。
代理人。这个词是关键。法律上的代理人,是指代替本人(principal)行事的人。律师是委托人的代理人。房产中介是房主的代理人。现在,AI招聘软件也可以成为雇主的代理人。正如本人要为代理人的行为负责,代理人本身也可以承担责任。
2025年5月16日,林法官批准了莫布利案的集体诉讼资格认定。这场诉讼现在代表的是2020年9月24日以后,通过Workday系统投递简历后被拒绝的所有四十岁以上的求职者。Workday的律师在法庭上提到了一个令人震惊的数字:在此期间通过Workday系统被拒绝的申请约有十一亿件。潜在的集体成员可能高达数亿人。
林法官的裁定给全球AI供应商敲响了警钟。美国平等就业机会委员会(EEOC)以法庭之友(amicus curiae)身份介入此案,支持莫布利一方。EEOC的立场很明确:使用AI工具产生的歧视,雇主要承担责任,开发AI的供应商同样可能承担责任。如果供应商虚假宣传「我们的算法没有偏见」,或者不向雇主提供验证偏见的信息,就可能适用产品责任法理。
2023年8月,EEOC促成了与iTutorGroup的和解。这是联邦机构首次就AI招聘歧视采取制裁行动。iTutorGroup的招聘软件以年龄为标准自动淘汰求职者,,超过特定年龄,系统就自动发送拒绝邮件。这不是有意为之的歧视,而是「写死在代码里的歧视(hard-coded bias)」。EEOC已经表态,对这类歧视也将严格执法。
(2) 偏见审计义务化趋势
纽约市的「第144号地方法(Local Law 144)」是AI招聘监管的先驱。这部2023年生效的法律,强制要求对自动化就业决策工具(AEDT)进行「偏见审计(Bias Audit)」。在纽约市使用AI招聘工具的企业,每年必须聘请独立审计师,验证该工具是否存在基于种族或性别的偏见,并将审计结果在网站上公开。
什么是偏见审计?就像会计师审计企业财务报表一样,数据科学家和法律专家来审计AI算法。审查算法使用了哪些数据、这些数据中是否存在偏见、输出结果是否对特定群体不利。
科罗拉多州于2024年5月制定了美国首部综合性AI就业歧视监管法。这部法律不仅对雇主,也对AI开发公司施加了「防止算法歧视义务」。法律要求对高风险AI系统进行影响评估,一旦发现偏见,必须立即采取纠正措施。加利福尼亚州也通过2025年10月起生效的新规,将AI供应商定义为「代理人」,并要求雇主从供应商处获取偏见测试结果。
监管在扩散,但根本问题依然悬而未决,因为对于「什么是偏见」这个问题,各方还没有共识。举个例子:如果某个岗位男性申请者是女性的十倍,那么录取者中男性居多,到底是偏见,还是统计事实的反映?AI学习的是历史数据。如果历史上某个群体曾遭受歧视,AI就会把那种歧视识别为「成功模式」并加以复制。而旨在纠正历史不平等的「去偏(de-biasing)」技术,反过来也可能制造反向歧视。
2025年4月,特朗普总统签署行政命令,要求联邦机构停止基于「差别影响(disparate impact)」理论的执法。差别影响理论认为,即使没有歧视意图,只要结果对特定群体不利,就可以认定为歧视。这道行政命令可能削弱EEOC和司法部在AI领域的执法力度。但它不影响莫布利诉Workday这类民间诉讼。联邦执法力度减弱,州政府和民间律师填补空白的可能性反而更大。
眼下企业人事主管的桌上摆着两份文件。一份是AI招聘工具的效率报告,另一份是法务部门的风险评估。为了提升效率而引进的AI,可能变成价值数百万美元的集体诉讼账单寄回来。莫布利诉Workday案尚未判决,但无论结果如何,AI就业系统的法律责任已经在扩大。「是算法干的」这种辩解,行不通了。
三、监管:美国各州拼凑式立法与欧盟统一监管
2025年2月2日,欧盟『AI法(AI Act)』的首批义务正式生效。从这一天起,若干AI行为在欧盟境内被全面禁止:从互联网或监控摄像头中无差别采集面部图像以构建人脸识别数据库;在工作场所或学校使用情绪识别技术;执法目的的实时生物识别;社会信用评分系统。
同一天,美国什么都没有发生。
这就是AI监管的现状。欧洲正在实施全球首部综合性AI基本法,美国国会至今没有通过任何一部相关法律。结果就是,全球AI企业不得不在两个完全不同的法律世界里同时经营。
(1) 监管趋同的可能性
EU AI法采用了按风险等级分类的体系。禁止、高风险、有限风险、最低风险。用于医疗、招聘、教育、执法、信用评估的AI被归为「高风险」,受到最严格的监管。高风险AI系统的提供者必须编写技术文档、建立质量管理体系、确保人类监督,并满足准确性、稳健性和网络安全方面的要求。
2025年8月2日起,针对通用AI模型(GPAI)的义务也正式生效。ChatGPT、Claude这类大语言模型的提供者,必须保存能追溯模型开发、训练和评估过程的技术文档。还要编写透明度报告,说明模型的能力、局限和潜在风险。对于可能造成系统性风险的大型模型,则要求进行额外的风险评估并采取缓解措施。
罚款力度相当可观。违反被禁止的AI行为,将被处以全球年营业额7%或3500万欧元中较高者的罚款。其他义务违规为3%或1500万欧元,提供虚假信息为1%或750万欧元。这些数字与GDPR的罚款体系如出一辙,对全球企业构成不容忽视的威胁。
美国没有这种统一监管框架。但「基于风险的方法(risk-based approach)」这一基本理念是共通的。拜登政府的AI行政命令、NIST(国家标准与技术研究院)的AI风险管理框架,都支持对高风险AI实施差异化监管。OECD AI原则、G7广岛进程等国际协商机制中,也在朝这个方向形成共识。
有一个概念叫「布鲁塞尔效应(Brussels Effect)」,指的是EU的监管事实上成为全球标准的现象。GDPR就是先例。无法放弃EU市场的全球企业,会按照最严格的EU标准来设计产品。这些产品随后销往世界各地。结果,EU的监管就变成了全球标准。
AI监管领域可能出现同样的现象。OpenAI、Google、Meta、Microsoft都在EU市场开展业务。它们为遵守EU AI法而开发的透明度工具、风险评估流程、人类监督机制,很可能也会在美国适用。毕竟,遵循一套高标准,比在各州之间应对不同的规定更划算。
(2) 持续分化的可能性
然而,监管的完全统一似乎遥遥无期。美国联邦国会因政治极化,未能制定AI基本法。填补这一空白的,是各州的独立立法。科罗拉多AI法、加利福尼亚SB 1047(虽然州长行使了否决权)、田纳西ELVIS法、纽约市Local Law 144。各州定义不同、义务不同、罚款体系不同。这被称为「拼凑式(Patchwork)」监管,像百衲衣一样缝缝补补的监管格局。
特朗普政府上台是加速这一分化的变量。拜登政府的AI安全行政命令已被撤销。「歧视性影响」让位于「创新与自主」。联邦层面预计将放松监管。但加利福尼亚、纽约等民主党倾向的州,将进一步加强独立监管。联邦与州之间、州与州之间的监管差距会越拉越大。
中国走的是另一条路。2023年8月施行的『生成式人工智能服务管理暂行办法』是全球首部生成式AI法规。但其目的与EU不同。比起保护个人权利,「社会主义核心价值观」的契合度被置于优先位置。中国境内所有AI服务都必须在国家互联网信息办公室(CAC)登记。已有1400多个AI应用和450个大语言模型完成登记。数据黑名单制度也在运行。境外AI进入中国市场,事实上已被封堵。
全球AI监管版图最终正分裂为三个阵营:EU的「以权利为中心的统一监管」、美国的「各州拼凑式监管加民事诉讼」、中国的「以国家安全为中心的管控」。一个AI模型在全世界以同样方式运行的时代,已经结束了。企业必须为每个市场构建独立的模型、独立的数据集、独立的合规体系。
在这片混乱中,获益最大的群体是谁?说来讽刺,是律师和咨询顾问。监管越复杂,垄断其解释权的专家身价就越高。企业花在开发AI上的钱,恐怕不会比花在证明这个AI合法上的钱少多少。
四、透明性:AI黑箱与可解释性
医生对患者说:「癌症的概率是87%,做手术吧。」
患者问:「为什么?是什么症状?」
医生回答:「不知道。AI就是这么说的。」
这不是虚构的场景。2024年,有人对联合健康集团(UnitedHealth Group)提起了集体诉讼。原告称,联合健康的AI算法「nH Predict」无视患者的个体状况,仅凭统计数据就建议中断治疗。医生审核AI决定的平均时间只有1.2秒。根据起诉书,保险拒赔率从2020年的10.9%上升到2023年的22.7%,翻了一倍多。
问题的核心是「黑箱(Black Box)」。没有人能解释AI为什么做出那样的决定。不是不愿意解释,是解释不了。
(1) 说明义务的立法趋势
法律本质上是追问「理由」的。判决书里不能只写结论,还必须写明得出结论的理由。否则当事人怎么决定是上诉还是服判呢。但基于深度学习的现代AI只给出结论,不透露过程。数十亿个参数(parameter)错综复杂地交织在一起,连开发者都无法准确解释「AI为什么把这个患者归为高风险」。
EU的GDPR率先对这个问题适用了法律规范。第22条赋予受「自动化决策」影响的个人获取「关于所涉逻辑(logic involved)的有意义信息」的权利。第15条保障数据主体了解自己的数据如何被处理的权利。这就是所谓的「说明请求权(Right to Explanation)」。
2023年,欧洲法院(CJEU)在SCHUFA案中作出了重要解释。SCHUFA是德国的信用评估机构。法院裁定,信用评估机构生成的「评分(score)」本身就构成自动化决策,数据主体有权要求解释该评分是如何计算出来的。这意味着金融机构不能只是通知一句「AI说你不符合贷款条件」,而必须说明具体的变量和权重。
美国的说明义务立法也在推进中。加利福尼亚SB 1120规定,医疗保险公司利用AI拒绝赔付时,必须由人工介入审核并说明理由。科罗拉多AI法也包含了高风险AI系统的透明度要求。在联邦层面,联邦贸易委员会(FTC)正在将现行的公平信用报告法(FCRA)和平等信用机会法(ECOA)适用于AI。金融机构利用AI拒绝贷款时,告知申请人「AI评分太低」是违法的,必须具体说明哪些因素产生了不利影响。
2024年,加拿大民事仲裁庭在「加拿大航空聊天机器人案」中裁定,企业必须为AI聊天机器人的错误承担责任。加拿大航空的聊天机器人向客户提供了错误的退款政策。公司辩称「聊天机器人是独立法律实体」。仲裁庭驳回了这一抗辩:「聊天机器人是加拿大航空的代理人,公司应为其行为承担责任。」这一裁决确认了AI的不透明性不能成为企业免责的理由。
(2) 技术局限与法律要求之间的鸿沟
问题在于,现有AI技术难以提供法律所要求的那种清晰说明。最新的大语言模型由数千亿个参数构成。从数学上追溯某个特定输出的成因,技术上做得到。但要将其转化为人类能理解的自然语言因果关系,几乎不可能。
法院想要的是「因为A所以B」这样明确的因果关系。AI能给出的只是「A的概率较高所以选择了B」这种相关性层面的回答。这个鸿沟,就是法律纠纷的种子。
「可解释AI(Explainable AI, XAI)」技术正在开发中。LIME、SHAP等方法可以提取影响AI决策的关键变量。比如:「这笔贷款被拒绝的原因:信用评分(40%)、收入负债比(30%)、就业年限(20%)、其他因素(10%)。」这类说明已经能够生成。但这里有个陷阱。
一方面,这种说明属于「事后合理化(post-hoc rationalization)」。它展示的不是AI实际如何做出决策,而是在决策之后反向推测出一个看似合理的理由。这到底是AI真正的「思考」,还是为了让人类安心而编造的说辞?很难分辨。
另一方面,可解释性与性能之间存在权衡。最准确的AI模型拥有最复杂的结构,因而也最难解释。容易解释的简单模型,准确率又不够。法律要求「可解释的透明」,市场追求「无法解释的高性能」。
Mata诉Avianca案是这个问题的极端案例。2023年,纽约律师Steven Schwartz用ChatGPT撰写法庭文书。ChatGPT引用了实际上并不存在的判例。Schwartz没有核实就提交给了法院。法官指出找不到这些判例后,Schwartz又去问ChatGPT:「这些判例是真的吗?」ChatGPT回答:「是的,确实存在。」Schwartz信了。最终,他受到了纪律处分。
这就是AI「幻觉(hallucination)」的问题。AI会把不存在的东西说成存在的。你要求它解释,它就生成一套看起来很有说服力的虚假说明。人类要么没有能力核实,要么没有时间核实,要么根本不想核实。
归根结底,AI透明性问题既是技术问题,也是人的问题。医生用1.2秒审核AI的决定,不是因为技术做不到,而是因为时间压力。律师不核实ChatGPT给出的判例,不是因为AI无法说明,而是因为律师愿意相信。法院已经开始追问:「无法理解的东西,能相信吗?」以及「使用无法理解的东西出了事故,该由谁负责?」透明性不只是一项技术功能。它是AI要被接纳为我们社会一员所必须支付的、最昂贵的入场费。这笔入场费由谁来付、付多少,围绕这个问题的争斗,此刻正在法庭上展开。
