AI書房
本でAIを読む
金京鎮弁護士のAI・法律・産業・歴史・政治・文化をテーマにしたオンライン書籍を収録しています。各書きは目次・序文・章・エピローグで構成され、連続読書が可能です。
[AI書房] 第10章 生体情報と顔認識監視
人工知能AI、法廷に立つ
第10章 生体情報と顔認識監視
金京鎮
a. 顔認識データの無断収集
2020年1月のある朝、ニューヨークタイムズ記者キャシミア・ヒルは奇妙なアプリを発見しました。
オーストラリア出身の開発者ホアン・トン=ザットが開発したこのアプリは、誰かの写真を撮影してアップロードすると、その人が誰なのか、どこで働いているのか、オンラインでどのような活動をしたのかを1秒で教えてくれました。アプリの名前はClearview AIでした。
このアプリがどのように機能するかを知った瞬間、キャシミア・ヒルは記事を書くことに決めました。
顔はパスワードと異なります。パスワードが漏洩すれば変更すればよいです。クレジットカードを失くせば再発行してもらえばよいです。しかし顔は変更できません。顔は私たちが生涯持ち続けなければならない、変更不可能な身分証です。誰かがこの身分証をコピーしてデータベースに入れた瞬間、私たちは永遠に追跡可能なバーコードが押された商品になります。これが生体情報が他の個人情報と根本的に異なる理由です。
(1) Clearview AI米国BIPA集団訴訟合意
ホアン・トン=ザットはフェイスブック、インスタグラム、リンクドイン、ベンモから写真をスクレイピングしました。
スクレイピングと呼ばれるこの技術はウェブページの情報を自動的に収集するプログラムを意味します。図書館から本を借りるのではなく、図書館のすべての本を複写機に入れて回すのと同じです。
彼はこうして30億枚以上の顔画像を収集しました。そしてこれらの画像から顔の幾何学的構造、目と鼻と口の間の距離、顎線の角度といったものを抽出して、『顔テンプレート』というデジタル指紋を作成しました。
このデータベースは警察に販売されました。警察官が容疑者の写真をアップロードすると、Clearview AIはインターネットでその人と一致するすべての写真とリンクを見つけてくれました。便利なツールでした。しかし1つ問題がありました。写真の所有者たちの誰もが自分の顔がこのような目的で使用されることに同意したことがなかったのです。
ここでイリノイ州が登場します。アメリカ中西部のこの州は2008年に独特な法律を1つ制定しました。
生体情報保護法(BIPA)です。この法律は企業が個人の生体情報を収集または保存する際に、必ず書面同意を取得することを規定しています。そしてここに怖い条項が1つあります。被害者が直接訴訟を提起できるという点です。ほとんどのプライバシー法は政府が企業を処罰する構造です。しかしBIPAは市民個々人が企業を法廷に引き出すことを可能にしました。
訴訟のダムが決壊しました。
2021年1月までにイリノイ、カリフォルニア、ニューヨーク、バージニアで提起された11件の集団訴訟がイリノイ北部連邦地裁に統合されました。原告たちの主張は単純でした。Clearview AIは私たちの同意なしに私たちの顔を収集した。BIPAに従えば、これは違法な1件当たり最低1,000ドルから5,000ドルの損害賠償を意味する。イリノイの人口が1,200万人ですから、電卓を叩いてみると天文学的な数字が出ます。
問題はClearview AIがスタートアップだったということです。いくら企業価値が高くても現金がありませんでした。数十億ドルの損害賠償を支払う能力がなかったのです。そのため2024年6月、前例のない合意が成立しました。現金の代わりに株式を与えることにしたのです。
2025年3月20日、シャロン・ジョンソン・コールマン連邦判事はこの合意を最終承認しました。Clearview AIは原告たちに会社株式の23%を提供することにしました。金額に換算すると約5,175万ドルです。判事はこの合意が『同様のBIPA合意と比較した場合、公正で合理的かつ適切だ』と判断しました。合意には別の条件がついていました。
Clearview AIはアメリカ国内の民間企業や個人にデータベースアクセス権を販売することが永久的に禁止されました。イリノイ州内のすべての機関、警察を含めて5年間のサービス提供が禁止されました。『すべての人の顔を検索できるグーグル』になろうとしていた夢は、少なくともアメリカ民間市場では違法になったのです。
このサービスと関連して、欧州連合内での論争、トランプとの癒着、米国憲法上の令状主義破壊の先駆者となった側面についてさらに説明していきます。
2025年の夏、ニューヨークに本社を置く小さなスタートアップがInc. 5000リストで710位を占めました。アメリカで最も急速に成長する企業リストです。1年前、この会社は1,820位でした。1,100段階を飛び上がりました。Clearview AIでした。
同時期、この会社は欧州から総額1億ユーロ(約145億円)以上の課徴金を科せられた状態でした。オランダ3,050万ユーロ。フランス2,520万ユーロ。イタリア2,000万ユーロ。ギリシャ2,000万ユーロ。イギリス750万ポンド。すべて同じ理由でした。あなた方は人々の顔を盗んだのだ。
Clearview AIは一銭も支払いませんでした。
顔を削り出して作った会社 ホアン・トン=ザットはオーストラリア出身の開発者でした。2017年マンハッタンで、彼は単純なアイデアを思いつきました。インターネットには数十億枚の写真が公開されている。これらの写真から顔を抽出し、各顔の幾何学的パターンを分析してデジタル指紋を作成したらどうか。誰かの写真1枚あれば、その人がオンラインに残したすべての痕跡を見つけ出すことができる。
スクレイピングと呼ばれる技術を使用しました。フェイスブック、インスタグラム、リンクドイン、ベンモから写真をスクレイピングしました。図書館から本を借りるのではなく、図書館のすべての本を複写機に入れて回すのと同じ方式でした。2025年現在、彼のデータベースには30億枚以上の顔画像が保存されています。地球上のすべての人間の顔を7回以上収めることができる数字です。
彼はこのデータベースを警察に売りました。警察官が容疑者の写真をアップロードすると、1秒以内にその人の身元とオンライン活動記録が画面に表示されました。便利なツールでした。
1つ問題がありました。30億枚の写真の所有者の誰もが自分の顔がこのように使用されることに同意したことがなかったのです。
欧州の怒り 2022年から欧州のデータ保護当局たちはClearview AIの調査を次々と開始しました。結論はすべての国で同じでした。違法。
フランス個人情報保護監督機構(CNIL)は2022年10月に2,000万ユーロの課徴金を課しました。Clearview AIがデータ削除命令に従わなかったため、2023年5月に520万ユーロを追加で課しました。イタリアとギリシャも各々2,000万ユーロを科しました。
2024年9月、オランダデータ保護局が最も強力なメッセージを発した。3,050万ユーロの課徴金とともに、アレイド・ウォルフセン局長は異例の警告を発表しました。
「私たちはこの会社の取締役たちを個人的に起訴できるかどうか調査しています。経営陣がGDPR違反の事実を知りながらも中止する権限があったにもかかわらずそうしなかった場合、彼らは個人的責任を負います。」
ウォルフセン局長はClearview AIの経営陣に事実上ヨーロッパ旅行禁止令を出したのでした。
Clearview AIのジャック・マルキア法務最高責任者はこう切り返しました。「Clearview AIはオランダやEUに事業所を持っていません。GDPRは私たちに適用されません。」
イギリスは異なる経路を選択しました。2022年5月イギリス情報委員会(ICO)は750万ポンドの課徴金を課しました。Clearview AIは上訴し、2023年10月1審裁判所は驚くべき判決を下しました。ICOに管轄権がない。判事の論理はこうでした。Clearview AIの顧客はすべて外国の法執行機関です。外国の国家安保と法執行はイギリスGDPRの適用範囲外です。したがってClearview AIも適用範囲外です。
ICOは上訴しました。2025年6月上級裁判所で3日間の審問が開かれました。プライバシー・インターナショナルという市民団体が介入してICO側の味方をしました。
2025年10月7日、上級裁判所は1審判決を覆しました。核心争点は『行動監視』の定義でした。Clearview AIは自分たちが人々を積極的に監視していないと主張しました。ただ公開された写真を収集するだけだと。
裁判所は同意しませんでした。「行動監視は受動的なデータ収集、分類、保存を含みます。第三者がプロファイリング目的で使用できるようにデータを準備すること自体が監視です。」
判決文の最後の文が印象的でした。「本件は再び1審裁判所に送り戻され、本案審理を受けることになります。ICOは管轄権を有しています。」
Clearview AIは上訴すると表明しました。
米国で起きた奇妙な合意 ヨーロッパで罰金爆弾に見舞われている間、米国では別種の戦争が展開していました。
イリノイ州は2008年に生体情報保護法(BIPA)を制定した唯一の州でした。この法律の独特な点は被害者が直接企業を訴えることができるということでした。ほとんどのプライバシー法は政府だけが企業を処罰できます。しかしBIPAは市民個々人に訴訟権を与えました。
2021年1月、イリノイを含む4州で提起された11件の集団訴訟が1つに統合されました。原告たちの主張は単純でした。Clearview AIは私たち同意なしに私たちの顔を収集した。BIPAに従えば、1件当たり1,000ドルから5,000ドルの損害賠償が可能だ。イリノイの人口が1,200万人ですから、電卓を叩いてみると数十億ドルが出ます。
問題はClearview AIに現金がないということでした。スタートアップでした。いくら企業価値が高くても賠償金を支払う金がなかったのです。2024年6月、前例のない合意が発表されました。現金の代わりに株式を与えることにしたのです。
2025年3月20日、シャロン・ジョンソン・コールマン連邦判事はこの合意を最終承認しました。Clearview AIは原告たちに会社株式の23%を提供します。金額に換算すると約5,175万ドルです。この株式は会社が上場またはM&Aされた時に現金化されます。
22州の司法長官たちが反対意見書を提出しました。彼らの主張はこうでした。この合意は被害者たちの賠償をClearview AIの将来の成功に縛り付けます。被害者たちが自分たちのプライバシーを侵害した会社の株主になるのです。これが『公正で合理的かつ適切な』合意ですか。
判事はそうだと判断しました。「訴訟費用が会社を破産させることができ、そうなれば被害者たちは何ももらえません。この合意が現実的な選択です。」
奇妙な結果が生まれました。Clearview AIが成功するほど被害者たちの賠償金も大きくなります。被害者たちは今Clearview AIの成功を望む理由ができました。
連邦政府とのただならぬ関係 2025年2月、ホアン・トン=ダットがCEOの座から身を引きました。2024年12月に代表取締役から降格され、経営の最前線から完全に身を引いたのです。ただし取締役会には留任しています。
新しい共同CEOにハル・ランバートとリチャード・シュワルツが就任しました。ランバートは初期投資家であり、トランプ大統領の選挙キャンプの資金調達に参加した人物でした。シュワルツは共同創業者でした。新経営陣の戦略は明確でした。連邦政府。
2025年9月5日、移民関税執行局(ICE)の国土安全保障調査局がClearview AIと920万ドル規模の契約を締結しました。Clearview AI史上最大規模の連邦契約でした。2021年に締結した230万ドル契約の4倍でした。
契約書には2つの目的が明記されていました。児童性虐待犯罪の捜査。そして「法執行官への暴行」の捜査。
2番目の目的が論争になりました。トランプ政権の大規模強制送還作戦が進行中のなか、ICE要員に抵抗する人々を見つけ出すのに顔認識技術が使用される可能性があるという懸念でした。
あるアイロニーがありました。イリノイ州ではClearview AIが警察へのサービス提供を禁止されています。BIPA訴訟和解の条件の1つでした。しかし連邦機関にはその禁止が適用されません。ICE要員はイリノイ州でもClearview AIを使用できます。地域警察が使用できない技術を連邦要員は同じ場所で自由に使用します。
2025年のClearview AIの年間経常利益は1,600万ドルです。ランバート共同CEOは来年に3倍に増やすと述べました。民間市場での同社の価値は12億~16億ドル間と推定されています。2025年第3四半期または第4四半期にIPOが予想されています。
ヨーロッパで課せられた罰金の総額:約1億ユーロ。Clearview AIが納付した金額:0ユーロ。
米国で合意した賠償金総額:5,175万ドル(株式形態)。Clearview AIが現金で支出した金額:0ドル。
連邦政府契約総額:920万ドル(2025年ICE契約のみ)。予想IPO企業価値:12億~16億ドル。オランダデータ保護局長ボルフセンは率直でした。「他のデータ保護当局もすでにClearview AIに罰金を課していますが、同社は行動を変えていないようです。」
問題は執行です。Clearview AIはヨーロッパにオフィスがありません。従業員もいません。銀行口座もありません。ヨーロッパのデータ保護当局ができることは罰金を課すことだけです。お金を回収する方法がありません。
国際法には行政罰金を国境を超えて執行するメカニズムがありません。GDPRが「世界初のグローバルデータ保護法」と呼ばれていますが、米国に本社を置く企業がヨーロッパ規制を無視することに決めれば、現在のところ強制する方法がありません。
英国の法律コンサルタント1人はこう評価しました。「上級裁判所の判決はICOにとって勝利です。しかし空虚な勝利かもしれません。英国に資産がない企業に対して750万ポンドの罰金をどのように執行するのですか?」
令状なき監視:憲法の盲点 Clearview AIを巡る最も根本的な論争は、まだ法廷で正面から扱われていません。米国修正憲法第4条、令状主義です。
修正憲法第4条は明確です。「不合理な捜索と押収から個人の身体、住居、書類および財産が保護を受ける権利は侵害されてはならない。令状は相当な理由に基づいて、宣誓または確約に支えられ、捜索する場所と押収する物を特定して記述した場合にのみ発行されることができる。」
簡単に言えば、こうです。警察があなたの家を捜索しようとすれば、判事のところへ行って令状を得る必要があります。なぜあなたを捜索する必要があるのか、何を見つけたいのかを具体的に説明しなければなりません。これが建国以来、米国憲法が守ってきた原則です。
Clearview AIはこの原則を回避します。警察官が路上で撮った写真1枚をClearview AIにアップロードします。1秒で、その人の名前、ソーシャルメディアアカウント、オンライン活動の履歴が画面に現れます。令状は必要ありません。判事の承認も必要ありません。その人が犯罪容疑者である必要さえもありません。誰でも検索できます。
フォーダム大学法学大学院の論文が、この問題を正面から扱いました。「Clearview AIを使用して令状申請を支持する行為は、確立された法的基準に反する。」論文の核となる主張は2つでした。第1に、最高裁判所はデジタル時代に憲法的保護を技術進歩に適応させるべきだと認めてきた。第2に、Clearview AIの検索は、伝統的なプライバシー保護装置を回避するデジタル監視の独特な能力を示している。
さらに深刻な問題があります。エラーです。
デトロイトでロバート・ウィリアムズという男性が家族の前で逮捕されました。顔認識システムが彼を窃盗容疑者として指摘したためです。彼は無実でした。ニュージャージーでニジア・パークスという男性は10日間拘禁されました。これも顔認識エラーのためでした。2人とも黒人でした。
研究は、顔認識技術が有色人種に対してより高いエラー率を示すことを一貫して報告しています。1つの誤ったマッチングが無実の人を刑務所に送ることができます。そしてこのすべてのプロセスで、令状は必要ありません。
2021年、民主党と共和党の議員たちが共に「Fourth Amendment Is Not For Sale Act(修正憲法第4条は売ってはならない法)」法案を提出しました。法案の核となる点は2つでした。Clearview AIのようなサービスからのデータ購入を禁止する。そして位置情報を取得する際に令状を要求する。
ACLUのケイト・ルアン法律顧問はこう述べました。「この法案は、政府機関が令状なしには得ることができないデータを購入することで憲法的保護を回避することを防ぐだろう。」法案は可決されませんでした。
Clearview AIが示した大混乱の物語 Clearview AIの話は、技術と法、プライバシーと安全、国境と管轄権の間の緊張を示しています。
一方では、同社が犯人を捕まえ、行方不明の児童を見つけ、人身売買の被害者を救出するのに貢献していると言われています。会社のウェブサイトには成功事例が記載されています。警察が数十年前の未解決事件を解決したという話です。
他方では、同社が世界中の人々のプライバシーを侵害したと言われています。同意なく顔を収集してデータベースを作成した。誰もが追跡可能な世界を作った。そして何より、修正憲法第4条が200年以上守ってきた令状主義を技術で無力化した。
Clearview AIはヨーロッパで違法です。米国では最も急速に成長している企業の1つです。イリノイ警察は使用できませんが、同じイリノイで活動するICE要員は使用できます。被害者は株主になり、今は会社の成功を祈らなければならない状況です。憲法学者は令状主義違反だと警告していますが、連邦政府は920万ドルを支払ってサービスを購入しました。
30億枚の顔画像。1億ユーロの罰金。920万ドルの政府契約。16億ドルの企業価値。そして、たった1つの令状もなく検索される数百万人の顔。
誰かはこれをプライバシーの終わりと呼んでいます。誰かは公共の安全の革命と呼んでいます。誰かは憲法の盲点と呼んでいます。まだ答えは出ていません。もしかしたら答えはないかもしれません。確実なことが1つあります。あなたの顔はすでにそのデータベース内にある可能性が高いです。そして警察があなたを検索するのに令状は必要ありません。
(2)Rite Aid事件:FTC顔認識使用禁止命令
Clearview AIが監視の道具を作ったなら、Rite Aidはその道具を使った企業でした。
米国全域に広がるこの薬局チェーンは、盗難防止のために顔認識技術を導入しました。ロジックはシンプルでした。
過去に物を盗んだ人の顔をデータベースに入れておき、その人が再び店に入ったら警報を鳴らそう。コストを削減しながら、セキュリティを強化する効率的な方法に見えました。
しかし、このシステムには致命的な欠陥がありました。正確ではありませんでした。
2012年から2020年にかけて、Rite Aidは2つの外部業者と契約を結び、「関心人物」データベースを構築しました。これには過去の盗難容疑者の写真、CCTVからキャプチャされた低解像度画像、さらには従業員の携帯電話で撮影された写真も含まれていました。
Rite Aidはこれらの画像の品質を検証しませんでした。精度もテストしませんでした。外注業者の契約書には「結果の正確性や信頼性について何ら保証しない」という免責事項が記載されていました。
結果は予想できるものでした。システムは数千件の誤検知を生成しました。数千マイル離れた場所で登録された窃盗犯と店に入ってきた顧客を同一人物と認識しました。同じ人物を米国全域の数十の店で繰り返し窃盗犯と表示しました。連邦取引委員会(FTC)の調査によれば、このエラーはランダムではありませんでした。黒人、アジア系、女性の顧客でのミス認識率が特に高かったのです。罪のない人々が窃盗犯とされました。従業員が駆けつけて顧客に付きまといました。バッグを漁られました。家族や友人の前で公に辱められました。警察に通報されることもありました。これは単純な技術的エラーではありませんでした。自動化された差別でした。
2023年12月19日、FTCは歴史的な措置を発表しました。Rite Aidに対して今後5年間、顔認識技術の使用を全面的に禁止したのです。
これはFTCが民間企業の顔認識オーバーユースに対して発した最初の使用禁止命令でした。FTC消費者保護局長サミュエル・レビンはこう述べました。「Rite Aidの無謀な顔監視システムの使用は、顧客に屈辱と他の危害をもたらしました。」
禁止命令にはさらに強力な条項が含まれていました。
Rite Aidは過去のシステムで収集したすべての顔写真とビデオを削除する必要がありました。そしてそのデータを使用して作られたすべてのAIモデルとアルゴリズムも廃棄する必要がありました。これを「アルゴリズム環流(Algorithmic Disgorgement)」と呼びます。
不法に収集されたデータで作られたAIモデルは、その成果物まで廃棄しなければならないという原則です。毒を含む木から実った果実も毒があるというロジックです。
Rite Aid事件は2つの教訓を残しました。第1に、AI工具の正確性とバイアスを検証せずに導入すれば、その責任は企業が負うということです。「外注業者が作ったから私たちは知らない」という言い訳は通じません。第2に、規制当局は罰金を超えて技術自体の使用を禁止できるということです。技術を適切に制御する能力がなければ、そもそも使うなということです。
b. データスクレイピングと個人情報
私たちはインターネットが無料だと考えています。Google検索も、Facebookの投稿も、Instagramの写真共有も、すべて無料です。
しかしウォール街で長く働いた人なら誰もが知る真理があります。「商品の価格を支払っていないなら、あなた自身が商品です」
過去20年間、私たちは日々の生活をソーシャルメディアに注ぎ込んできました。子どもの誕生日パーティーの写真、政治に関する意見、グルメレビュー、職場で感じる不満。これらすべては「公開」データでした。私たちは友人たちと交流するためにこれらを投稿しました。
しかしAI企業にとって、このデータはカリフォルニアの金鉱でした。OpenAI、Google、Anthropicといった企業は、巨大な掃除機のようにこれらのデータを吸い込みました。彼らはこれを『スクレイピング』と呼びました。
(1)ソーシャルメディアデータのAI学習活用をめぐる論争
2024年8月、LinkedInは静かにプライバシーポリシーを更新しました。新しい設定メニューが追加されたのです。
「生成型AI改善のためのデータ」という名前のトグルボタンでした。問題は、このボタンがデフォルトで『オン』状態だったということです。ユーザーがわざわざ見つけてオフにしない限り、LinkedInは自動的に投稿やプロフィール情報をAI学習に使用できるようになったのです。
9月、LinkedInはプライバシーポリシーを再び更新しました。今回は、ユーザーデータを生成型AI学習に使用することを明示したのです。順序が逆になりました。通常はポリシーを先に変更してからデータを収集します。しかしLinkedInはデータ収集を先に開始し、ポリシーは後から変更しました。2025年1月、カリフォルニア北部連邦地裁に集団訴訟が提起されました。原告はLinkedInプレミアム購読者でした。彼の主張は衝撃的でした。LinkedInが非公開メッセージまでAI学習に使用していたというのです。訴状によれば、LinkedInはプレミアム顧客の個人メッセージを第三者に提供し、AIモデルを訓練させました。ユーザーへの適切な通知や同意手続きなしに。
LinkedInはこの主張を否定しました。非公開メッセージをAI学習に使用していないと述べたのです。訴訟は提起からわずか9日で原告側により取り下げられました。しかしこの事件が引き起こした論争は消えてはいませんでした。
核心的な質問はこうです。プラットフォームに投稿することがAI学習への同意を意味するのでしょうか?LinkedInに職務経歴書を投稿したのは、採用担当者に見てもらうためでした。友人にメッセージを送ったのは、その友人と交流するためでした。それがAI企業が数十億ドル相当のモデルを構築するために使用してもよいということを意味するのでしょうか?
この論争はLinkedInだけの問題ではありません。
Metaは2024年、ヨーロッパのユーザーに対して「正当な利益」を根拠に投稿をAI学習に使用すると通知しました。ヨーロッパのデータ保護当局と市民団体noybの強い反発にぶつかり、計画を一時中断せざるを得ませんでした。
X(旧Twitter)はGrokというAIを立ち上げた際、ユーザーデータをデフォルトで学習に活用するよう設定して批判を受けました。Redditはgoogleとデータライセンス契約を結び、ユーザー生成コンテンツをAI企業に販売し始めました。
2025年10月、LinkedInは再度ポリシーを変更しました。今回はヨーロッパ、イギリス、カナダ、香港のユーザーデータもAI学習に使用すると発表しました。2003年にまでさかのぼるデータが対象でした。ユーザーは11月3日までにオプトアウトしなければ、自動的に同意したものとみなされました。ヨーロッパのGDPRは「正当な利益」を根拠とするデータ収集にブレーキをかけています。
しかし企業は相変わらず方法を探し続けています。これはプラットフォーム企業とAI企業間の戦争でありながら、実際のデータの所有者であるユーザーは排除された戦争です。ユーザーは自分のデータがAI学習に使われることを拒否する権利があります。しかしその権利を行使するには、複雑な設定メニューを見つけて複数のステップを経なければなりません。ほとんどの人はそのような設定が存在することさえ知りません。
カリフォルニア法学ジャーナルに掲載された2025年10月の論文は、この状況を『大規模スクレイピング(Great Scrape)』と呼びました。著者たちはこう書いています。「スクレイピングはプライバシー法のほぼあらゆる核心的原則に違反します。公正性、個人の権利と統制、透明性、同意、目的の明示、そしてデータ最小化。」AI時代に、プライバシー法は新たな課題に直面しています。法はこの課題にどう対応するのでしょうか?
(2)忘れられる権利とAIモデル:学習された個人情報削除(アンラーニング)の難題
ヨーロッパのGDPR第17条は「忘れられる権利」を規定しています。情報主体は自分の個人情報がもはや必要でなくなったか、同意を撤回した場合、企業に削除を要求できます。
従来のデータベースではこれは簡単です。Excelファイルから1行を削除すれば終わりです。顧客管理システムから1つのレコードを削除すればそれで済みます。
しかしAIモデルはExcelファイルではありません。
AIモデルがデータを「学習」するとはどういう意味か理解する必要があります。AIはデータをそのまま保存しません。数千億個のテキストを読み、そこからパターンを抽出します。これらのパターンは数十億個のパラメータ、つまり重みという数値に変換されます。これらの数値が複雑に絡み合ったニューラルネットワークがAIモデルなのです。
例えて言うなら、こういうことです。あなたがシェフにケーキを注文したとします。シェフは小麦粉、砂糖、卵、バターを混ぜてオーブンで焼きました。ケーキが完成した後、あなたは言います。「すみません、このケーキから砂糖だけを取ってください。」これが可能でしょうか?砂糖はすでに小麦粉と卵に混ざり、化学的に変形しています。砂糖だけを取り除くには、ケーキ全体を捨てて最初から焼き直さなければなりません。
AIモデルも同じです。特定の個人のデータがモデル学習に使用されたのであれば、そのデータの「影響」は数十億個のパラメータに分散して溶け込んでしまいました。特定のデータの影響だけを正確に見つけ出して取り除くことは、現在の技術ではほぼ不可能です。
この問題を解決しようとする技術が「機械アンラーニング(Machine Unlearning)」です。すでに暗記してしまった電話番号を脳から選択的に消す訓練に似ています。研究者たちは特定のデータの影響を推定し、その影響を相殺する方向にパラメータを調整する方法を開発しています。しかし完璧な削除を保証することは困難です。
2025年5月にTech Policy Pressに掲載された論文はこう宣言しました。「忘れられる権利は死んだ。データはAIの中で永遠に生きている。」著者はGDPR第17条が削除を規定しているが、AI文脈において削除が何を意味するかを定義していないと指摘しました。ヨーロッパデータ保護委員会(EDPB)はAI開発者がGDPR上のデータコントローラーと見なされ得ると判断しましたが、AIシステム内で削除をどのように実行するかについての明確なガイドラインはまだありません。
OpenAIのGPT-4は1.8兆個のパラメータを使用しています。データセットはペタバイトを超えています。このデータセットは継続的に再利用され、パターンと推論を学習しています。
個人のデータが完全に削除されたかどうかを確認することは事実上不可能です。さらに大きな問題は「モデル逆算攻撃」というものです。学習されたモデルから元の訓練データを逆方向に抽出する技術です。AIが特定のデータを「忘れた」としても、攻撃者がそのデータを復元できるのであれば、削除に意味があるでしょうか?
法は「削除しなさい」と言うことができます。しかし技術は「削除とは何ですか?」と問い返します。この溝がAI時代のプライバシー法が直面する最も困難な課題なのです。
FTCは一つの解決策を提示しました。アルゴリズムの没収です。
違法に収集されたデータで作られたモデルは、そのモデル自体を廃棄しろということです。ライトエイド事件で、Weight WatchersのKurboアプリ事件でFTCはこの原則を適用しました。汚染されたデータで作られたAIモデルは毒が入った果実のようだという論理です。特定のデータだけを取り出すことができなければ、モデル全体を捨てなさい。
これはAI企業にとって大きな圧力です。GPT-4のようなモデルを最初から再び学習させるには数億ドルがかかります。誰かが削除を要求するたびに数億ドル相当のモデルを廃棄しなければならないのであれば、ビジネスモデル自体が成り立ちません。
結局のところ、解決策は事後ではなく事前にあるのです。
処理初めから削除を念頭に置いた設計が必要です。データを細かく分割して学習させ、削除要求が入ったら該当部分だけを再学習するSISA(Sharded, Isolated, Sliced, Aggregated)方式のような技術が研究されています。学習データの出処を追跡し、同意状態を記録し、要求が来たときに対応できるデータガバナンス体系が必須です。忘れられる権利はAIが単にデータを飲み込む怪物にならないようにコントロールする最後の砦です。技術的基準と法的ガイドラインが出会う地点で、AI倫理の未来が決まるでしょう。スクレイピングは収集の問題から始まりますが、アンラーニングは責任の問題で終わります。企業は「より多くの」データを集めることが能ではなく、「安全な」データだけを選り分ける精製作業に命がけで取り組まねばなりません。汚い水で作ったスープはいくら美味しくても売ることができないからです。