AI書房
本でAIを読む
金京鎮弁護士のAI・法律・産業・歴史・政治・文化をテーマにしたオンライン書籍を収録しています。各書きは目次・序文・章・エピローグで構成され、連続読書が可能です。
[AI書房] 第16章 中国AI規制の特殊性
人工知能AI、法廷に立つ
第16章 中国AI規制の特殊性
金京鎮
ア. 生成型AI サービス管理暫定方法(2023.8)
2023年7月のある蒸し暑い午後、北京の中関村(中關村)にあるシェアオフィスで、29歳の開発者ワン(王)はモニター画面をぼんやり眺めていました。彼の画面には、ちょうど公開された1つの文書が表示されていました。『生成型人工知能サービス管理暫定方法(生成式人工智能服务管理暂行办法)』。中国の国家インターネット情報弁公室(CAC)が発表した24条から構成されるこの文書は、1か月後の8月15日から施行される予定でした。
ワンは同僚に冗談を言いました。「これからはコーディング技術よりも党論研究をもっと真剣に勉強しなければならないかもしれない。」
彼の冗談は誇張ではありませんでした。
(1)世界初の生成型AI規制立法
中国政府は驚くほど迅速でした。ChatGPTが世界を席巻してわずか7カ月で、彼らはすでに法的枠組みを完成させていました。欧州連合が数年間の議論の末にAI法(AI Act)を磨いていた時、米国が行政命令を準備していたその時点で、中国は一気に規制の刃を抜いていました。
世界初の生成型AI専門規制法が誕生した瞬間でした。
このチャイナ・スピードには二つの欲望が絡み合っていました。一つは米国に技術覇権を奪われまいとする焦りであり、もう一つはこの統制不可能に見える技術が体制を脅かすかもしれないという恐怖心でした。
暫定方法の性格は題目から明らかでした。『暫定(暫行)』という言葉は柔軟性を暗示しているように見えますが、実際には当局の必要に応じていつでもゴムのように伸びたり縮んだりできるという警告でした。米国が市場の自主性に任せて事後に問題を解決しようとするアプローチを取ったのに対し、中国は事前許可モデルを選択しました。サービスを開始する前に政府の承認を得る必要があるということです。
法案の構造を見ると、その意図はさらに明確になります。第1条は『発展と安全のバランス(兼顧發展與安全)』を規範の核心的目的として提示します。この文言は中国特有の視点を明らかにします。AIを経済成長の核となるインフラとして認識しながらも、その使用結果が舆論形成と社会動員に及ぼす影響を強く警戒しているということです。技術革新と国家安全保障という二兎を同時に得ようとする宣言でした。
興味深い点がありました。2023年4月に公開されたドラフトと最終案の間には相当な変化がありました。ドラフトはほぼすべての公開サービスに対してセキュリティ審査とアルゴリズム登録を要求していました。このまま実施されたら、スタートアップ企業は息もできなかったでしょう。しかし最終案では『舆論属性』または『社会動員能力』を持つサービスのみに義務を限定しました。厳格な統制モデルから一歩後退したのです。民間の革新とスタートアップエコシステムを考慮した妥協の結果でした。
もう一つの特徴がありました。暫定方法はサービス提供者だけでなく、利用者にも『規範遵守義務』を課しました。第4条はサービス提供と利用活動の両方が法令を遵守し、社会主義の核心的価値観を守る必要があると明記しました。コンテンツの生産から流通まで全過程に『政治的責任』を結びつけたのです。単なる技術規制ではありませんでした。思想と舆論の空間を管理する統治ツールとしてAI規範を設計したのでした。
法案はAIサービス提供者を『情報コンテンツ制作者』とみなしました。これが意味するところは明白でした。AIが自律的に生成した成果物であっても、それに対する法的責任はサービスを運営する企業が負わねばならないということでした。2024年2月、広州インターネット法院が下した『ウルトラマン』著作権侵害判決は、この法案を根拠にAIサービス提供者の直接侵害責任を認めた世界初のケースとなりました。
(2)コンテンツ安全要件:社会主義の核心的価値観
暫定方法の最も独特で強力な特徴は、技術的安全性よりも『イデオロギー的安全性』を最優先に置くという点です。
西側のAI開発者がバイアス(bias)やヘイトスピーチ(hate speech)フィルタリングに集中していた時、中国の開発者は全く異なる種類の質問と格闘する必要がありました。「台湾はどのような国ですか?」という質問にAIが「台湾は島国として...」と答えると、それは即座に法律違反になります。「台湾は中国の不可分な領土として...」と答えるようにモデルを『再教育』するか、事後フィルタリングを通じて強制的に口を塞ぐ必要がありました。
第4条は生成型AIサービスが必ず『社会主義の核心的価値観(社會主義核心價值觀)』を実現しなければならないと明記します。具体的には、以下の内容の生成が禁止されます。国家権力の転覆、社会主義制度の破壊、国家安全保障の脅威、国家イメージの損傷、民族分裂の扇動、テロと極端主義の宣伝、民族的憎悪と差別の扇動、暴力とポルノ、および偽情報など。
2024年7月、フィナンシャル・タイムズ(Financial Times)は衝撃的な報道を発表しました。CACがバイトダンス、アリババ、ムーンショット(Moonshot)、01.AIなど主要なAI企業の大規模言語モデルを直接テストしているというものでした。テストの目的は一つだけでした。モデルが『社会主義の核心的価値観を実現』しているかを確認することです。
CACの運営指針は具体的でした。企業は『国家権力転覆の扇動』『国家統一の損傷』など社会主義の核心的価値観を違反する数千の敏感なキーワードと質問を収集する必要がありました。ウォールストリート・ジャーナルによると、企業はモデルが安全な回答を生成するかテストするために2万から7万の質問を準備する必要がありました。また、モデルが回答を拒否する5,000から1万の質問データセットを提出する必要がありましたが、その約半分は政治イデオロギーと共産党批判に関するものでした。
その結果は利用者にすぐに明らかになりました。1989年6月4日、天安門広場で何が起きたかと尋ねると?バイドゥのアーニーボット(Ernie Bot)は『別の質問を試してください』と答えました。アリババのトンイーチエンウェン(Tongyi Qianwen)は『まだこの質問に答える方法を学んでいません』と応答しました。習近平主席がクマのプーさんに似ていると言うインターネット・ミームについて尋ねると?ほとんどの中国チャットボットは口を閉ざしました。しかしCACはAIがすべての政治的質問を回避することも望んでいませんでした。
安全性テストでは、LLMが回答を拒否できる質問の数に上限がありました。
モデルは敏感な質問に『政治的に正しい回答』を生成できなければなりませんでした。「中国に人権があるか?」という質問には「はい、中国は人民の権利を積極的に保障しています」といった類の回答が出される必要がありました。「習近平主席は偉大な指導者ですか?」という質問には、当然のことながら肯定的な回答が必要でした。
北京のあるAI専門家はフィナンシャル・タイムズにこう説明しました。LLMが潜在的に有害なすべてのコンテンツの生成を防ぐことは不可能です。そのため開発者はシステムの上に追加的なレイヤーを構築します。問題となる回答を検出すると、即座に別の回答に置き換えるメカニズムです。これは一種の『分類器モデル(classifier model)』で、LLMの出力をリアルタイムで分類し、必要に応じて置き換えをトリガーします。
技術的には、これは『多段階検閲アーキテクチャ』です。トレーニングデータから問題情報を削除し、敏感なキーワードデータベースを構築し、出力段階でリアルタイムフィルタリングを適用することです。複数層の網を張って、1つもこぼれ落ちないようにする構造です。この敏感なキーワードは毎週更新される必要がありました。
アイフライテク(iFlyTek)のケースは、この規制がいかに企業にとって致命的なリスクとなるかを示しています。2024年、この企業の学習用タブレットが毛沢東を批判するエッセイを生成したため、株価が急落しました。即座に是正措置が取られました。一度のミスが企業の存続を脅かす可能性がありました。
(3)学習データ適法性要件
暫定方法は出力値に留まりませんでした。入力値、つまり学習データにも厳格な基準を適用しました。
第7条は学習データの適法性を強く要求します。サービス提供者は合法的な出典のデータと基礎モデルを使用しなければならず、他者の知的財産権を侵害してはいけません。また、個人情報保護法(PIPL)、データ安全保障法、著作権法など関連する法令を遵守する必要があります。違法に収集された個人情報、未認可データ、国家機密に相当する情報の使用は禁止されます。
ここで問題が複雑になります。表面的には西側の著作権法やGDPRに似ているように見えます。しかし中国の文脈ではまったく異なる意味を持ちます。
中国のインターネットは万里防火壁(Great Firewall)によって外部から遮断されています。グーグル、ウィキペディア、西側メディアの膨大な高品質データへのアクセス自体が違法であるか、技術的に困難です。
ほとんどのLLMは英語データで訓練されます。しかし中国企業はそのデータに自由にアクセスできません。
さらに中国国内のデータさえ、検閲によって断片化していました。AI企業は『適法な出典』のデータのみを使用する必要がありました。しかしその『適法性』の基準は曖昧でした。クローリングで集めたデータに反体制的な内容が混在していたら?そのデータセット全体が『汚染された』とみなされる可能性がありました。
2024年2月、国家情報安全標準化技術委員会は新しいルールを導入しました。生成型AIサービスの基本的なセキュリティ要件に関するもので、学習に使用されるデータセットに『違法および有害情報』が5%以上含まれてはならないと規定しました。5%という数字が意味することは明白でした。数テラバイトのデータを一つひとつ検査する必要があるということです。
ドラフト段階では訓練データとアルゴリズムについての『説明』のみが要求されていましたが、最終案では実際のデータとアルゴリズムの提出が義務付けられました。監督機関がデータセット構成と処理方法を直接審査できるようにしたのです。これは単なる透明性の要求ではありませんでした。国家機関が訓練データレベルでAIシステムを『監査』し、必要に応じて修正と浄化(purification)を要求できる構造を作ったのでした。
結局、企業は『データ浄化』という莫大な作業に膨大なリソースを投入する必要がありました。数億個の文を査定し、政治的に正しくない言葉を削除するプロセスでした。これは鉱山から金を掘り出すのではなく、米びつからゴミを取り除く作業のようなものでした。時間とコストが天文学的に増加しました。
2024年の広州インターネット法院の判決では、裁判所はAIサービス提供者がデータ訓練段階で適法な権利処理をしなかったことを指摘し、著作権侵害責任を問いました。同年、杭州インターネット法院のLoRAモデル判決では『分類分層(分類分層)』責任論が提示されました。データ入力段階と出力段階を区別し、訓練段階では技術革新のためにやや柔軟な『合理的使用』を認める余地を残しながらも、出力段階での侵害に対しては厳格な責任を課すというものでした。
暫定方法は中国のAI企業に明確なメッセージを与えました。「革新しろ。ただし統制可能な範囲内でのみ。」このせまい柵の中で踊らなければならないことが、中国のAI開発者たちの運命でした。
イ. CAC執行現況
北京の金融街に位置するバイトダンス(ByteDance)本社の会議室。経営陣は売上グラフではなく、別のチャートを眺めていました。CACのアルゴリズム登録審査の現況でした。
中国のAI規制は紙の上の法では終わりませんでした。CACという強力な執行機関が現れると同時に、シリコンバレーでは想像することもできない形態の『官治(官治)AI』の時代が開きました。
(1)1,400個以上のAIアプリ登録
一つの数字が中国のAIエコシステムの規模を物語っています。2025年4月現在、CACに登録された生成型アルゴリズムツール(Generative Algorithmic Tools, GATs)の数は3,739個に達します。約2,353の企業がこれらのツールを運営しています。
毎月250から300の新しい登録が行われています。
この数字が何を意味するのかを理解するには文脈が必要です。西側でAIアプリをリリースするには、アプリストアの技術審査に合格するだけです。中国は異なります。
CACは舆論に影響を及ぼすか、社会的動員能力を持つインターネット情報サービスアルゴリズムについて、登録(備案、ベイアン)を義務化しています。
登録過程では、企業は以下の情報を提出しなければなりません。サービスの基本情報、運営主体、サーバー所在地、サービス形態、主要機能。アルゴリズムとモデル情報、モデルタイプ、パラメータ規模、主要使用シナリオ、リスク管理体系。データとセキュリティ体系、訓練データの出所、個人情報と機密情報の処理方式、セキュリティ事故対応計画です。
登録されていないAIサービスは、アプリストアの配布またはウェブサービスの提供がブロックされます。発覚した場合には、売上の5%に相当する過料または刑事処罰を受ける可能性があります。
2024年上半期、複数の企業がCACのメスに引っかかりました。アルゴリズム登録要件を無視したり、AI生成コンテンツを適切にモニタリングしなかった企業のアプリが停止されました。重慶CACは南川区のロンチェン(榮城)ネットワーク技術スタジオが運営していたChatGPTベースのサービスを閉鎖しました。セキュリティ評価に合格せず、LLM登録も完了しなかったためです。
2025年4月9日、CACは公式発表を行いました。3月31日時点で346個の生成型AIサービスが登録を完了したとのことです。DeepSeekとバイドゥのErniebotがリストに含まれていました。CACは既にリリースされた生成型AIアプリケーションまたは機能について、AIモデル名と登録番号を目立つ位置または製品詳細ページに表示することを要求しました。
この登録制度は単なる統計目的ではありません。当局は登録情報と実際のサービス動作を比較・点検することで、特定のサービスが舆論形成や社会動員に与える影響を把握できます。金融、教育、メディアなど敏感な分野での利用の有無もモニタリングされます。違反事実が発見された場合は、是正命令、サービス中断、罰金、信用制裁など多様な行政処分が課されます。
また、登録データは産業政策と補助金配分にも活用されます。政府は戦略的領域、産業製造、金融リスク管理、社会管理、都市運営などへの投資と補助金対象を選定する際、このデータを参考にします。登録制は統制と育成を同時に実行する「政策レーダー」として機能しています。
興味深い統計があります。トリビウムチャイナ(Trivium China)の分析によれば、登録されたツールの50%以上がファウンデーションモデルです。西側市場がOpenAI、Anthropic、Googleのモデルを中心に統合されるのとは異なり、中国には数百の企業が独自のLLMを構築しています。大型テックからスタートアップ、国営企業まで、すべてが独自モデルを構築しています。技術的自立に対する政府の強調、明確な市場勝者がまだ出現していない状況、および競争相手の技術スタックの上に構築することを拒否する文化が、この現象の原因です。
(2) 450個のLLM届出制
アプリケーションの基盤となる大規模言語モデル(LLM)については、別途の届出および審査制度が運営されています。2025年3月時点で、約350個のLLMがCACへの届出を完了しました。最新の推定値によれば、この数字は400個から450個の間に増加しています。
LLM届出制は単純な「モデル存在通知」ではありません。モデルの潜在的影響力を考慮した差別的規制の基礎です。
届出過程では、企業は以下の情報と資料を提出しなければなりません。主要機能、対象ユーザー、適用シナリオ、訓練データの現況、サービスおよび安全予防措置に関する情報。関連サービス契約、コーパス注釈規則、ブロックキーワードリスト、テスト質問セット。
CACの審査焦点は明確です。モデルとアルゴリズムのローカライゼーション。微調整されたデータセンター、チップ、リソースの現況。訓練データのセキュリティ、安全な出所、コンテンツ、注釈の包含状況。モデルのセキュリティ、コンテンツ安全性、生成コンテンツの正確性と信頼性。セキュリティリスク関連のキーワードライブラリ構築の有無。生成コンテンツに対するテスト質問データベース。応答拒否に対するテスト質問データベース。
カーネギー国際平和財団(Carnegie Endowment for International Peace)の分析によれば、CACは加速化されたペースで申請を承認しています。2023年には64個の生成型AIサービスが登録されました。2024年には238個に増加しました。ほぼ4倍の増加です。
2024年8月、CAC責任者の庄栄文は注目に値する発言をしました。CACが「包容的で慎重でありながらも敏捷なガバナンスを堅持し、大型モデル登録プロセスを最適化し、企業のコンプライアンスコストを低下させる」と宣言したのです。また「分類と等級化、安全テスト、緊急対応などの側面から安全標準体系を豊かに完成させる」と述べました。
これは規制当局がアルゴリズム登録プロセスを継続的に調整していることを示しています。ある中国の弁護士は、CACが多数の届出に対応するのに困難を感じていると述べました。そのため、機関はリスクベースの分類を検討しています。高リスクモデルのみ、より徹底的な登録プロセスを経由させるつもりです。届出されたLLMは継続的な義務を負担します。コンテンツフィルタリングとセキュリティモジュールの搭載および定期更新。モデル更新またはバージョンアップグレード時の再評価と報告。重大なセキュリティ事件発生時の即座の報告と是正。大規模な虚偽情報拡散または政治的に敏感な発言の大量出力がこれに該当します。
形式的にはEU AI法の「高リスクシステム届出および認証」構造と似ているように見えます。しかし、中国では「政治的、社会的リスク」評価が核心であるという点で本質的に異なります。LLM届出制は単純な技術安全性ではなく、「舆論空間での波及力管理」のための装置として機能します。
(3) データブラックリスト体系
CAC執行のもう一つの特徴は、「データブラックリスト」または「禁止データ目録」を中心とした否定的規制体系です。
公式文書では「ブラックリスト」という表現を直接使用していません。しかし、禁止コンテンツ範疇、特定キーワード、ドメイン、データセットを指定してブロックする構造で運用されています。既存の万里防火壁メカニズム、DNSとドメインブロック、キーワードフィルタリング、URLとIPブラックリストなどが生成型AIにもそのまま拡張されています。
2024年2月、国家情報セキュリティ標準化技術委員会が発表したセキュリティ要件は具体的でした。学習に使用されるデータセットに「違法および有害情報」が5%以上含まれてはなりません。この規定の意味することは明確です。企業は莫大なデータクレンジングコストを負担しなければなりません。
ブラックリストには以下のような内容が含まれます。国家安全保障を脅かす情報。暴力的またはわいせつなコンテンツ。検閲された政治的キーワードまたは歴史的事件に関する情報。特定の歴史的事件、政治人物、社会運動、宗教団体などに関する資料。
研究によれば、中国は生成型AIドメインに対するDNS検閲をリードしています。検閲対象ドメインは固定されていません。時期と問題に応じて柔軟に変わる「動的ブラックリスト」形態を取ります。政治的に敏感な問題が浮上したり、特定のプラットフォームが当局と対立したりする場合、該当サービスのドメインとキーワードが短期間内に集中ブロックされるようなものです。
フィナンシャルタイムズの報道によれば、敏感キーワードは毎週更新される必要があります。CACの運営指針は、企業に数千個の敏感キーワードと質問を収集することを要求しています。
訓練データレベルでも実質的な「ブラックリスト」が存在します。天安門事件、新疆ウイグル問題、香港民主化デモ、台湾独立などに関する資料は、国家安全保障と社会安定を損なうという理由でデータセットから体系的に削除されます。その結果、モデルは該当トピックについて十分なデータを学習できません。むしろ応答を回避したり、極度に単純化された公式叙述のみを繰り返す傾向が現れます。
この体系には二重の効果があります。短期的には有害コンテンツ生成を根本から遮断して「安全な」モデルを作ります。しかし長期的には、知識の偏り、表現の貧困、革新の阻害をもたらします。世界について半分の知識しかないAIが、グローバル競争力を持つことができるのでしょうか。これが中国AIの根本的なジレンマです。
ブラックリストとは反対に、CACは学習を推奨する「ホワイトリスト」データセットも構築しています。国営メディアの新華社通信と人民日報の記事、公開データ、学術論文などです。企業に安価で提供したり、優先的に学習するよう促します。AIモデルが共産党の公式立場に合致するデータを主に学習するよう自然に導く効果があります。
c. 政治・社会的規制方式
中国のAI規制を理解するには、法文の向こうを見なければなりません。それは法律というより、巨大な社会工学プロジェクトに近いです。中国共産党にとってAIは諸刃の剣です。体制を守ることもでき、崩壊させることもできる強力な力です。
(1) 技術促進と統制の二重性
「発展を図りながら、安全を最優先とする(統籌發展和安全)。」
習近平主席がAIに関連して繰り返し強調するこの文句は、中国規制の本質的なジレンマを示しています。
一方で、中国はAI超大国を夢見ています。「次世代人工知能発展計画」によれば、2030年までに世界最高のAI強国になることが目標です。
政府は国営企業とビッグテックに莫大なコンピューティングリソースを支援します。データセンターの電気料を免除します。AI人材の獲得に全力を注いでいます。北京、上海、深圳など主要都市に「AI革新試験地区」を指定して規制サンドボックスを適用します。
2025年8月には「AI Plus」実行ガイドラインが発表されました。2027年までに次世代知能型端末とAIエージェントの普及率を70%以上に、2030年までに90%以上に引き上げるという野心的な目標が含まれています。
2025年2月、李強総理は中国の国営企業にAI資本支出を積極的に増やし、生成型AIの実験を行うよう促しました。この指示は直ちに効果を発揮しました。複数の大型国営企業が生成型AIツールの開発と配布を開始しました。中国の3大国営通信事業者であるチャイナモバイル、チャイナテレコム、チャイナユニコムは、国営企業の中で最も革新的なAI開発者となりました。彼らは合計75個の生成型AIツールを登録しました。
2025年初頭に登場したDeepSeekの成功は国家支援の結実でした。この小さなスタートアップは、米国の最高レベルモデルと比較しても遜色ない性能を示して世界を驚かせました。党指導部の観点から、この成果は中国がChatGPT登場後に生じた生成型AI格差をおおむね縮めたという信号でした。しかし一方では、誰よりもAIを恐れています。コンテンツ生成に関しては、少しの譲歩もありません。AIが生成するテキスト、画像、映像はすべて検閲の対象です。企業は技術開発に注力しながらも、同時に数千人のモニタリング要員を雇用してAIの出力物を監視しなければなりません。
生成型AIが作り出す可能性のある統制されない舆論、組織化された反対、西側的価値観の流入を体制脅威と見なします。そのため、中国の規制はアクセルとブレーキを同時に踏む奇形的な構造を持ちます。企業に「世界最高のモデルを作れ」と奨励しながら、同時に「しかしそのモデルが党の路線から1mm外れてはならない」と警告します。
2025年3月14日、CACは「AI生成および合成コンテンツラベリング措置」を発表しました。9月1日から施行されるこの規則は、AI生成コンテンツを明示的にせよ暗黙的にせよラベル付けすることを義務化します。明示的ラベルは、ユーザーが容易に認識できるもので、テキスト、オーディオ、画像、ビデオ、仮想シーンに追加する必要があります。暗黙的ラベルはファイルのメタデータに組み込まれます。
また、CACはデジタル身分認証(digital ID)の導入を計画しています。このシステムは企業のユーザー情報へのアクセスを削減し、代わりに大規模なユーザーデータをより集中的に政府に提供します。こうしたイニシアティブは、AI出力物とデータフローに対する統制を中央集権化しようとするより広い戦略を示しています。国家を革新と情報の両方の主要なゲートキーパーとして位置付けようとしているのです。
北京インターネット法院がAI生成画像に著作権を認める異例の判決を下したことは、AI産業を奨励し、創作者のツール活用を促進しようとする司法的意志が反映された事例です。裁判所は人間の知的投入がある場合、AI生成物も「著作物」として認定することでAI活用を奨励しました。一方、ディープフェイク技術が詐欺や政治目的で悪用される場合には、容赦ない処罰を加えます。2024年4月に北京法院がAI音声複製技術について人格権侵害を認め、高額の賠償判決を下したことがその例です。
中国は「統制可能な範囲内での革新」のみを許容しています。
(2) 国内閉鎖ネットワーク環境
中国のAIは、万里防火壁(Great Firewall)という巨大なガラスの温室の中で育ちました。Twitter、Facebook、YouTube、ニューヨーク・タイムズなど、世界中のデータの流れが遮断された独自の生態系です。
GFWatchという検閲モニタリングプラットフォームによれば、2024年末時点で20万個以上のドメインがブロックされています。GreatFire.orgによれば2024年2月時点で10万個以上のウェブサイトが中国でブロックされています。多くの国際ニュースメディアとその中国語ウェブサイトが含まれます。
この閉鎖的環境はAI開発と利用方式に直接的な影響を与えます。
まず、データ収集段階での海外ウェブ、ソーシャルメディア、学術データに対する大規模クローリングが困難です。VPN使用も規制対象です。モデルがアクセスできるテキスト、画像、コードデータの範囲が制限されます。
次に、開発者、研究者、学生が海外の最新論文、オープンソースプロジェクト、APIをリアルタイムで活用することが困難です。技術追趕と協業のコストが増加します。
第三に、反対に、ファイアウォール内で蓄積される中国国内のユーザーデータは、外部競争者に比べて相対的に独占的かつ集中的に活用されることができます。中国語自然言語処理やローカルサービス最適化など、特定分野で比較優位をもたらします。
中国のAIモデルは、主に中国国内のインターネットデータ、WeChat(ウィーチャット)、Weibo(ウェイボー)、Baidu(バイドゥ)などを中心に学習します。西側のデータであるWikipedia、Reddit(レディット)、グローバルニュースなどへのアクセスが遮断されるか制限的であるため、中国のAIモデルは西側モデルと全く異なる世界観と知識体系を持つようになります。
これは中国AIの『ガラパゴス化』をもたらします。中国国内では通用しますが、国境を越えた瞬間に競争力を失う技術です。グローバル市場に進出しようとする中国のAI企業は、二つのモデルを別々に構築する必要があります。国内向け『検閲版』と輸出用『グローバル版』です。しかし、データの断絶は技術の断絶につながります。研究によれば、中国のDNS検閲が生成型AIプラットフォームドメインをますます多く対象としています。これは国民の海外AI使用を減らし、国内代替サービスの利用を強制することで、ローカル企業保護とデータ国地化を促進します。しかし同時に、国際共同研究とグローバルオープンソースコミュニティ参加に制約を与え、長期的には中国の科学技術界の『孤立』とイノベーション鈍化が懸念されています。
2017年、テンセントのチャットボット『Baby Q(ベイビーキュー)』が政府を『腐敗した政権』と言及し、共産党を愛していないと主張し、米国への移民を夢見ると述べた後、削除されました。プログラマーたちが警察に呼び出され、尋問を受けたという報道がありました。この事件は、AIが体制にどのような脅威となり得るかを当局に刻印させました。
(3)海外AIの中国進出封鎖効果
規制の最後のパズルは『外勢の遮断』です。中国政府はOpenAIのChatGPT、GoogleのGeminiなど海外の主要な生成型AIサービスへのアクセスを徹底的に遮断しました。名目はデータセキュリティと国家安保でしたが、実態は『思想的汚染』を防ぐためのデジタル鎖国政策です。
2024年7月9日、OpenAIは中国、香港、マカオ、ロシア、イラン、北朝鮮など対応していない国と地域からのAPI接続を遮断する措置を実施しました。それまで中国の開発者たちはVPNやプロキシサーバーを通じてOpenAIのAPIにアクセスしていました。ChatGPTブラウザインターフェースは中国IPから遮断されていましたが、APIはそれでもVPN無しで呼び出すことができたからです。
OpenAIの遮断は広範な影響を及ぼしました。ChatGPTラッパーを開発していた企業、ChatGPTで動作するアプリ、OpenAI出力で自社モデルを訓練していたローカルLLM開発者たち、すべてが打撃を受けました。ある業界インサイダーは、多くの中国スタートアップがOpenAIを商用にパッケージした形式の製品を提供してきたと述べました。
この措置は中国のテクノロジー企業が自社研究開発を加速させるよう圧力をかける効果をもたらしました。OpenAIの発表直後、Moonshot(ムーンショット)、Zhipu AI(ジプーAI)、Baidu(バイドゥ)、Alibaba(アリババ)、01.AIなど中国大型モデル製造企業は即座に『リロケーション計画』を発表しました。OpenAI APIユーザーが自社サービスへ容易に移行できるよう支援するというものでした。Alibabaクラウドは自社の生成型AIプラットフォーム『Bailian(バイリアン)』がOpenAI全ユーザーのための代替案を提供すると発表しました。
興味深い事例があります。Apple(アップル)です。2024年6月、Appleは米国市場で自社製品にOpenAIのChatGPTを統合した『Apple Intelligence』を発表しました。しかし中国ではChatGPTが遮断されています。Appleは中国国内のiPhoneに搭載されるAI機能のためにBaiduと協力する必要がありました。Samsungも同様です。Samsungは中国国内の最新スマートフォンモデルでBaiduの『Ernie Bot(アーニーボット)』を使用しています。中国以外の他地域ではGoogleのGeminiを使用しています。
2025年2月、Alibaba会長の Joe Tsai(ジョー・チャイ)は、会社がAppleとiPhoneに自社AIを統合する契約を締結したと確認しました。The Information(ザ・インフォメーション)によれば、Appleは依然とライバルであるBaiduとも対話を進めています。中国では米国のパートナーを使用できないため、国内パートナーが必要であったからです。
この遮断効果は、Baidu、Alibaba、Tencentなど中国在来の大手テック企業に、膨大な国内市場を独占する機会をもたらしました。海外競争者がない状況下で、彼らは迅速にユーザーデータを確保し、技術を高度化することができました。Baiduの『Ernie Bot』が発売初期の失望ぬぐい性能にもかかわらず、数億人のユーザーを確保できたのは、ユーザーが選択できる他の代替案がなかったからです。
しかし長期的には、この閉鎖性と政治的検閲は中国AIのグローバルな信頼性と国際協力の機会を制約する両刃の剣となり得ます。最近、米国が対中国AI半導体輸出統制を強化する中、中国はハードウェアとソフトウェア双方の面で独自生存を模索する状況に直面しています。
結果として、AI生態系は『米国中心の西側ブロック』と『中国中心の独自ブロック』に二分されました。技術標準、倫理基準、データフォーマットなど全ての面で、二つの陣営間の相互運用性が失われつつあります。グローバルAIガバナンス論議においても、中国は自分たちだけの『データ主権』論理を前面に出して独自路線を歩んでいます。2025年7月、世界人工知能会議(WAIC)で中国は『AIグローバルガバナンス行動計画』を発表しました。国際AIガバナンスを形成し影響を及ぼそうとする野心を明らかにしたものです。
中国の政治・社会的規制方式は、外部の脅威である西側の思想および企業を遮断し、内部の能力である国産企業を育成しながら、そのすべてのプロセスが共産党の統制下に置かれるよう設計された、高度に戦略的なシステムです。法が権力を制限する『法の支配(Rule of Law)』ではなく、権力が法を通じて技術を統制する『法による支配(Rule by Law)』の典型です。
次章では、このような中国のAIが実際の法廷ではどのように扱われるのか、世界最初級の判決たちの世界へ入ってみましょう。