過去1年のテクノロジー業界のテーマといえば、間違いなく生成AI――生成人工知能であり、その開発が加速し続けたことです。生成AIの影響力は拡大し続け、日々新たな問題を提起しています。計算能力、責任問題、コンテンツの著作権や所有権などの分野で、新たな論点が次々と浮上しています。中でも特に議論を呼んでいるのが、AIや大規模言語モデル(LLM)のトレーニングに、著作権保護された著作物を使用することの問題です。これについては、今まさに世界中で議論が進んでいるわけですが、デリー高等裁判所で審理されているインドの通信社ANI MediがChatGPTの開発者OpenAIを相手取って起こした訴訟もそのひとつです。争点の中心はオプトアウト方式をめぐるものです。LLMの所有者はこの仕組みが導入されることを望んでいますが、著作権者はほとんど、あるいは全く支持していません。

マネージング・パートナー
Obhan & Associates
この訴訟でLLM開発者が提唱する原則は、著作権者が自分の著作物をLLMのトレーニング・プログラムに使用しないよう除外またはオプトアウトの意思を明確に示さない限り、すべての公開データや作品は自由に使用できるようにすべきというものです。これは、著作権者がLLMモデルごとに、自らの著作物をトレーニング目的で使用してはならないと明示的に表明する責任を負うということです。著作権者はその都度、オプトアウトしなければならないわけです。
著作権者は2つの方法でオプトアウトすることが可能です。1つがロケーションベースによる識別子を用いる方法で、特定のドメインやURLに掲載された著作物へのアクセスやその使用を制御するものです。もう1つがユニットベースの識別子を用いる方法で、著作権のあるコンテンツやデータそれぞれへのアクセスと使用を管理するツールを用います。ロケーションベースでは広範囲を網羅することになりますが、ユニットベースの識別子を用いれば、大規模なデータセットの中の特定の著作物を対象にするという緻密なアプローチが可能になります。
ロケーションベースの識別子による方法は、よりシンプルですが、ドメインやURL全体をコントロールできるのは管理権を持つ者だけに限られます。管理権を持つ者が著作権者とは限りません。標準的なロボット排除テキストファイルは、ウェブクローラーを指示・制御するために用いられ、ドメイン・ホストのみを保護します。仮に保護された著作物が、著作権者が明示的にオプトアウトしていない他のサイトでも利用可能な場合、LLMはそこに容易にアクセスしてスクレイピングすることができます。オプトアウトは遡及的ではなく将来に向けたものであり、既存の作品は保護されないままとなります。これにより、検索エンジンのランキングや可視性にも悪影響も及ぼします。新しいクローラーやAIツールが毎日のように登場する中、権利者は根気強く、手間をかけてそれぞれを特定し、オプトアウトしなければなりません。

アソシエイト
Obhan & Associates
オプトアウトの有効性の議論が続く中、このモデルがデフォルトとして広く採用される可能性が高まっています。2024年12月、英国政府は英国著作権法とAIおよびLLMとの整合性に関するコンサルテーション・ペーパーを発表しました。これには、著作権保護された著作物をテキストマイニングおよびデータマイニングをすることは、商業活動であっても、著作権法から免除されることが提案されていました。ただし、著作権者は自らの権利を留保するか、オプトアウトすることが可能です。このアプローチは、AIモデルの質の高い開発を支援して、英国のAI産業を国際競争力のあるものにし、OpenAIやGoogleのようなプレイヤーと競争できるようにという前提に基づくものです。中国のDeepSeekが現在、世界最大のオープンソースLLMとして喧伝される中、このアプローチはさらに支持を集める可能性があります。
オプトアウトは便利で一見、保護策のように思えますが、著作権保護の基本を無視するものです。著作物のすべてのバージョンが保護されるわけではなく、特にオプトアウトされていない他のドメインにある著作物は依然、LLMによるアクセスに脆弱なままです。対価の支払いなしに保護された著作物をトレーニングに用いることを許してしまいます。これにより、LLM所有者には不当な優位性が与えられることになります。
オプトイン方式の方が、より理にかなっており、より公正であることは間違いありません。これは新しい概念ではありません。インドでは、2023年デジタル個人データ保護法第6条で、データ受託者は個人データを処理する前に、データ主体からの許可を求めるよう規定されています。すでにデータプライバシーの規制でオプトインの原則を認め、採用している以上、一貫して同じ概念を著作物にも適用すべきです。
ただし、このアプローチを採用することは、国際的な規制動向に逆行する可能性があります。最近、公表されたAIガバナンスのガイドライン開発に関する報告書では、政府は、著作権者の承認なしにLLMをトレーニングすることは、著作権侵害に該当する可能性があると示唆しました。これにより、インドは国際的なコンセンサスからの〝オプトアウト〟を選択し、独自の道を歩むことになるかもしれません。
Essenese Obhan氏はObhan & Associatesのマネージング・パートナー、Anjuri Saxena氏はアソシエイトです。

Advocates and Patent Agents
N – 94, Second Floor
Panchsheel Park
New Delhi 110017, India
Contact details:
Ashima Obhan
T: +91 98 1104 3532
E: email@obhans.com
ashima@obhans.com





















