LLM에서 옵트아웃하여 통제권 되찾기

저자: Essenese Obhan 그리고 Anjuri Saxena, Obhan & Associates
0
142
LinkedIn
Facebook
Twitter
Whatsapp
Telegram
Copy link

지난 한 해 동안 기술 세계의 주요 화두는 단연코 GenAI, 즉 생성형 인공지능이었으며, 그 개발 속도는 계속해서 가속화됐다. GenAI의 영향력은 점점 더 확장되고 있으며, 매일 새로운 질문들을 제기하고 있다. 이러한 질문들은 컴퓨팅 파워, 책임 문제, 콘텐츠의 저작권 및 소유권과 같은 영역을 포함한다. 논란이 되는 문제 중 하나는 AI와 대규모 언어 모델(LLM)의 훈련에 저작권이 있는 작품을 사용하는 것과 관련이 있다. 이는 전 세계적으로 논의되고 있는 실시간 쟁점으로, 인도 뉴스 통신사 ANI Media가 ChatGPT 개발사인 OpenAI를 상대로 소송을 제기했고 델리 고등법원도 이를 검토하고 있다. 핵심 논점은 옵트아웃 메커니즘(opt-out mechanism)을 중심으로 전개되고 있다. LLM 소유자들은 이를 도입하기를 선호하지만, 이를 지지하는 저작권 소유자는 거의 없거나 전무한 상황이다.

Essenese Obhan
Essenese Obhan
Managing partner
Obhan & Associates

이 사건에서 LLM 개발자가 주장하는 원칙은, 모든 공개적으로 이용 가능한 데이터나 작품은 저작권 소유자가 자신의 작품을 LLM 훈련에 사용되는 프로그램에서 제외하거나 옵트아웃(opt-out)하기를 원한다고 명확히 표시하지 않는 한 자유롭게 사용할 수 있어야 한다는 것이다. 따라서 저작권 소유자는 각 LLM 모델에 대해 자신의 작품이 훈련 목적으로 사용될 수 없음을 명시적으로 밝혀야 하는 부담을 지게 된다. 즉, 이들은 매번 옵트아웃을 해야 한다.

저작권 소유자는 두 가지 방법으로 옵트아웃할 수 있다. 하나는 위치 기반 식별자를 사용하는 것으로, 특정 도메인이나 URL에 호스팅된 작품에 대한 접근 및 사용을 제어하는 방식이다. 다른 하나는 단위 기반 식별자를 사용하는 것으로, 개별 저작권 콘텐츠나 데이터를 관리하는 도구를 활용하여 접근 및 사용을 제어하는 방식이다. 위치 기반 전략은 훨씬 더 광범위한 접근을 제공하는 반면, 단위 기반 식별자는 더 큰 데이터 세트의 특정 작품에 대해 보다 세밀한 접근 방식을 허용한다.

위치 기반 식별자는 더 간단하지만, 전체 도메인이나 URL을 제어할 수 있는 사람만 이를 구현할 수 있다. 이들은 저작권 소유자가 아닐 수도 있다. 웹 크롤러를 지시하고 제어하기 위해 사용되는 표준 로봇 배제 텍스트 파일은 도메인 호스트만 보호한다. 보호된 작품이 저작권 소유자가 명시적으로 옵트아웃하지 않은 다른 사이트에서 이용 가능한 경우, LLM은 이를 쉽게 접근하고 스크래핑할 수 있다. 옵트아웃은 소급적이 아니라 전향적이기 때문에 기존 작품은 보호되지 않는다. 이는 검색 엔진 순위와 가시성에도 부정적인 영향을 미친다. 매일 새로운 크롤러와 AI 도구가 출시됨에 따라 권리 소유자는 이를 하나하나 식별하고 옵트아웃해야 하는 번거로운 작업을 끈기 있게 수행해야만 한다.

Anjuri Saxena
Anjuri Saxena
소속 변호사
Obhan & Associates

옵트아웃의 효과에 대한 논의가 진행 중인 가운데, 이 모델이 기본값으로 널리 채택될 가능성이 제기되고 있다. 2024년 12월, 영국 정부는 AI와 LLM에 맞춰 영국 저작권법을 조화시키기 위한 협의 문서를 발표했다. 이 문서는 저작권이 있는 작품에 대한 텍스트 및 데이터 마이닝 활동을 저작권법에서 면제하는 것을 (상업적 활동을 포함하여) 제안했다. 저작권 소유자는 권리를 보유하거나 옵트아웃할 수 있는 선택권을 가지게 된다. 이 접근법은 AI 모델의 품질 개발을 지원하고, 영국의 AI 부문을 글로벌 무대에 올려 OpenAI 및 Google 같은 경쟁자들과 경쟁할 수 있도록 하는 데 기반을 두고 있다. 중국의 DeepSeek가 세계 최대의 오픈소스 LLM으로 평가받고 있는 상황에서, 이 접근법은 더 많은 지지를 얻을 가능성이 있다.

옵트아웃은 편리한 보호 장치처럼 보이지만, 저작권 보호의 근본을 간과하고 있다. 이는 저작권이 있는 작품의 모든 버전을 보호하지 못하며, 특히 옵트아웃되지 않은 다른 도메인에서 LLM에 의해 접근될 가능성이 있는 작품들을 취약한 상태로 남겨둔다. 또한, LLM이 보상을 지불하지 않고도 보호된 작품을 훈련에 사용하도록 허용하여 LLM 소유자들에게 부당한 이점을 제공한다.

옵트인 메커니즘은 확실히 더 합리적이고 공정한 방식일 것이다. 이는 새로운 개념이 아니다. 인도에서는 2023년 디지털 개인정보 보호법 제6조에 따라 데이터 수탁자가 개인 데이터를 처리하기 전에 데이터 주체의 허가를 받아야 한다. 이미 데이터 프라이버시 규정에서 옵트인 원칙을 인정하고 채택한 만큼, 일관성을 위해 동일한 개념이 저작권이 있는 작품에도 적용되어야 할 것이다.

이러한 접근 방식을 채택하는 것은 국가가 글로벌 규제 트렌드에 반하는 행보를 보이는 것으로 해석될 수 있다. 최근 AI 거버넌스 가이드라인 개발에 대한 보고서에서 인도 정부는 권리 보유자의 승인 없이 LLM을 훈련시키는 것이 저작권 침해에 해당할 수 있다고 언급한 바 있다. 이는 인도가 글로벌 합의에서 벗어나 독자적인 방향을 선택할 가능성을 남길 수 있다.

Essenese OBHAN 변호사는 Obhan & Associates의 Managing Partner이며, Anjuri SAXENA 변호사는 소속 변호사이다.

Obhan & Associates
Advocates and Patent Agents
N – 94, Second Floor
Panchsheel Park
New Delhi 110017, India
Contact details:
Ashima Obhan
T: +91 98 1104 3532
E: email@obhans.com
ashima@obhans.com

LinkedIn
Facebook
Twitter
Whatsapp
Telegram
Copy link