설명
2022년 출시된 ChatGPT는 다양하고 방대한 데이터를 학습하여 기존의 AI보다 언어 패턴과 구조를 정교하게 이해하고 있어 엄청난 인기를 끌고 있습니다. ChatGPT를 실제 업무에 적용하고자 하는 기업들이 증가하고 있는데, 아직까지 AI와 관련한 법적 근거가 확립되지 않은 상황이어서 ChatGPT에 대해서도 다양한 법적 문제가 제기되고 있습니다. 특히 지적재산권의 관점에서 ChatGPT의 데이터 마이닝, ChatGPT 답변의 저작물 인정 여부 등과 같은 문제가 제기되고 있습니다.
1. ChatGPT의 데이터 마이닝에 대한 법적 문제
ChatGPT의 데이터 학습을 위해서는 방대한 양의 텍스트 데이터가 수집되어야 합니다. AI 모델의 데이터 학습 과정에서, 웹 스크래핑(web scraping) 방법을 통해 웹페이지들에서 텍스트 콘텐츠를 자동으로 추출하는 등의 방식으로 학습 데이터를 수집하게 됩니다. 웹 스크래핑, 크롤링 등의 방식으로 온라인에서 무작위로 콘텐츠를 수집하는 경우, 저작권법상 복제의 방법으로 타인의 저작물을 수집하는 행위로써 저작권 침해에 해당될 수 있고(저작권법 제16조, 제20조), ‘소재를 체계적으로 배열 또는 구성한 편집물’인 데이터베이스를 상당 부분 복제하여 수집하는 행위로써 데이터베이스권 침해에 해당될 수 있으며(저작권법 제2조 제19호, 제93조). 타인의 상당한 투자나 노력으로 만들어진 성과 등을 공정한 상거래 관행이나 경쟁질서에 반하는 방법으로 자신의 영업을 위하여 무단으로 사용함으로써 타인의 경제적 이익을 침해하는 행위로써 부정경쟁방지 및 영업비밀보호에 관한 법률(이하 “부정경쟁방지법”) 제2조 제1호 (파)목의 부정경쟁행위에 해당될 수 있습니다.
이와 관련하여 법원은 잡코리아 v. 사람인HR 사건, 리그베다위키 v. 엔하위키 미러 사건, 야놀자 v. 여기어때 사건 등 웹 스크래핑이 문제된 사건에서 데이터베이스 제작자에 대한 권리 침해 또는 부정경쟁방지법 제2조 제1호 (파)목의 성과 무단사용행위를 인정한 바 있습니다. 판례의 입장을 종합하여 보면, ChatGPT가 웹 스크래핑의 방법으로 학습 데이터를 수집하는 과정에서 타사의 데이터베이스를 반복적, 체계적으로 상당 부분 복제하였다는 등의 사정이 인정된다면, 데이터베이스권 침해 또는 부정경쟁방지법상 성과무단사용행위에 해당될 가능성이 존재합니다. 특히 최근에는 많은 웹사이트들이 로봇배제 표준(robots.txt)에서 웹사이트의 로봇 접근을 금지하고 있다는 점도 유의하여야 합니다. 따라서, ChatGPT와 같은 AI 모델을 개발하고자 할 경우 학습 데이터 수집의 적법성을 유의하여야 합니다.
그리고 2022. 4. 20.부터 시행된 부정경쟁방지법 제2조 제1호 (카)목은 접근권한이 없음에도 부정한 수단으로 취득하거나 혹은 접근권한이 있더라도 부정한 목적으로 데이터를 사용하는 행위 등을 부정경쟁행위의 일종으로 규정하고 있는데, 향후 관련 판례가 집적되면 위 규정의 적용 여부도 고민해 볼 필요가 있습니다.
2. ChatGPT의 답변에 대한 법적 문제
가. ChatGPT 답변의 저작물성 인정 여부
ChatGPT는 AI 언어 모델이므로 노래 가사, 소설, 시, SNS 게시글, 광고 문구 등 텍스트 기반의 콘텐츠를 생성할 수 있습니다. 이 때 ChatGPT의 답변으로 생성된 콘텐츠가 저작권법상 보호되는 ‘저작물’에 해당하는지 여부가 문제될 수 있습니다. 실제로 우리나라를 비롯한 대부분의 국가에서는 AI가 만들어낸 결과물을 아직까지는 저작물로 인정하지 않고 있는데, 이는 ‘창작성’의 문제라기보다는 AI가 저작권법상 보호되는 ‘저작권자’에 해당하지 않는다는 입장에 더 가까운 것으로 판단됩니다. 미국 저작권청은 2022. 2. 14. AI가 창작한 미술저작물은 ‘인간에 의한 창작물’이 아니라는 점을 이유로 저작권 등록 거절결정을 하였고, AI 프로그램을 발명자로 하여 각국에서 특허를 출원하고 있는 다부스(DABUS) 프로젝트의 경우에도 ‘사람이 아닌 AI가 발명자가 될 수는 없다’는 이유로 특허가 거절된 사례가 있습니다. 다만, ChatGPT 답변과 같은 AI 창작물이 점차 많아지고 권리 보호 필요성에 관한 목소리가 높아지자 최근 미국 저작권청은 AI 창작물에 인간의 창의적 노력이 포함되었다는 것이 입증되는 경우에는 해당 부분에 한해서는 저작권을 인정하겠다는 다소 전향적인 입장을 공표하였습니다. 그리고, 일본은 2016년 지식재산추진계획에서 “AI 창작물의 경우에도 저작권을 인정할 필요가 있다”는 방향성을 세웠고, EU는 2017년 AI 로봇의 법적 지위를 ‘전자인간’으로 인정하는 결의안을 채택해 저작권 보호의 토대를 마련하였습니다.
나. ChatGPT의 답변 활용시 유의사항
ChatGPT는 다양한 텍스트 정보를 학습하고 이에 기반하여 답변을 생성하는 것으로서, 이용자의 명령에 의해 생성해내는 ChatGPT의 답변이 기존의 어문저작물과 매우 유사할 가능성이 존재합니다. 이 경우, 기존 저작물과 실질적으로 유사성이 인정되는 ChatGPT의 답변을 복제, 배포하는 등의 방법으로 이용하게 되는 경우에는 저작권법 위반에 해당될 위험성이 존재합니다. AI 언어 모델인 ChatGPT는 “프로그래밍을 이용하여 기존의 저작물에 대한 표절에 해당하지 않도록 창작물을 생성해 낼 수는 있고, 저작권을 침해하는 답변을 생성하지 않도록 프로그램되어 있기는 하나, 타인의 저작권 등 권리를 침해하지 않는다는 점을 보장할 수는 없고, 의도하지는 않더라도 기존의 저작물과 유사성이 있을 수 있다”고 표방하고 있으므로, ChatGPT 답변을 활용하는 경우에는 더욱 각별한 주의가 필요합니다. 이에 따라, 가급적 복제, 배포 또는 상업적인 이용시에는 기존 저작물과의 유사성을 검토할 필요가 있습니다.
최근 정부, 공공기관, 기업체, 학교를 불문하고 ChatGPT의 도입 및 활용 범위에 관한 논의가 매우 활발하게 이루어지고 있는데, ChatGPT를 통해 수준 높은 콘텐츠를 생성할 수 있게 됨에 따라 관련 업계 뿐만 아니라 AI 서비스를 사용하는 사용자의 입장에서도 AI 기술 사용시 발생할 수 있는 지적재산권 관련 법적 문제점을 이해하는 것이 중요합니다.