[안일운의 스타트업 법률산책] AI 학습 데이터 수집, 합법일까?

Article posted in 2021-02-18 15:41:50 | VEAT

인터넷에 있는 데이터 써도 될까?


AI 학습을 위한 데이터를 인터넷에서 수집하다 보면 의문이 들 때도 있을 것입니다. 아무리 봐도 이 데이터를 만들기 위해서는 시간과 비용이 들었을 것 같은데, 이렇게 다운로드해 써도 되는 걸까? 아니면 이미 인터넷에 올려놓았다는 건 누구든 써도 상관없다는 의미가 아닐까? AI 모델 학습을 위한 인터넷상 데이터 수집에 대해서, 법률적 분석하면 여러 측면이 있을 수 있겠지만, 여기서는 저작권법의 측면에만 집중하도록 하겠습니다. 

원래 사람이 자신의 사상 또는 감정을 담아 만든 모든 형태의 창작물(글, 사진, 그림, 노래, 영화, 연극, 책, 그리고 컴퓨터 소프트웨어 등)은 저작물로서, 저작권 보호를 받습니다. 저작물을 창작한 사람은 저작권자로써, 그 저작물을 독점적으로 사용할 권리가 있고, 다른 사람에게 자신의 저작물을 사용토록 할 수 있는 권리를 가집니다. 저작권자에게 허락받지 않고 저작물을 사용하면 저작권법을 위반하게 됩니다. 

이 때문에 높은 수준의 AI 모델을 만드는 양질의 데이터를 인터넷으로 얻는 것이 저작권법에 위반되는지 여부는 최근 논쟁의 대상이 되어 왔습니다. 서울의 날씨 통계, 법조문 같은 것은 저작물로 인정되지 않기 때문에 쉽게 AI 모델 학습에 사용할 수 있지만, 인터넷에 공개된 신문기사, 토론 게시판에서 오간 글과 댓글, 인터넷 쇼핑몰에 게시된 사진들은 모두 저작물이기 때문에 저작권자의 허락 없이 AI 모델로 사용할 수 있는지 논란이 있었습니다.


-테크엠, 「안일운의 스타트업 법률산책」 칼럼, 일부 발췌-


더 자세한 내용은 안일운 수석 변호사의 테크엠 칼럼에서 확인해 주시기 바라며, 위와 같은 논란을 종식시키기 위하여 문화체육관광부에서는 저작권법 개정안 입법을 준비하고 있습니다. 

​저작권법 전부개정안 주요 내용이 궁금하신 분들은 함께 참고해 주시기 바랍니다.

법무법인 비트의 안일운 수석 변호사는 연세대학교 공과대학 컴퓨터과를 졸업하고, 네이버 주식회사 검색개발센터 과장으로 근무하였으며, 문서순위결정시스템(검색엔진 랭킹 시스템)과 분산데이터베이스에 대한 연구개발을 수행하였습니다. 또한 세계 최고, 최대의 코딩 능력 경진대회인 세계 대학생 프로그래밍 경시대회(ACM-ICPC) 한국 지역 결선에서 7위(은상)로 입상한 이력이 있으며, 한국저작권위원회 오픈소스 소프트웨어 라이선스 전문가커뮤니티의 위원으로도 활약하는 등 소프트웨어와 지적재산 분야에 대한 싶은 기술적 이해를 바탕으로 법률 자문​을 드리고 있습니다.

감사합니다.