cleanUrl: /about/is-copilot-legal

copilot은 github에 공개된 수십억 개의 오픈소스들을 학습해서 코드를 제안해주는 AI이다. 주석을 통해 코드를 자동 완성할 수 있다. 현재는 베타 테스트를 하고 있고 이 단계가 지나면 유료 버전으로 출시될 예정이다.

출시되자마자 AI가 코딩을 대신 짜준다고?!라는 어그로로 많은 이목을 끌었는데 성능을 떠나서 프라이버시나 라이센스 때문에 말이 많다.

코파일럿이 제안한 다른 사람의 저작권 메시지 | source: https://blog.hrithwik.me/the-good-and-the-limitations-of-github-copilot

코파일럿이 제안한 다른 사람의 저작권 메시지 | source: https://blog.hrithwik.me/the-good-and-the-limitations-of-github-copilot

깃허브는 라이센스의 구분 없이 공개된 오픈소스를 무분별하게 copilot의 학습에 사용하고 있다. 깃허브 CEO는 이미 개발자가 깃허브에 가입한 순간 저작권에 대한 약관에 동의했고, 코파일럿이 그 소스를 가져다 쓰는 것은 공정 이용(fair use)에 해당한다고 말한다.

블로그 포스트를 보면 copilot에 대한 상반된 입장을 볼 수 있다.

블로그 주인은 1. *copyleft 라이센스가 부여된 코드들은 저작권 보호를 엄격하게 하지 않는다. 2. 크롤링 자체는 그저 코드를 읽고 가져오는 것이므로 문제 없다. 3. 기계가 생성한 코드는 저작권 보호의 대상이 아니다. 라고 말한다.

*copyleft 라이센스 코드: 원본 코드와 동일한 라이센스로 출시되고, 공개되어야 한다.

여기에 많은 사람들(개발자들)은 1. 재가공한다해도 GPL 라이센스가 붙은 코드들을 그대로 사용하는 경우가 있어 사용하는 입장에서 저작권 침해의 위험이 있다. 2. 기계가 생성한 코드라고 면죄부를 받을 수 있는 건 아니다. 사용하는 입장에서는 법적인 책임을 져야한다. 3. 상업용, 독점적 이익을 얻기 위한 악용으로부터 창작물을 지키기 위한 라이센스의 의미를 무력화시킨다는 논리이다.

MIT, Apache 같이 기존 오픈소스를 가공해도 공개나 배포의 강제가 없는 permissive 라이센스는 상관없지만 GPL 같은 라이센스가 붙은 copyleft 오픈소스는 재생산한 코드를 공개해야한다.

개인 프로젝트에서 코파일럿을 사용한다면 그냥 공개해버리면 되지만 기업에서 코파일럿으로 코드를 짰을 때 GPL 라이센스의 오픈소스 코드를 사용하게 된다면 다른 프라이빗한 코드들과 함께 공개해야 되는 것 아닌가?