네이버 독자 AI 모델 표절 논란-법률 쟁점 분석

“독자 개발이라더니, 알고 보니 외국산?”
최근 정부 지원을 받은 ‘독자 AI 파운데이션 모델’ 프로젝트 네이버가 독자 AI 모델 표절 논란에 휩싸이며 업계 전체에 충격을 주고 있습니다.
네이버와 업스테이지가 ‘프롬 스크래치’를 내세웠지만, 공개된 코드와 가중치가 외국계 모델과 닮아 있다는 기술적 분석이 잇따르며, “이게 정말 독자인가?”라는 질문이 쏟아지고 있죠.

그런데, 이 논란은 단순한 기술 이슈가 아닙니다.
저작권 침해부터 영업비밀 유출, 보조금 사기까지—형사처벌로 이어질 수 있는 법적 리스크가 도사리고 있습니다.
오늘은 이 사건의 핵심 법률 쟁점들을 깊이 파헤쳐 보겠습니다.

네이버 독자 AI 모델 표절 논란
네이버 독자 AI 모델 표절 논란

1. 네이버 독자 AI 모델 표절 사건 개요

최근 정부 주관 ‘독자 AI 파운데이션 모델’ 프로젝트에 참여한 업스테이지와 네이버클라우드가 중국계 AI 모델을 참고했다는 표절 의혹에 휘말렸습니다. 두 회사 모두 ‘프롬 스크래치(From Scratch)’ 방식으로 독자 개발했다고 주장했으나, 외부 모델의 가중치나 인코더를 활용한 것으로 드러나면서 ‘독자 AI’의 기준을 둘러싼 논란이 커지고 있습니다.

2. 네이버 독자 AI 모델 표절 사건 주요 법률 쟁점

가. 저작권 침해 여부

1) AI 모델의 저작권 보호 대상성

현행 저작권법상 저작물은 “인간의 사상 또는 감정을 표현한 창작물”로 정의됩니다(저작권법 제2조 제1호). AI 모델 자체는 인간이 아닌 알고리즘과 데이터의 산물이지만, 그 설계 과정에서 인간의 창작적 기여가 있다면 컴퓨터프로그램저작물로 보호받을 수 있습니다(저작권법 제2조 제16호).

특히 AI 모델의 소스코드, 아키텍처 설계, 학습 알고리즘 등은 창작성이 인정되는 범위 내에서 저작권 보호 대상이 될 수 있습니다. 다만, 단순한 아이디어나 알고리즘 자체는 보호되지 않으며, 구체적인 표현 형식만이 보호됩니다.

2) 실질적 유사성 판단

저작권 침해가 인정되려면 ① 침해자가 원저작물에 의거하여 작성했을 것, ② 양 저작물 사이에 실질적 유사성이 있을 것이라는 두 가지 요건이 충족되어야 합니다(대법원 2016. 10. 27. 선고 2015다5170 판결).

본 사안에서 네이버클라우드의 모델이 알리바바 큐웬 모델과 “비전 인코더 웨이트 코사인 유사도, 피어슨 상관계수가 높다”는 주장이 제기되었습니다. 이는 양 모델 간 실질적 유사성을 뒷받침하는 기술적 증거가 될 수 있습니다.

다만, 저작권 침해 여부를 판단할 때는 창작적 표현형식에 해당하는 부분만을 대비해야 하며(대법원 2013. 3. 28. 선고 2010도8467 판결), 공개된 표준 기술이나 필수불가결한 표현은 제외됩니다. 네이버가 주장하는 “검증된 외부 인코더의 전략적 채택”이 업계 표준 기술의 활용에 해당한다면 저작권 침해로 보기 어려울 수 있습니다.

3) 소스코드 유사도 분석의 한계

AI 모델 표절 논란에서 자주 언급되는 ‘유사도’는 기술적 분석 도구일 뿐, 그 자체로 법적 판단 기준이 되지는 않습니다. 한국저작권위원회의 감정 사례를 보면, 소스코드 유사도가 82.8%에 달했음에도 영업비밀 침해는 인정되지 않은 경우도 있습니다(인천지방법원 부천지원 2021. 4. 29. 선고 2019고단4558 판결).

유사도 분석 시에는 ① 오픈소스 제외, ② 자동생성 코드 제외, ③ 창작성 없는 부분 제외 등의 전처리 과정이 필수적입니다. 단순히 높은 유사도만으로는 저작권 침해를 단정할 수 없으며, 창작적 표현 부분의 실질적 유사성을 구체적으로 입증해야 합니다.

나. 영업비밀 침해 가능성

1) 영업비밀의 요건

부정경쟁방지 및 영업비밀보호에 관한 법률상 영업비밀로 보호받으려면 ① 공공연히 알려져 있지 않고(비공지성), ② 독립된 경제적 가치를 가지며(경제적 유용성), ③ 비밀로 관리되어야 합니다(비밀관리성)(부정경쟁방지법 제2조 제2호).

AI 모델의 가중치(weight), 아키텍처 설계, 학습 데이터셋 등은 상당한 투자와 노력으로 만들어진 것으로서 영업비밀에 해당할 수 있습니다. 특히 중국 알리바바나 지푸AI의 모델이 비공개 상태였다면 비공지성이 인정될 가능성이 높습니다.

2) 부정취득 여부

영업비밀 침해가 성립하려면 “절취, 기망, 협박, 그 밖의 부정한 수단”으로 영업비밀을 취득했거나, 부정취득 사실을 알면서 사용했어야 합니다(부정경쟁방지법 제2조 제3호).

본 사안에서는 ① 네이버나 업스테이지가 중국 모델의 가중치를 어떤 경로로 입수했는지, ② 해당 모델이 오픈소스로 공개되었는지 여부, ③ 라이선스 조건을 준수했는지 등이 핵심 쟁점이 됩니다.

만약 중국 모델이 오픈소스로 공개되었고 라이선스 조건을 준수했다면 영업비밀 침해는 성립하지 않습니다. 반대로 비공개 모델을 부정한 방법으로 입수하여 활용했다면 형사처벌 대상이 될 수 있습니다.

다. 부정경쟁행위 해당 여부

1) 성과 등 도용 행위

부정경쟁방지법 제2조 제1호 (파)목은 “타인의 상당한 투자나 노력으로 만들어진 성과 등을 공정한 상거래 관행이나 경쟁질서에 반하는 방법으로 자신의 영업을 위하여 무단으로 사용함으로써 타인의 경제적 이익을 침해하는 행위”를 부정경쟁행위로 규정합니다.

AI 모델 개발에는 막대한 투자와 기술적 노력이 소요됩니다. 만약 네이버나 업스테이지가 중국 기업의 성과를 무단으로 활용하여 ‘독자 개발’이라고 허위 표시했다면, 이는 공정한 경쟁질서를 해치는 부정경쟁행위에 해당할 수 있습니다.

2) 기술적 보호조치 무력화

부정경쟁방지법 제2조 제1호 (카)목 4)는 “정당한 권한 없이 데이터의 보호를 위하여 적용한 기술적 보호조치를 무력화하는 것을 주된 목적으로 하는 기술·서비스·장치를 제공”하는 행위를 금지합니다.

만약 중국 모델에 접근 제한이나 암호화 등 기술적 보호조치가 적용되어 있었는데, 이를 우회하여 가중치를 추출했다면 이 조항 위반이 될 수 있습니다.

라. 정부 지원금 관련 법적 책임

1) 보조금 부정수급

정부의 ‘독자 AI 파운데이션 모델’ 프로젝트는 국가 예산이 투입되는 R&D 사업입니다. 만약 참여 기업이 ‘프롬 스크래치’ 개발이라는 허위 사실을 기재하여 지원금을 받았다면, 보조금 관리에 관한 법률 위반으로 형사처벌 및 환수 조치를 받을 수 있습니다.

2) 사기죄 성립 가능성

더 나아가 처음부터 독자 개발 의사 없이 외부 모델을 활용할 계획이었음에도 정부를 기망하여 지원금을 편취했다면 사기죄(형법 제347조)가 성립할 수 있습니다. 다만, 사기죄 성립을 위해서는 기망 행위, 착오, 재산상 이익 취득 사이의 인과관계가 명확히 입증되어야 합니다.

네이버 독자 AI 모델 표절 -법률 쟁점
네이버 독자 AI 모델 표절 -법률 쟁점

3. ‘프롬 스크래치’의 법적 의미

가. 용어의 불명확성

기사에서 지적하듯이 ‘프롬 스크래치’는 글로벌 AI 학계에서 통용되는 표준 용어가 아니며, 국내에서만 독특하게 강조되는 개념입니다. 과기정통부의 공모 안내서에도 “파생형 AI 모델은 안 된다”는 소극적 정의만 있을 뿐, 적극적인 판단 기준은 제시되지 않았습니다.

나. 법적 기준의 필요성

법적 분쟁을 예방하고 공정한 경쟁 환경을 조성하기 위해서는 다음과 같은 명확한 기준이 필요합니다:

  • 독자 개발의 범위: 어느 부분까지 자체 개발해야 ‘독자 모델’로 인정되는지
  • 외부 기술 활용의 허용 범위: 오픈소스, 표준 기술, 상용 라이브러리 등의 활용이 어디까지 허용되는지
  • 투명성 요건: 외부 기술 활용 시 어떤 방식으로 공개해야 하는지
  • 평가 기준: 독창성, 기여도를 어떤 지표로 측정할 것인지

4. 유사 판례 분석

가. 소프트웨어 저작권 침해 사례

서울중앙지방법원 2021. 7. 21. 선고 2017노18 판결은 N 프로그램과 피고인들 프로그램 간 소스코드 유사도가 27.2%였던 사안에서, 단순히 유사도가 높다는 이유만으로는 저작권 침해를 인정할 수 없다고 판시했습니다. 법원은 “실질적 유사성의 평가는 단순히 유사도의 정량적 평가만으로 이루어지는 것이 아니고 독창성이 높은 핵심적 기능부분이 유사할 경우 인정될 수 있다”고 설시했습니다.

이 판례는 AI 모델 표절 논란에도 시사점을 줍니다. 비전 인코더의 가중치 유사도가 높다는 사실만으로는 부족하고, 해당 부분이 ① 창작적 표현에 해당하는지, ② 모델의 핵심적 기능인지를 구체적으로 검토해야 합니다.

나. 영업비밀 침해 불인정 사례

인천지방법원 부천지원 2021. 4. 29. 선고 2019고단4558 판결에서는 한국저작권위원회 감정 결과 소스코드 유사도가 82.8%에 달했음에도, “동종 업계 종사자라면 통상의 지식과 창의력으로 고안할 수 있는 정보”라는 이유로 영업비밀 침해가 부정되었습니다.

이 판례는 AI 모델에서도 ① 업계 표준 기술, ② 공개된 논문이나 오픈소스를 기반으로 통상의 기술자가 구현 가능한 부분은 영업비밀로 보호받기 어렵다는 점을 시사합니다.

다. 자기표절 논란

대법원 2016. 10. 27. 선고 2015다5170 판결은 “표절 여부가 문제 되는 저작물의 작성 시기와 표절 여부의 판정 시기 사이에 시간적 간격이 존재하는 경우 특별한 사정이 없는 한 저작물 작성 시점의 연구윤리에 따라 표절 여부를 판정하여야 한다”고 판시했습니다.

AI 모델 개발에서도 시점별 기술 수준, 업계 관행, 공개된 기술의 범위 등을 고려하여 판단해야 합니다. 현재 시점의 엄격한 기준을 소급 적용하는 것은 부당할 수 있습니다.

5. 실무적 대응 방안

가. 기업 입장

1) 투명한 공개

외부 기술이나 오픈소스를 활용한 경우 이를 명확히 공개하고, 라이선스 조건을 준수해야 합니다. 네이버가 “허깅페이스와 테크 리포트를 통해 투명하게 공개해 왔다”고 주장하는 것처럼, 사전 공개는 법적 분쟁을 예방하는 가장 효과적인 방법입니다.

2) 독자 기여 부분의 명확화

전체 모델 중 어느 부분이 자체 개발이고, 어느 부분이 외부 기술 활용인지를 명확히 구분하여 문서화해야 합니다. 네이버의 “핵심 엔진을 100% 자체 기술로 개발”했다는 주장처럼, 독자적 기여 부분을 구체적으로 입증할 수 있어야 합니다.

3) 기술적 검증 준비

유사도 분석, 가중치 비교 등 기술적 검증 요구에 대비하여 개발 과정을 상세히 기록하고, 독자 개발 사실을 입증할 수 있는 자료(개발 로그, 중간 산출물, 회의록 등)를 보관해야 합니다.

나. 정부 입장

1) 명확한 기준 마련

‘독자 AI’의 정의, 평가 기준, 외부 기술 활용의 허용 범위 등을 구체적으로 규정한 가이드라인을 마련해야 합니다. 현재처럼 “파생형은 안 된다”는 소극적 정의만으로는 불충분합니다.

2) 전문가 검증 체계 구축

AI 모델의 독자성을 평가할 수 있는 기술 전문가 풀을 구성하고, 객관적인 검증 프로토콜을 수립해야 합니다. 단순한 서류 심사가 아닌 실질적인 기술 검증이 필요합니다.

3) 사후 관리 강화

지원금 지급 후에도 정기적인 모니터링과 검증을 실시하고, 허위 사실이 발견될 경우 환수 및 제재 조치를 엄격히 집행해야 합니다.

6. 결론

이번 독자 AI 모델 표절 논란은 ① 저작권 침해, ② 영업비밀 침해, ③ 부정경쟁행위, ④ 보조금 부정수급 등 다양한 법적 쟁점을 내포하고 있습니다.

핵심은 ‘프롬 스크래치’의 법적 의미를 명확히 하고, 독자 개발의 범위와 외부 기술 활용의 허용 한계를 구체적으로 설정하는 것입니다. 현재처럼 기준이 불명확한 상태에서는 기업들이 혼란을 겪고, 불필요한 법적 분쟁이 발생할 수밖에 없습니다.

정부는 AI 산업 육성이라는 정책 목표와 공정한 경쟁 질서 확립이라는 법적 요청 사이에서 균형을 잡아야 합니다. 지나치게 엄격한 기준은 기술 혁신을 저해할 수 있고, 지나치게 느슨한 기준은 부정행위를 조장할 수 있습니다.

업계에서는 투명한 공개, 라이선스 준수, 독자 기여 부분의 명확화 등을 통해 법적 리스크를 최소화해야 합니다. 동시에 학계, 업계, 정부가 함께 ‘독자 AI’의 합리적인 기준을 정립하기 위한 논의를 시작해야 할 때입니다.