논란의 배경


네이버클라우드가 참여한 정부 ‘독자 AI 파운데이션 모델’ 1차 발표회(2025년 12월 30일, 코엑스)에서 네이버클라우드 부스를 체험하는 참가자들 . 여러 정예팀이 AI 모델 성과를 공개한 이 행사에서 하이퍼클로바X도 시연되었다. 불과 며칠 뒤 하이퍼클로바X 모델의 일부가 중국 오픈소스와 유사하다는 의혹이 제기되면서 ‘프롬 스크래치’ 논란이 촉발되었다 .
정부는 국내 기술로 독자 AI 파운데이션 모델을 개발하는 프로젝트를 추진하면서, “프롬 스크래치(from scratch)” 개발 방식을 중요한 평가 요소로 삼았다 . 프롬 스크래치란 기존의 모델이나 데이터를 활용하지 않고 처음부터 독자적으로 AI 모델을 개발하는 방식이다 . 이러한 배경에서, 해당 프로젝트의 핵심 팀 중 하나인 네이버클라우드는 자사의 차세대 대규모 AI 모델 하이퍼클로바X를 100% 자체 기술로 개발했다고 강조해왔다 .
그러나 2026년 1월 5일경 ICT 업계 일각에서 하이퍼클로바X SEED 32B 모델이 중국 알리바바가 공개한 오픈소스 큐웬(Qwen) 2.4 모델과 상당한 유사성을 보인다는 주장이 나왔다 . 구체적으로 하이퍼클로바X의 비전 인코더 등 일부 모듈의 가중치가 큐웬 2.4 모델과 코사인 유사도 및 피어슨 상관계수 측면에서 높은 일치도를 보였다는 것이다 . 코사인 유사도와 피어슨 상관계수는 데이터 분포와 방향의 유사성을 판단하는 지표로, 두 모델 간 이 지표들이 높다면 특정 구성 요소의 상당 부분을 공유하거나 차용했을 가능성을 시사한다 . 이는 하이퍼클로바X가 해당 중국 오픈소스 모델의 비전 인코더 가중치를 일부 활용한 것 아니냐는 의혹으로 이어졌다.
논란이 확산되자, 네이버클라우드 측은 실제로 이번 하이퍼클로바X 모델에서 외부 오픈소스 인코더를 도입했음을 인정했다 . 즉, 중국산 오픈소스 모델의 일부를 전략적으로 활용했다는 점을 시인한 것이다 . 다만 네이버는 이러한 선택이 근본적인 기술 역량 부족이나 개발 편의 목적이 아니며, 전체 모델 완성도를 높이기 위한 불가피한 조치였다고 설명했다. 이 admission은 정부가 기대한 ‘프롬 스크래치’ 개발 원칙과 현실적인 엔지니어링 판단 사이의 괴리를 드러내며 업계에 적지 않은 파장을 일으켰다.
네이버클라우드의 해명
네이버클라우드는 제기된 논란에 대해 상세한 입장과 해명을 내놓았다. 핵심 요지는 하이퍼클로바X의 본질적인 핵심 모델은 처음부터 전적으로 자사 기술로 개발되었으며, 일부 모듈을 외부에서 들여온 것은 전체 시스템의 효율성과 안정성을 위한 전략적 선택이었다는 것이다 . 다음은 네이버 측 해명의 주요 내용이다:
• 핵심 엔진은 100% 자체 개발: 네이버는 파운데이션 모델의 본질은 입력 정보를 해석하고 추론해 결과를 만들어내는 핵심 추론 엔진, 즉 모델의 “두뇌”에 있다고 강조했다 . 이 핵심 엔진 부분을 인간으로 치면 두뇌에 해당하는 영역으로 보고, 해당 두뇌에 해당하는 모델은 처음부터 100% 자체 기술로 개발해왔다고 밝혔다 . 이를 통해 한국어와 한국 사회의 복잡한 맥락을 가장 깊이 이해하는 독자적인 경쟁력을 확보해 왔다는 설명이다 .
• 비전·오디오 인코더는 ‘시신경’ 역할: 논란이 된 비전 및 오디오 인코더 등에 대해서는, 이는 두뇌인 핵심 모델에 시각·청각 신호를 전달하는 시신경과 같은 역할을 하는 모듈일 뿐이라고 해명했다 . 다시 말해, 이러한 인코더는 모델의 정체성을 결정짓는 두뇌와는 구분되는 입력 처리 부품이라는 입장이다. 네이버는 자사가 VUClip 등 독자적인 비전 기술력도 이미 충분히 보유하고 있으나, 특정 상황에서 외부 모듈을 활용하는 것은 전체 시스템 효율을 위한 선택일 뿐이라고 밝혔다 .
• 검증된 외부 모듈 전략적 채택: 네이버클라우드는 이번 멀티모달 AI 모델에서 글로벌 기술 생태계와의 호환성과 전체 시스템의 효율적 최적화를 고려해, 검증된 외부 인코더를 전략적으로 채택했다고 밝혔다 . 이는 기술적 자립도가 부족해서가 아니라 이미 표준화된 고성능 모듈을 활용함으로써 모델의 완성도와 안정성을 높이기 위한 엔지니어링 판단이었다는 설명도 덧붙였다 . 다시 말해, 모든 부품을 직접 개발하기보다는 검증된 부품을 끼워 넣어 전체 성능을 극대화하는 전략이었다는 것이다.
• 업계의 일반적 관행 강조: 네이버 측은 이러한 모듈 활용이 AI 업계에서 흔한 일이며, 자사만의 사례가 아님을 강조했다. 실제 글로벌 AI 업계에서도 알리바바의 큐웬-오디오(Qwen-Audio)는 오픈AI의 음성인식 기술을 기반으로, 큐웬-옴니(Qwen-Omni)는 구글의 이미지 인식 기술을 기반으로 구축되는 등 유사한 사례가 많다는 점을 지적했다 . 즉, 멀티모달 AI의 본질적 과제는 각 부품을 모두 새로 만드는가 여부보다, 텍스트·음성·이미지를 하나의 유기적 구조로 통합해 동시에 이해하고 생성하게 하는 통합 아키텍처를 설계하는 데 있다는 점을 강조했다 . 네이버는 자사의 핵심 기여 역시 이러한 통합 구조 설계에 있다고 역설했다.
• 투명성 및 라이선스 공개: 외부 기술 활용에 따른 투명성 이슈에 대해서도 해명이 있었다. 네이버클라우드는 해당 모듈 활용 여부와 라이선스 정보를 그동안 허깅페이스(Hugging Face) 페이지와 테크리포트 등을 통해 투명하게 공개해왔으며, 모델 성능이나 기술 기여도를 과장할 의도는 전혀 없었다고 밝혔다 . 앞으로도 기술 개발 전 과정에서 투명성을 유지하겠다는 입장도 함께 전했다 .
위와 같은 해명을 통해 네이버는 하이퍼클로바X 모델의 핵심 역량은 자사가 온전히 개발했고, 외부 기술 도입은 성능 향상을 위한 표준적인 공학적 선택임을 강조했다. 요약하면 “핵심은 우리가 만들었고, 부품은 효율을 위해 빌렸다”는 것이다.
시사점: 중국 기술 활용의 함의
한편, 이번 사태는 국내 AI 산업과 기술 자립성에 대해 여러 가지 시사점을 남긴다. 먼저, ‘프롬 스크래치’ 원칙의 현실적 어려움이 다시 한 번 부각되었다. 앞서 같은 정부 사업에 참여한 업스테이지(Upstage)의 AI 모델 역시 일부 가중치 유사성 논란이 제기된 바 있으며, 이후 공개 검증과 설명 과정을 거쳐 논쟁이 일단락된 사례가 있었다 . 이처럼 거대 AI 모델을 완전히 자력으로 개발한다는 이상론과, 오픈소스 자원을 활용해 빠르게 성과를 내는 현실론 사이에서 균형을 찾는 문제가 대두되고 있다.
또한 이번 논란은 중국 AI 기술의 약진을 상징적으로 보여주는 사례로 해석될 수 있다. 실제로 중국은 인공지능 분야에서 미국과 함께 세계 1~2위를 다툴 정도로 단기간에 비약적 발전을 이뤘다 . 최상위급 AI 연구자 중 절반가량이 중국 출신이라는 통계가 나올 만큼, 중국의 인재와 연구 역량은 세계 최고 수준에 올라있다 . 이러한 중국의 부상으로, 이제는 중국발 AI 오픈소스 모델이 글로벌 벤치마크가 될 정도의 기술력과 신뢰성을 갖추게 되었다. 그 결과 한국을 대표하는 기업조차 해당 기술을 참조하거나 활용해야 하는 현실이 펼쳐진 것이다. 일각에서는 이를 두고 기술 패권의 역전이 서서히 현실화하는 징후로 보기도 한다. 나아가 한국이 근대 이전 조선 시대에 중국 문물을 모방하던 시절로 회귀하는 것 아니냐는 자조적인 목소리까지 일부에서 흘러나온다. 그만큼 이번 사건은 한국 AI 산업에 있어 심리적 충격과 위기감을 불러일으켰다고 볼 수 있다.
그러나 다른 한편으로는, 글로벌 오픈소스 활용은 현대 AI 혁신의 자연스러운 일부라는 시각도 존재한다. 거대 모델 시대에는 전 세계 연구자들이 공유하는 기술을 적절히 받아들이고 융합하는 것이 경쟁력의 핵심이라는 것이다. 중요한 것은 남이 만든 부품을 쓰느냐의 여부보다, 그러한 부품들을 얼마나 창의적이고 효과적으로 통합하여 새로운 가치를 만들어내느냐라는 지적이다. 네이버 역시 “모든 요소를 직접 만들었는가라는 프레임을 넘어, 어떻게 창의적으로 통합해 사용자에게 최고의 가치를 줄 것인가에 집중할 계획”이라고 밝힌 바 있다 . 결국 자존심과 실용주의 사이에서, 국내 AI 업계가 어떤 균형점을 찾아나갈지가 향후 과제로 남아 있다. 이번 하이퍼클로바X 논란은 그 논의의 출발점이자, 한국 AI 생태계의 성장통을 보여주는 한 사례로 기억될 것이다.
참고 자료: 하이퍼클로바X 프롬 스크래치 논란 관련 보도 및 해명 자료      등.
'IT & Tech 정보' 카테고리의 다른 글
| [닐의 통찰] 국산 AI모델의 프롬스크래치 논란과 시사점 (0) | 2026.01.06 |
|---|---|
| Korean ‘Sovereign AI’ Project and the “From Scratch” Controversy (0) | 2026.01.05 |
| Controversy Over Upstage’s Solar Open 100B and Chinese GLM-4.5 AI Model (0) | 2026.01.05 |
| 중국제조 2025 주요 산업 한중 경쟁력 비교 및 한국의 대응 전략 (0) | 2026.01.02 |
| China’s Rapid Rise in Advanced Industries – A Comprehensive Analysis (0) | 2026.01.02 |