‘딥시크’ 고래 등장에 요동치는 글로벌 AI 패권전쟁 [팩플]

기자: 홍상지 기자

중국의 인공지능(AI) 스타트업 딥시크(DeepSeek)가 개발한 저비용 AI 모델 ‘R1’의 등장으로 글로벌 AI 생태계가 요동치고 있다. 돈을 많이 투자할 수록 성능이 확연히 개선되는 AI 분야 ‘게임의 법칙’ 근간을 흔드는 결과여서다. ‘가성비 AI’ 모델의 전면 등장에 국가·기업 간 AI 기술 경쟁 속도는 더 가속화 할 전망이다.

중국 AI 스타트업 딥시크의 초기 화면. 딥시크 캡처

무슨 일이야

30일 딥시크가 공개한 기술분석 보고서 등에 따르면 R1은 오픈AI의 GPT-o1(오원) 등 기존 미국기업 AI 모델과 비교해 언어·수학·코딩 능력 등 각종 벤치마크 테스트에서 유사하거나 더 능가하는 성능을 지닌 것으로 나타났다. 선별된 500개 수학 문제로 성능을 평가하는 벤치마크 ‘MATH-500’에선 오원이 96.4%, R1이 97.3%의 정확도를 보였다. 코딩 능력을 보여주는 벤치마크 'LiveCodeBench'의 경우에도 R1이 65.9%로 오원(63.4%)보다 앞섰다.

성능은 유사한데 개발 비용은 훨씬 저렴했다. R1 개발에 사용된 칩은 엔비디아가 고사양 GPU(그래픽처리장치)인 H100보다 사양을 낮춰 중국 수출용으로 만든 H800이다. 경쟁사들이 AI 모델 훈련에 GPU 약 1만6000개를 사용하는 데 반해, 딥시크 엔지니어들은 2000개 정도 칩만으로 AI 모델을 훈련시켰다고 주장했다. 딥시크 측은 AI 모델이 스스로 정답을 찾아가는 ‘그룹 상대 정책 최적화’(GRPO) 학습 방식과 특정 작업시 문제 해결에 필요한 부분만 AI를 활성화 하는 ‘전문가 혼합’(Moe) 기법 등 효율성을 극대화 하는 방식들을 택해 비용을 줄였다고 설명한다. 이런 방식으로 사전 연구와 실험을 제외하고 모델 훈련에 투입한 비용이 557만6000달러(약 80억원)에 불과하다. 딥시크의 주장이 맞다면 오픈 AI GPT4 개발 추정 비용의 18분의1, 메타의 라마 3 개발 비용의 10분의 1정도 수준으로 업계는 보고 있다.

미국 빅테크들은 빠르게 견제에 나섰다. 29일 블룸버그와 월스트리트저널(WSJ) 등은 딥시크가 허가 없이 무단으로 오픈AI의 데이터를 활용했는지 여부를 오픈AI와 마이크로소프트(MS)가 조사하고 있다고 보도했다. 오픈AI는 중국 기반 기관들이 자사 AI 도구에서 대량의 데이터를 빼내는 ‘증류’(distillation) 과정을 거쳐 모델을 훈련시켰다는 의혹을 제기했다. 증류는 규모가 큰 AI 모델 능력치를 작은 모델에 압축해 넣는 개발 방식이다. 도널드 트럼프 미 행정부에서 AI·가상화폐 정책 총괄로 임명된 데이비드 색스도 이같은 주장에 “상당한 증거가 있다”고 밝혔다.

가성비 AI 믿을 수 있나?

중국이 날린 ‘가성비 AI’ 카운터펀치로 글로벌 AI 개발 패권경쟁은 더 속도를 낼 전망이다. 샘 올트먼 오픈AI CEO는 28일 자신의 엑스(X·옛 트위터) 계정을 통해 “(R1 모델은) 특히 제작 비용을 고려한다면 인상적이고, 새로운 경쟁자가 나타나 아주 고무적”이라면서도 “우리가 훨씬 뛰어난 모델을 내놓을 것”이라고 언급했다. 이어 “전 세계가 AI를 더 많이 사용하게 될 것이고, 앞으로 등장할 차세대 모델에 놀라게 될 것”이라고 덧붙였다. 이미 트럼프 대통령은 취임 직후 오픈AI, 오라클, 소프트뱅크 등이 참여하는 스타게이트를 통해 5000억 달러 투자를 발표한 바 있다.

샘 올트먼이 28일(현지시간) 자신의 SNS에 올린 글. X 캡처

R1 모델이 오픈소스(개방형)로 글로벌 시장에 풀린 만큼 자체 기반 모델이 없는 AI 스타트업엔 더 많은 기회가 될 것이라는 전망도 나온다. 저렴한 비용으로 자체 모델을 개발할 가능성이 높아진데다, 오픈소스를 활용한 저렴한 AI서비스를 내놓을 수 있어서다. 한종목 미래에셋증권 선임연구원은 “대형 모델을 훈련할 수 있는 자원이 없는 연구자나 기업도 오픈소스 모델을 통해 고성능 AI의 혜택을 누릴 수 있을 것”이라며 “이는 한국에도 적용될 부분”이라고 짚었다.

다만 업계 일각에선 딥시크의 기술력이 과대포장 됐다는 문제를 제기한다. 딥시크가 내세우고 있는 벤치마크 기준이나 테스트 환경이 편향되지 않았는지 살펴보고, 실제 활용 사례와 안정성 등을 더 검증해야 한다는 것이다. 강점인 ‘가성비’ 역시 부풀려졌을 수 있다. 국내 IT 업계 한 관계자는 “딥시크가 공개한 ‘저비용’은 1회 학습비용으로 운영 비용 등 누적 투자 비용까지 고려한다면 아주 저렴한 비용이라고 볼 수 만은 없다”고 말했다. 딥시크가 저사양 AI칩인 H800으로 AI를 개발했다는 점에 대해서도 의혹이 나온다. AI 데이터 기업인 스케일AI의 알렉산더 왕 CEO는 최근 CNBC와의 인터뷰에서 “딥시크가 약 5만 개의 H100을 갖고 있지만, 미국의 수출 규제 때문에 그렇게 말하지 못한다”고 주장했다.

개인정보 등 보안 우려도

현재 딥시크는 미국 뿐만 아니라 국내 앱스토어에서도 무료앱 다운로드 순위 1위를 기록하고 있다. 하지만 R1의 광범위한 개인정보 수집을 우려하는 목소리도 나온다. 하정우 네이버클라우드 AI이노베이션 센터장은 자신의 소셜미디어를 통해 “딥시크 정책 약관을 보니 사용장비 정보는 물론 키보드 입력 패턴이나 리듬, IP 정보, 장치 ID 등은 기본에 쿠키까지 싸그리 수집하는 것으로 나온다”며 “수집한 사용자 정보는 중국 내 보안 서버에 저장된다”고 설명했다. CNBC에 따르면 미국 해군도 딥시크의 AI 챗봇 모델을 사용하지 말도록 내부 지침을 내렸다. 미 해군은 지난 24일 내부 구성원들에게 보낸 이메일을 통해 “딥시크의 AI를 어떤 형태로든 사용하지 말라”며 “모델의 출처, 사용과 관련된 보안·윤리적 우려 때문”이라고 밝혔다.

홍상지 기자 hongsam@joongang.co.kr