마윈의 앤트그룹 "中 반도체로 AI 훈련"… 비용도 저렴

중국 전자상거래 기업 알리바바의 창업자 마윈. 로이터=연합뉴스

중국 전자상거래 기업 알리바바의 창업자 마윈. 로이터=연합뉴스

중국의 세계 최대 핀테크 기업 앤트그룹이 미국 엔비디아 대신 중국산 반도체를 활용해 인공지능(AI) 모델을 훈련하는 기술을 개발했다고 블룸버그통신이 24일 익명의 소식통들을 인용해 보도했다.

앤트그룹이 자체 개발한 기술은 고가의 엔비디아 칩을 사용할 때보다 AI 모델 훈련 비용을 약 20% 절감할 수 있는 것으로 알려졌다.

마윈이 설립한 알리바바그룹의 계열사인 앤트그룹은 알리바바와 화웨이 등 중국 기업들이 만든 반도체를 활용해 '전문가 혼합(MoE·Mixture of Experts)' 방식으로 AI 모델을 훈련시켰다. 그 결과는 엔비디아의 H800 반도체를 사용한 것과 유사한 수준에 도달한 것으로 전해졌다.

고성능 하드웨어로 1조 개의 토큰을 훈련하는 데 약 635만 위안(약 12억8000만원)이 들지만, 앤트그룹의 최적화 기술을 활용하면 저사양 장비로도 같은 과정을 510만 위안(약 10억3000만원) 정도로 수행할 수 있다는 것이다.

토큰은 AI 모델이 학습하고 사용자 요청에 적절한 답변을 제공하기 위해 활용하는 정보의 단위다.


소식통에 따르면 앤트그룹은 여전히 엔비디아 칩을 사용하고 있지만, 최신 모델에서는 AMD와 중국산 반도체 사용 비중을 늘리고 있다.

블룸버그는 이번 보도가 미국의 오픈AI나 구글보다 훨씬 적은 비용으로 AI 모델을 훈련시키는 데 성공한 중국 스타트업 딥시크에 이어 앤트그룹도 AI 경쟁에 본격 가세했음을 의미한다고 평가했다.

엔비디아의 H800은 최신형은 아니지만 강력한 성능을 가진 프로세서다. 현재 미국 정부가 중국 수출을 금지하고 있는 제품이다.

앤트그룹은 자사가 개발한 AI 모델이 특정 평가 항목에서 메타 플랫폼의 모델보다 뛰어난 성능을 보였다고 주장한 논문을 발표한 바 있다. 이 주장이 사실이라면 앤트그룹의 기술은 AI 서비스 제공과 추론 과정에서의 비용 절감 측면에서도 중국 AI 산업 발전에 중요한 전환점이 될 수 있다는 평가가 나온다.

지금까지 전문가 혼합 방식은 주로 고성능 GPU인 엔비디아 그래픽 처리장치에 의존해왔으나, 비용 문제로 소규모 기업들은 쉽게 접근하지 못해 널리 사용되진 않았다.

앤트그룹은 이러한 한계를 극복하고 고성능 GPU 없이도 대규모언어모델(LLM)을 효율적으로 훈련시키는 방법을 지속적으로 연구해 왔다. 목표는 비싼 장비 없이도 모델을 확장할 수 있는 AI 기술을 구축하는 것이다.