구글이 첫 추론 전용 인공지능(AI) 칩을 내놨다. 인간을 대신해 복잡하고 다양한 업무를 수행하는 AI 에이전트(비서)가 AI 시장 핵심으로 떠오른 만큼 이를 뒷받침하기 위한 칩이 필요하다는 판단에서다.
9일(현지시간) 미국 라스베이거스에서 열린 구글 클라우드의 연례 행사 '넥스트'에서 구글 CEO인 순다르 피차이가 구글의 추론 전용 AI 칩 아이언우드를 소개하고 있다. 유튜브 캡처
구글 클라우드는 9일(현지시간) 미국 라스베이거스 만달레이 베이 호텔에서 열린 연례 기술 콘퍼런스 ‘넥스트 2025’(Next 2025)에서 추론 기능에 초점을 맞춘 텐서처리장치(TPU) ‘아이언우드’(Ironwood)를 공개했다. 구글이 내놓은 첫 추론 전용 AI 칩이다.
이날 키노트(기조연설)는 전날에 이어 순다르 피차이 구글 최고경영자(CEO)가 또 한 번 깜짝 등장했다. 피차이 CEO는 지난해 구글 클라우드 넥스트 행사에는 직접 참여하지 않았고, 이틀 연속 행사 공식 석상에 나와 발언하는 일도 드물었다. 피차이 CEO는 키노트에서 7세대 TPU 모델인 아이언우드에 대한 자신감을 드러냈다. 그는 “아이언우드는 구글이 만든 최초의 TPU 대비 3600배 우수한 성능을 달성했다. 우리가 만든 것 중 가장 강력한 칩으로 AI 모델의 다음 개척지를 가능하게 할 것”이라고 밝혔다.
현재 AI 시장은 전통적인 사전 학습 중심 모델에서 추론 모델로 무게 중심축이 옮겨가고 있다. 기존 AI 모델이 방대한 데이터에서 패턴을 학습해 확률에 기반한 답변을 생성해 냈다면, 추론 모델은 문제 해결 과정을 단계별로 보여주고 마치 사람의 사고를 따라가듯 답변을 제공한다. 여러 단계를 미리 생각하고 사용자를 대신해 복잡한 작업을 수행해야 하는 AI 에이전트에 필요한 핵심 기술이다. 이를 부하 없이 구동하려면 탄탄한 컴퓨팅 파워가 받쳐줘야 한다. 구글 클라우드는 이 같은 시장 상황을 반영해 새로운 칩을 내놨다.
구글이 9일(현지시간) 미국 라스베이거스에서 열린 연례 행사 넥스트에서 공개한 추론 전용 AI칩 아이언우드. 사진 구글
아이언우드는 지난해 공개된 이전 세대 TPU인 ‘트릴리움’ 대비 연산 능력을 10배 이상 끌어올렸다. ‘AI 칩이 빠르게 접근할 수 있는 메모리 양’을 의미하는 고대역폭 메모리(HBM) 용량은 트릴리움보다 6배 증가했다. 그만큼 처리 속도가 빨라져 복잡한 추론 업무 등에 잘 맞는다. 전력 효율성도 전 모델과 비교했을 때 2배 높다고 구글 측은 설명했다.
지난달 구글이 출시한 추론 AI 모델 제미나이 2.5의 경량화 버전인 제미나이 2.5 플래시도 이날 함께 공개됐다. 간단한 질문에는 빠르게 답하고, 복잡한 질문에는 더 깊이 생각해 답변을 내놓는 ‘동적 추론 능력’을 갖췄다. AI가 알아서 생각하는 시간을 조절할 수 있고, 사용자가 직접 추론 강도를 조정할 수 있는 기능도 제공된다. 제미나이 2.5 플래시는 구글 클라우드의 AI 앱 개발 플랫폼 ‘버텍스 AI’(Vertex AI)를 통해 현재 프리뷰로 제공되고 있다.
추론 AI에 이어 이를 뒷받침할 AI 칩 기술 경쟁도 한층 더 치열해질 전망이다. AI 기술이 전성기를 맞은 이후 줄곧 AI 반도체 시장에서 우위를 점해온 젠슨 황 엔비디아 CEO도 지난달 연례 개발자 회의에서 “추론 모델 등장으로 이전보다 100배 많은 컴퓨팅 파워가 필요하다. 사고능력을 갖춘 AI에이전트가 많이 사용될수록 AI 추론 수요는 늘어날 것”이라고 언급했다.
라스베이거스(미국)=홍상지 기자 hongsam@joongang.co.kr