
서울대병원
기존 의료 LLM이 서구권 의료 지식에 최적화돼 한국어 기반 의료 데이터를 제대로 이해하지 못하는 한계를 극복하기 위해 서울대병원은 지난해 3월부터 자체 모델 개발에 착수했다.
병원 측은 입원 초진, 외래 기록, 수술·처방·간호 기록 등 병원 내 임상 텍스트 3800만 건을 바탕으로 '한국어 의료 말뭉치'를 구축한 뒤 이를 가명화 및 비식별화 처리했다. 이후에는 국내 의료 관련 법령, 국문 논문 초록, 학회 진료 지침 등을 통합하고 의학 약어 사전 및 용어 표준화 작업도 병행했다.
서울대병원은 개발한 LLM의 성능을 평가하기 위해 최근 3년간 시행된 한국의사국가시험(국시)을 기반으로 시험을 치렀다. 결과는 정답률 86.2%. 이는 실제 의사들의 평균 정답률인 79.9%를 넘어선 기록이다. 지금까지 공개된 의료 LLM 가운데 국내 국시 기준으로 의사 평균을 상회한 건 이번이 처음이다.
병원 측은 향후 해당 모델의 성능을 더욱 고도화해 진료 현장에서 직접 활용할 계획이다.
이번 개발을 주도한 이형철 교수(헬스케어AI연구원 부원장)는 "거대언어모델 기술은 의사들의 업무를 돕는 중요한 도구가 됨으로써 의료 서비스의 질을 한층 향상할 수 있을 것"이라고 말했다.