음성인식 전문가 "바이든 안들린다…MBC, 엉터리 자막 변조"

지난 22일 MBC 뉴스데스크에서 윤석열 대통령의 뉴욕 발언을 다룬 화면. 사진 MBC 유튜브 캡처

지난 22일 MBC 뉴스데스크에서 윤석열 대통령의 뉴욕 발언을 다룬 화면. 사진 MBC 유튜브 캡처

윤석열 대통령의 순방 과정에서 불거진 비속어 논란에 대해 성원용 서울대학교 전기·정보공학부 명예교수는 “문제의 핵심은 데이터 변조”라고 분석했다.  

성 명예교수는 지난 28일 자신의 페이스북을 통해 “엉터리 자막은 음성 편집 변조와 비슷한 역할”이라며 이같이 밝혔다.

그는 “왜 어떤 사람에게는 ‘바이든’이라고 들리는데, 다른 사람에게는 그렇지 않게 들릴까. 나의 경우, 그 소리를 직접 여러 번 들었는데, 절대 저렇게 들리지 않는다”며 “당연 ‘바이든’이라고 듣는 사람들의 귀가 더 예민하다 믿을 근거는 없다”고 설명했다.

이어 “나는 오랫동안 음성인식을 연구했는데, 음성인식은 단지 귀에 들리는 소리에만 의존하지 않는다”며 “왜냐하면 사람들의 발음이 너무 엉터리이기 때문”이라고 부연했다.  

성 명예교수는 “윤 대통령의 뉴욕 발언은 매우 잡음이 많고 불분명한데, 여기에 MBC는 자의적으로 자막을 달아서 송출했다”며 “당연 대부분의 사람들은 이 자막대로 듣는다. ‘소리’를 따라 듣지 않고, ‘자막’을 따라 듣는다. 자막은 매우 선명한 사전정보 역할을 하기 때문”이라고 지적했다. 이어 “자막이 있는 외국어 방송은 잘 들리는데 이 또한 마찬가지 이유”라며 “‘바이든’이라고 들린다는 사람이 많은데, 이미 자막을 보았기 때문”이라고 했다.  


그는 “대통령의 발언을 자동음성인식기에 넣어봤는데 내가 시험한 어떤 음성인식기에서도 ‘바이든’이라는 단어를 찾을 수 없었다”며 “가장 정확한 네이버 클로버 음성인식기에서 나온 답은 ‘신인 안 해주고 만들면 쪽팔려서’다”라고 했다.  

성 명예교수는 “연구자 윤리에서도 데이터 변조는 최악의 위반으로 간주한다”며 “물론 대통령이 사용한 일부 단어는 좀 거칠다 생각할 수도 있지만, 엉터리 자막 편집과 비교할 사항이 아니다”라고 짚었다.  

그러면서 “무엇보다도 야당이나 일부 언론도 이 사항을 가지고 MBC를 옹호할 일이 아니다”라며 “데이터변조가 언론의 자유와 혼동이 된다면 정직과 투명, 논리적 설득이 아니라 거짓말과 술수, 선동이 난무하는 세상이 될 것”이라고 했다.

성원용 서울대학교 전기·정보공학부 명예교수가 지난 28일 자신의 페이스북에 쓴 글. 사진 페이스북 캡처

성원용 서울대학교 전기·정보공학부 명예교수가 지난 28일 자신의 페이스북에 쓴 글. 사진 페이스북 캡처

성 명예교수는 오랜 기간 음성인식 분야를 연구해오며 단어길이 최적화와 음성인식에 몰두해왔다. 2018년 ‘구글 AI 집중연구 어워즈’에서 ‘다중시간단계 병렬화를 이용한 저전력 디바이스에서의 음성인식’ 연구로 상을 수상한 바 있다.