기상천외 중국

“구글 번역기도 정치색?”...‘친애하는 러시아인’ 넣자 ‘죽은 러시아인’

폰트 확대 폰트 축소 프린트하기
구글 번역기가 러시아에 대한 적대감 표출로 고의적인 오번역을 반복하고 있다는 주장이 제기됐다. 

중국 기관지 관찰자망은 러시아 국영통신사 리아노보스티의 보도를 인용해 ‘구글 번역기에 영문으로 친애하는 러시아인(dear russians)이라는 문자를 입력하면 번역기가 이와 정반대의 내용인 죽은 러시아인(dead russians)으로 오번역한 것과 관련해 러시아 누리꾼들의 항의가 잇따랐다’고 15일 보도했다.  

러시아 당국은 구글에 이번 오번역 사태에 대한 책임을 묻는 등 공식적인 항의문을 전달한 것으로 알려졌다. 

이와 관련해, 러시아 매체 리아노보스티는 ‘러시아인이라는 문자 대신 미국인이라고 단어를 변경해 입력하면 이 같은 오번역은 발생하지 않는다’는 점에 집중했다. 

러시아 통신규제당국 정보기술미디어감독국은 구글 이번 오번역 사태는 러시아어 사용자에 대한 명백한 인권 침해라고 주장, 구글의 극작적인 번역 오류 시정을 요구했다고 밝혔다. 

문제는 구글의 이 같은 오번역 사례가 이번이 처음이 아니라는데 중국과 러시아 매체들은 집중하는 분위기다. 일부 양국 누리꾼들은 미국을 대표하는 글로벌 포털사이트가 고의로 중-러 양국에 비판적인 내용의 오번역 사례를 방조, 방치하고 있다는 비난도 제기했다. 

실제로 중국 관영매체 글로벌타임스에 따르면, 지난해 11월 구글의 영어 번역 시스템에 중국어로 ‘에이즈 바이러스’라는 특정 단어를 입력하자 ‘우한 사람’이라고 엉뚱한 번역을 내놔 중국 누리꾼들로부터 강한 반발을 산 바 있다. 

우한은 중국 화동지역인 후베이성의 성도다. 중국 내 첫 코로나19 발병자가 발견되면서 국제 사회로부터 코로나19 발병지라는 오명을 얻는 등 논란이 계속되고 있는 지역이다.  

구글 번역기 오류에 대한 문제가 중국에서 처음 불거졌던 지난해 11월 당시, 구글 러시아 번역기에 ‘에이즈 감염자’라는 단어를 입력한 경우에도 ‘우한 사람’이라는 결과가 도출된 것으로 알려져 논란은 한동안 계속됐다. 

당시 중국의 한 누리꾼은 구글이 번역기 오번역을 남용해 중국인에게 모욕감을 줬다는 내용을 공개하며 “구글 번역에 그 외의 ‘신문’, ‘전파’ 등 다수의 단어를 입력할 시에는 동일한 단어로 번역 결과가 도출된다”면서 “때문에 특정 단어에 대해서만 오답을 내놓는 악의적인 번역 오류 사례”라고 주장했다. 

번역 오류의 정확한 원인은 아직까지 밝혀지지 않았지만, 중국 누리꾼들 사이에서 큰 공분을 일으켰다. 

한 누리꾼은 “내 눈을 믿을 수 없다”면서 “세계적인 글로벌 기업이 특정 단어에만 유독 불쾌한 번역 오류를 도출하는 것은 악의적인 번역이라고 해석할 수밖에 다른 도리가 없다. 도가 지나친 번역 오류 사례다”고 지적했다. 

또, 일부 누리꾼들은 최근 불거진 중미 외교 갈등과 연계해 “미국이 이런 유치한 방식으로 모든 면에서 중국을 비방하고 있다”면서 “전 세계 사람들에게 중국에 대한 안 좋은 이미지를 세뇌하기 위해 비열하고 유치한 행각을 획책하고 있는 것”이라고 했다. 

한편, 구글은 지난 2016년부터 웹과 모바일 ‘구글 번역’ 서비스에서 영어-중국어 번역 서비스를 제공하기 시작했다. 당시 구글 측은 영어-중국어 번역 서비스를 최초로 도입, 기타 언어 번역 서비스 대비 중국어 번역이 가장 어려운 일이며 중국어 사용자가 많다는 점을 고려했다고 밝힌 바 있다.

현지 언론을 통해 공개된 내용에 따르면, 현재 구글 번역은 이른바 ‘딥러닝’으로 불리는 기술을 활용해 오고 있다. 인간의 두뇌 신경망처럼 스스로 학습해 지식을 확장하고 문제를 해결하는 인공 신경망 기술을 적용해오고 있는 것.  

기계가 방대한 단어와 구절, 문장을 기억하고 연관성이 없는 것은 하나씩 없애는 방식으로 정확한 해석을 해나갈 수 있는 학습능력과 방대한 데이터를 빠르게 처리할 수 있는 구조인 셈이다. 

입력된 특정 단어에 대해 인공지능은 훈련에 사용된 방대한 자체적인 사전을 활용해 가장 적합한 단어를 찾아내는 방식이다.  



영어와 중국어 번역에는 약 수억 개의 문장을 활용해 가장 적합한 번역 결과를 도출하는 방식이다. 영어와 프랑스어 번역에는 무려 25억 개 이상의 문장이 활용된다. 

단, 이 외에도 번역 정확도를 높이기 위해 사용자들이 직접 번역을 제안할 수 있도록 조성해놓은 것으로 알려졌다.

임지연 베이징(중국) 통신원 cci2006@naver.com

̽ Ʈ īī丮 α