하지만 덩치가 커지고 영향력도 커지면서 몇 가지 문제점도 나타나고 있습니다. 대표적인 문제점은 수백만 개가 넘는 항목을 수작업으로 교정하고 최신 내용으로 업데이트하는 일이 어려워지고 있다는 것입니다.
사람들이 많은 관심을 가진 주제나 기여자가 적극적으로 참여하는 경우 업데이트나 교정이 원활하게 진행되지만, 만약 그렇지 않을 경우 오래되거나 잘못된 내용이 수정되지 않은 채로 몇 년간 방치될 수 있습니다.
여기에 최근에는 아무 이유 없이 위키피디아의 내용을 훼손하거나 거짓 정보를 올리는 사이버 반달리즘 (cyber vandalism)이 목격되기도 합니다. 아예 처음부터 특정 이념이나 주장을 전파하기 위해 의도적으로 위키피디아에 편향된 정보를 올리는 경우도 있습니다. 위키피디아의 내용이 많아지고 글을 쓰는 사람도 많아지면서 결국 통제에서 벗어날 위험이 있는 것입니다.
MIT의 컴퓨터 과학 및 인공지능 연구소 (CSAIL)의 다쉬 샤 (Darsh Shah)를 비롯한 연구팀은 최근 열린 AAAI (Advancement of Artificial Intelligence) 콘퍼런스에서 위키피디아의 문서 내용을 사람의 도움 없이 수정하는 자동 텍스트 생성 시스템 알고리즘을 개발했습니다.
이미 문장을 다른 언어로 번역하거나 문법을 교정하는 인공지능 시스템은 널리 사용되고 있습니다. 연구팀은 여기서 한 걸음 더 나아가 가독성을 높이면서 잘못된 내용도 업데이트 하는 인공지능에 도전했습니다.
이 인공지능은 “펀드 A는 그룹에서 중요한 작용을 하는 회사의 42명의 소액 주주 가운데 28명이 중요하다고 판단했다”는 문장을“펀드 A는 43명의 소액 주주 가운데 23명이 중요하다고 판단했다”라고 수정할 수 있습니다.
오타나 문법 오류만 바로잡는 게 아니라 문장을 간결하게 바꿔 가독성을 높이고 검색을 통해 잘못된 숫자가 있으면 스스로 바로잡습니다. 과거에는 사람이 전부 수작업으로 수치를 검증하고 문장과 단어를 하나씩 바꿔야 했지만, 앞으로는 인공지능이 교정한 내용을 검토하고 승인하는 방식으로 바뀔 수 있습니다.
물론 이 기술은 위키피디아만이 아니라 다양한 글쓰기에 적용될 수 있습니다. 귀찮은 교정 작업은 기계에 맡기고 사람은 본래 쓰고자 하는 내용에 집중할 수 있습니다.
연구팀의 궁극적인 목적은 사실 관계를 체크해 가짜 뉴스나 잘못된 것으로 판명된 내용을 걸러내는 것입니다. 물론 이 과정은 사람이나 인공지능 모두에게 어려운 일입니다.
연구팀은 우선 문장의 내용을 알고리즘이 미리 학습한 사실과 맞춰서 동의/반대/중립 세 가지 형태로 분류했습니다. 동의는 물론 확인된 사실과 부합되는 내용이고 부정은 부합되지 않는 내용입니다. 그리고 판단 근거가 부족할 경우 중립으로 분류하도록 알고리즘을 구성했습니다.
하지만 연구팀이 개발한 시스템 역시 완전히 편향(bias)이 없다고 말할 순 없습니다. 인공지능은 학습한 데이터에 편향이 있어도 이를 그대로 기준으로 받아들여 분류하기 때문입니다.
따라서 이 인공지능은 아직 사람 대신 위키피디아의 모든 문서를 수정할 순 없습니다. 하지만 인간을 도와 집단지성의 한계를 극복하는 데 도움을 줄 수 있습니다. 팩트 체크 및 문법, 업데이트 체크를 도와주는 인공지능이 있다면 사람의 작업이 한결 수월해질 것입니다.
인공지능의 발전은 과학기술이 이룬 뛰어난 업적 중 하나이지만, 다른 한편으로는 인간의 일자리를 뺏고 과거 인간의 고유한 영역으로 여겨지던 분야까지 기계가 대신할지 모른다는 우려를 낳고 있습니다.
하지만 이렇게 인간을 돕는 똑똑한 비서가 될 수도 있습니다. 앞으로 글쓰기에서 인공지능의 역할이 점점 더 커질지도 모릅니다.
고든 정 칼럼니스트 jjy0501@naver.com
Copyright ⓒ 서울신문 All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지