전 세계 남녀노소가 가볍게 즐기는 컴퓨터 게임을 통해 첨단 인공지능 로봇을 훈련시킨 연구가 공개돼 관심을 모으고 있다.
최근 미국 브라운대학 컴퓨터공학과 연구팀은 세계적 인기를 끌고 있는 유명 게임 ‘마인크래프트’를 통해 인공지능 로봇을 훈련시키는 실험을 공개했다.
이 실험의 목표는 인공지능이 스스로 효율적 문제해결 계획을 세울 수 있도록 하는 것. 로봇에게 이 과정이 쉽지 않은 이유는 인간과 달리 불필요한 행동을 직관적으로 걸러내고 무시하는 방법을 알지 못하기 때문이다.
예를 들어 사람들은 ‘쓰레기통을 비운다’는 목표를 달성하는데 있어 오븐을 켜거나 냉장고를 여는 등의 행동은 불필요하다는 사실을 자동적으로 파악, 생략할 수 있다.
그러나 인공지능은 이러한 직관력이 없기에 선택 가능한 모든 행동의 필요성을 하나하나 따져보아야 한다. 즉, ‘오븐 켜기’나 ‘냉장고 열기’ 등의 행동이 ‘쓰레기통 비우기’에 필요한 행위인지 여부를 매번 검토해야만 한다는 것이다
다양한 기능을 수행하는 로봇일수록 이 문제는 심각해진다. 선택할 수 있는 행동의 종류가 너무 많아 인공지능이 ‘혼란’에 빠지기 때문이다. 이에 연구팀은 새로운 알고리즘을 개발, 로봇이 시행착오를 거쳐 문제 해결에 가장 필요한 ‘선결과제’가 무엇인지 직접 파악할 수 있게 만들었다.
연구팀은 이 알고리즘의 성능을 확인하기에 컴퓨터게임 ‘마인크래프트’가 가장 적합한 수단이라고 판단했다. 마인크래프트는 개방된 삼차원 공간에 퍼져있는 정육면체 블록들을 부숴 자원을 모으고 이 자원을 사용해 원하는 건축물을 세우는 게임이다. 특별히 정해진 목표가 없이 플레이어가 원하는 바를 자유롭게 추구하는 이른바 ‘샌드박스’ 장르의 게임이기도 하다.
텔렉스는 “이 게임에서는 플레이어가 취할 수 있는 행동의 종류가 방대하며, 훈련 데이터를 수집하기도 매우 용이하다. 같은 일을 현실 세계에서 시도하려면 훨씬 많은 노력과 비용이 든다”며 마인크래프트를 선택한 이유를 꼽았다.
연구팀은 먼저 로봇으로 하여금 게임 내에서 다리를 건설하거나 금광을 캐는 등 특정 목표를 추구하도록 지시했다. 이를 통해 로봇은 해당 목표를 수행하는데 꼭 필요한 선결과제가 무엇인지를 학습했다.
다음에 연구팀은 학습을 끝낸 로봇과 그렇지 않은 로봇에게 동일한 과제를 주고 능률을 비교했다. 그 결과 학습을 거친 로봇의 문제해결 효율이 월등히 뛰어나다는 점이 드러났다.
텔렉스는 “만일 인공지능이 마인크래프트 내의 모든 활동을 수행할 수 있다면, 현실에서도 거의 모든 문제를 해결 할 수 있으리라고 본다”며 “이와 관련해서 앞으로 흥미로운 연구를 많이 진행할 예정”이라고 밝혔다.
사진=ⓒ브라운대학/유튜브
방승언 기자 earny@seoul.co.kr