그래픽 처리 장치 전문 업체인 엔비디아가 새로운 RTX 2000 시리즈 제품군을 본격적으로 출시했습니다. 오랜 세월 사용한 GTX라는 명칭을 버리고 RTX라는 새로운 브랜드로 등장한 RTX 2080 Ti, RTX 2080, RTX 2070은 높은 가격으로 인해 다소 논란도 있지만, 엔비디아는 ‘그래픽을 다시 발명했다(Graphic reinvented)’고 언급하면서 대단한 자신감을 보여주고 있습니다.
사실 RTX 시리즈에서 처음 도입한 튜링(Turing) 아키텍처는 엔비디아에도 상당한 도전입니다. 튜링은 그래픽에서는 물론 인공지능에서도 2위가 따라오기 힘든 엔비디아식 초격차 전략을 위한 포석이지만 여러 가지 검증되지 않은 새로운 시도가 담겨있기 때문입니다. 엔비디아가 튜링에서 도입한 가장 중요한 두 가지 핵심 무기는 바로 레이 트레이싱(Ray Tracing)을 위한 RT 코어와 딥러닝을 위한 텐서 코어(Tensor Core)라고 할 수 있습니다.
가짜를 더 진짜처럼
3D 그래픽 카드는 2차원 평면인 모니터에 가상의 3차원 물체를 보여주는 장치입니다. 초창기 3D 그래픽 게임은 지금 기준으로 보면 어설프게 색칠한 상자들이 움직이는 정도에 불과했습니다. 하지만 지난 수십 년간 더 현실적인 가짜를 구현하기 위한 노력 덕분에 게임에 등장하는 사람과 물건들은 점점 실제와 비슷해졌습니다. 엔지니어들은 끊임없이 더 많은 폴리곤과 텍스처를 처리할 수 있는 그래픽 프로세서를 개발했고 이제는 제법 사실적인 사물을 모니터를 통해 보여줄 수 있게 됐습니다.
그러나 이런 꾸준한 노력에도 불구하고 우리의 뇌는 게임 속 3D 그래픽이 실제와 다르다는 사실을 인지합니다. 여러 가지 이유가 있지만, 가장 중요한 건 빛의 효과가 실제와 다르기 때문입니다. 햇빛 같은 광원이 다시 물체에 반사되어 나오는 빛의 미묘한 광원효과는 워낙 복잡해서 슈퍼컴퓨터의 힘으로도 실시간으로 계산해 표현하기 어렵습니다. 물론 그래도 엔지니어들은 가능한 방법을 개발했습니다. 가장 대표적인 방법이 바로 레이 트레이싱(Ray tracing) 기법입니다.
레이 트레이싱은 광원과 빛의 반사를 실제와 가깝게 표현하는 기술로 이미 영화나 동영상 제작에서 널리 쓰이고 있지만, 이를 계산하기 위해서는 많은 시간이 필요해 게임에 적용하기에는 무리가 있었습니다. 영화에서는 몇 시간 렌더링한 결과를 1분 동안 보여줘도 문제없지만, 게임에서는 실시간으로 처리해야 하기 때문입니다.
이 문제의 해결책은 레이 트레이싱을 고속으로 처리할 별도의 연산 장치를 개발하는 것입니다. 엔비디아가 튜링에 탑재한 RT 코어가 그것으로 과거 소프트웨어적으로 레이 트레이싱을 처리할 때와는 비교할 수 없을 만큼 빠른 속도로 레이 트레이싱 연산이 가능해졌습니다. 엔비디아는 스타워즈 기술 데모를 시연하면서 과거 4개의 GPU로 처리하던 레이 트레이싱을 튜링 GPU 한 개로 더 빨리 처리할 수 있다는 점을 보여줬습니다. 물론 그래도 우리의 눈을 완전히 속일 수는 없지만, 더 진짜 같은 가짜를 구현할 수 있게 된 것입니다.
두 마리 토끼를 노리는 텐서 코어
튜링에서 다른 큰 변화는 인공지능 연산 장치인 텐서 코어가 같이 포함되었다는 사실입니다. 텐서 코어의 연산 능력은 114TFLOPS (16FP)로 현존하는 가장 강력한 인공지능 프로세서 가운데 하나입니다. 최근 GPU는 인공지능 분야에 쓰임새가 점점 늘어나고 있기 때문에 이런 변화는 자연스럽지만, 새로 추가된 텐서 코어가 본래 목적인 게임에는 무용지물이라는 게 문제입니다. 엔비디아는 텐서 코어에 새로운 일감을 줬는데, 바로 이미지 품질을 향상시키는 것입니다. 딥러닝 기법으로 저해상도 사진이나 영상으로 바꾸는 연구가 진행 중인데, 튜링은 아예 실시간으로 3D 그래픽 영상 품질을 높입니다.
게임 속 3D 그래픽은 흔히 계단 현상이라고 부르는 앨리어싱(Aliasing)을 제거하지 않으면 모서리 부분이 매우 지저분하거나 거칠게 보입니다. 이를 제거하기 위해 여러 기술이 개발되었는데, 대표적인 방법이 TAA(Temporal Anti-Aliasing)입니다. 어떤 방법이든지, 기존의 그래픽 연산 유닛을 사용하기 때문에 안티 앨리어싱을 많이 할수록 성능이 낮아졌습니다. 하지만 딥러닝을 위한 텐서 코어를 갖춘 튜링에겐 다른 방법이 있습니다.
딥 러닝 슈퍼 샘플링(Deep Learning Super-Sampling·DLSS)은 그래픽 연산이 아닌 인공지능을 이용해 이미지 품질을 높이기 때문에 3D 연산 능력에 영향을 미치지 않습니다. 결과적으로 텐서 코어를 이용해서 3D 처리 능력을 높인 것과 같은 결과를 얻게 됩니다. 물론 딥러닝 기법으로 이미지 해상도를 높일 경우 기존의 방식과 결과물이 다소 달라 이질적으로 보일 수도 있으나 딥러닝 기반이기 때문에 앞으로 알고리즘을 개선하고 학습을 많이 하면 더 좋은 결과를 얻을 수 있다는 점이 큰 장점입니다.
그래픽과 인공지능 왕좌 노리는 엔비디아
하지만 신기술에도 대가는 따르게 마련입니다. 이미 그래픽 연산과 병렬 연산을 위해 수천 개의 CUDA 코어를 집어넣은 상태에서 다시 텐서 코어와 RT 코어를 추가하면서 튜링 GPU는 엄청나게 커졌습니다. RTX 2080 Ti는 754㎟ 다이 (die) 면적에 186억 개의 트랜지스터를 집적했으며 RTX 2080/2070 역시 538㎟ 면적에 136억 개의 트랜지스터를 집적해 전 세대 대비 크기가 대폭 증가했습니다. 그러나 게임에서의 성능 향상 폭은 30-40% 수준으로 트랜지스터 증가에 미치지 못하는 수준입니다. 물론 새로운 유닛을 대거 집어넣었기 때문이죠.
이미 업계 1위인 엔비디아가 이런 대가를 치르면서까지 신기술을 집어넣은 이유는 분명합니다. 경쟁자들이 따라오지 못할 정도로 앞서가려는 것이죠. 레이 트레이싱 기술을 지원하는 게이밍 GPU는 현재 엔비디아만 출시했고 앞으로 당분간 엔비디아 이외의 회사는 없을 것입니다. 텐서 코어를 지닌 GPU 역시 마찬가지입니다.
물론 엔비디아의 전략이 통하려면 게임 제작사들의 협조가 필수적입니다. 제작사들이 적극적으로 레이 트레이싱과 DLSS를 적용해야 빛을 볼 수 있는 것입니다. 이미 여러 게임에서 지원을 공언했지만, 얼마나 보편적으로 이용하게 될지는 아직 미지수입니다. 만약 최신 게임에서 널리 사용하는 기술이 된다면 엔비디아의 입지는 한층 더 강화되고 차세대 그래픽과 인공지능에서 선두를 유지할 수 있을 것입니다. 과연 그렇게 될지는 두고 봐야 알겠지만, 현재의 성공에 만족하지 않고 새로운 시도를 하는 IT 기업의 모습은 매우 긍정적으로 보입니다.
고든 정 칼럼니스트 jjy0501@naver.com