이에 자극받은 미국 정부는 2015년 오바마 행정부 시절 국가 전략 컴퓨팅 구상(National Strategic Computing Initiative, NSCI)을 발표했습니다. 미국 에너지부, 국방부, 국립 과학 재단(NSF)가 주도해 인텔, 엔비디아, AMD, IBM 등 주요 IT 제조사들과 함께 슈퍼컴퓨터 분야에서 미국의 우위를 지킬 차세대 슈퍼컴퓨터를 만들기로 합의한 것입니다.
2016년 국가 전략 컴퓨팅 구상에 참여한 기관 및 기업들은 2022년에 첫 엑사플롭스(ExaFlops)급 슈퍼컴퓨터를 만들 수 있을 것으로 예측했습니다. 그리고 우선 오크리지 국립 연구소와 로렌스 리버모어 국립 연구소에 서밋 (Summit)과 시에라 (Sierra)라는 100-300 페타플롭스급 슈퍼컴퓨터를 만들기로 계획했습니다. 이 슈퍼컴퓨터는 IBM의 파워 CPU와 엔비디아의 볼타 GPU를 사용한 것이었습니다.
하지만 두 회사에만 의존하는 경우 슈퍼컴퓨터 시장 독점 우려와 함께 실패할 경우 목표 달성이 힘들어지는 문제가 있습니다. 따라서 미국 정부는 인텔과 AMD에도 비슷한 조건으로 슈퍼컴퓨터를 개발하게 했습니다. 이들은 각각 독자 CPU + GPU 플랫폼을 이용해 슈퍼컴퓨터를 개발하기로 했습니다. 2016년 독자 CPU를 기반으로 세계 최고 성능 슈퍼컴퓨터를 개발한 중국에 대응하기 위해서는 미국이 가진 모든 자원과 최고의 회사들을 다 동원해야 한다는 절박함도 있었습니다.
그리고 행정부가 두 번 바뀐 2022년에 미국은 세계 최초의 엑사플롭스급 슈퍼컴퓨터를 선보였습니다. 정확히 예상한 시점에 목표에 도달한 것입니다. 첫 번째 타자는 AMD가 개발한 프런티어 (Frontier) 슈퍼컴퓨터입니다. AMD의 트렌토 (Trento) 64 코어 CPU와 라데온 인스팅트 MI250X GPU를 이용한 슈퍼컴퓨터로 최근 1.102 ExaFlop/s의 연산 속도를 기록해 세계에서 가장 빠른 컴퓨터이자 사상 최초로 엑사플롭스급 연산 능력을 지닌 슈퍼컴퓨터로 기록됐습니다.
프런티어는 한 개의 CPU와 네 개의 GPU가 기본 구조로 각 CPU마다 512GB DDR4 메모리를 탑재하고 GPU마다 128GB의 HBM2e 메모리를 탑재해 하나의 노드 (node)를 구성합니다. 그리고 128개의 노드가 하나의 올림푸스 랙 (Olympus Rack)이라는 거대한 냉장고 같은 구조를 만듭니다.
최종적으로 74개의 랙이 모여 프런티어 슈퍼컴퓨터를 구성하는 것입니다. 노드의 숫자만 9,408개로 같은 수의 CPU와 네 배나 되는 GPU가 탑재되어 있습니다. 메모리 용량만 HBM2e 메모리 4.6PB, DDR4 메모리 4.6PB이며 700PB가 넘는 거대한 저장 장치를 갖고 있습니다. 소비하는 전력은 웬만한 발전소 한 개에 해당하는 29MW입니다.
프런티어의 성과는 오바마 시절부터 시작된 슈퍼컴퓨터 투자가 정권이 바뀌어도 지속적으로 이뤄진 덕분입니다. 슈퍼컴퓨터는 미국처럼 관련 기술이 많이 축적된 국가에서도 개발부터 실제 가동까지 오랜 시간이 걸리는 분야입니다. 당연히 그사이 행정부가 바뀌는 경우가 비일비재합니다. 하지만 정치적 상황과 관계없이 슈퍼컴퓨터처럼 미국의 국력과 직접 연관되는 분야에는 아낌없는 투자가 이뤄졌기 때문에 지금의 성과가 나왔다고 할 수 있습니다.
하지만 1등은 하는 것보다 지키는 것이 더 어렵습니다. 중국은 말할 것도 없고 슈퍼컴퓨터 분야에서 상당한 독자 기술력을 지닌 일본도 다시 1위 타이틀을 차지하기 위해 연구를 계속하고 있습니다. 따라서 이미 미국은 2엑사플롭스 이상의 연산이 가능한 차세대 슈퍼컴퓨터 개발과 투자를 동시에 진행하고 있습니다.
AMD는 프런티어 이외에도 Zen 4 기반의 최신 CPU와 최신 GPU를 사용한 엘 카피탄 (El Capitan)을 2023년 선보일 예정으로 목표 성능은 2엑사플롭스입니다. 인텔 역시 오로라(Aurora)라는 엑사플롭스급 슈퍼컴퓨터를 개발 중인데, 인텔의 사파이어 래피즈 제온 CPU와 폰테 베키오 GPU를 이용해 곧 모습을 드러낼 예정입니다.
엔비디아는 역시 최근 로스 알라모스 국립 연구소에 공급할 AI 슈퍼컴퓨터인 버나도 (Venado)를 추가로 공개했습니다. 엔비디아가 자체 개발한 Arm 기반 서버 프로세서인 그레이스 슈퍼칩과 호퍼 GPU를 이용한 슈퍼컴퓨터로 특히 AI 관련 연산에 특화되어 10 엑사플롭스 AI 연산이 가능합니다.
엔비디아는 그레이스 슈퍼칩을 이용한 차세대 슈퍼컴퓨터 프로젝트를 몇 개 공개했으며 첫 제품은 2023년에 볼 수 있을 것이라고 언급했습니다. 과거 인텔, AMD, IBM 같은 다른 회사 CPU를 이용해 자사 GPU와 같이 사용했던 데서 벗어나 CPU 독립을 이룰 수 있을지 결과가 주목되는 상황입니다.
미국의 엑사스케일 슈퍼컴퓨터 개발 성공은 정파를 떠나 장기적이고 일관성 있는 정책이 과학기술 발전에 중요하다는 것을 보여주는 또 다른 사례입니다. 다음 미국 대선에 누가 당선될지는 알 수 없지만, 현재 진행 중인 미국의 슈퍼컴퓨터 육성 정책은 크게 달라지지 않을 것으로 예상됩니다.
고든 정 칼럼니스트 jjy0501@naver.com