1965년 인텔의 설립자 가운데 한 명인 고든 무어는 대략 이와 같은 추세로 반도체 기술이 발전한다고 언급했습니다. 고든 무어가 한 잡지에 기고한 글에서 그는 이런 반도체 집적도 발전 속도가 아마도 10년은 유지될 것이라고 예상했습니다.
이후에는 집적 속도가 약간 느려져 2년마다 2배로 정정했는데, 이쪽이 무어의 법칙이라는 이름으로 더 잘 알려져 있습니다. 그의 이름을 딴 무어의 법칙은 오랜 세월 IT 기술의 발전 속도의 척도처럼 여겨졌습니다.
현재는 프로세서가 복잡해지고 반도체 제조 공정 역시 미세화의 한계에 부딪히면서 프로세서의 집적도가 2배로 증가하는 시간은 갈수록 길어지고 있습니다. 일부에서 무어의 법칙은 죽었다는 이야기가 나오는 것도 무리는 아닙니다.
하지만 간격이 더 길어졌을 뿐 여전히 프로세서의 집적도는 일정한 주기로 2배씩 증가해 어느덧 스마트폰에 들어가는 어플리케이션 프로세서(AP)의 집적도도 100억 개를 훌쩍 뛰어넘은 상황입니다.
스마트폰과는 기준이 다르지만 데스크톱과 노트북 컴퓨터에 들어가는 x86 프로세서 역시 알게 모르게 기하급수적으로 트랜지스터 숫자가 늘어나고 있습니다. 예를 들어 1978년 등장한 최초의 x86 프로세서인 8086은 트랜지스터 숫자가 2만 9000개에 불과했으나 11년 뒤인 1989년에 등장한 80486은 그 41배인 118만 235개의 트랜지스터를 집적했습니다.
4년 뒤인 1993년에 등장한 펜티엄 프로세서는 310만 개, 1998년에 등장한 펜티엄 II는 750만 개, 2000년에 등장한 펜티엄 4는 4200만 개의 트랜지스터를 집적하면서 숫자를 급격히 늘렸습니다. 참고로 펜티엄 3/4에서 갑자기 트랜지스터 숫자가 증가한 것은 L2 캐시를 내장했기 때문입니다.
2000년대에는 코어 숫자가 늘어나고 64bit 아키텍처가 도입되면서 한 단계 더 트랜지스터 숫자가 증가합니다. 2008년에 등장한 코어 i7 (1세대, 네할렘)은 7억 3100만 개의 트랜지스터를 집적해 8년 전인 펜티엄 4보다 17배나 많은 트랜지스터를 집적했습니다. 그 사이 코어 숫자도 4개로 늘어나고 캐시 메모리도 증가했으며 최신 64bit 아키텍처를 도입했기 때문입니다.
하지만 이후 한동안 트랜지스터 집적도 증가세는 주춤하게 됩니다. 인텔의 경쟁자인 AMD가 2011년 내놓은 불도저가 12억 개의 트랜지스터를 집적하고도 큰 성능 향상을 보여주지 못하면서 시장이 독점 상태로 흘러가기 때문입니다.
인텔은 한동안 4코어 프로세서에서 더 이상 코어 숫자를 늘리지 않았을 뿐 아니라 아키텍처와 프로세서 생산 공정도 큰 변화 없이 유지했습니다. 2014년 내놓은 하스웰 프로세서 (4코어)의 트랜지스터 집적도는 14억 개로 2008년과 비교해서 두 배 차이도 나지 않았습니다.
이런 상황에서 다시 경쟁의 불을 지핀 것은 2017년 등장한 라이젠입니다. 8코어 라이젠 프로세서의 트랜지스터 집적도는 48억 개로 경쟁자보다 훨씬 많았습니다.
물론 프로세서의 성능은 아키텍처나 동작 클럭 등 여러 가지 요소에 의해 좌우되기 때문에 단순히 트랜지스터 숫자가 많다고 이기는 것은 아닙니다. 하지만 AMD가 코어 숫자를 늘리면서 성능을 대폭 끌어올린 것은 맞기 때문에 인텔도 코어 숫자를 늘리면서 대응하지 않을 수 없었습니다.
여기서 흥미로운 대목은 이후 인텔이 트랜지스터 집적도를 상세히 공개하지 않고 있다는 것입니다. 절대 성능에서 밀리진 않지만, 트랜지스터 집적도는 경쟁자만큼 높지 않음을 유추할 수 있는 대목입니다.
아무튼 AMD는 일반 소비자용 프로세서에서 코어 숫자를 16개까지 높였고 인텔도 이에 질세라 고성능 코어와 고효율 코어의 하이브리드 구조를 지닌 앨더 레이크 (12세대 코어 프로세서)와 랩터 레이크 (13세대 코어 프로세서)를 내놓으면서 코어 숫자를 24개까지 늘렸습니다. 따라서 트랜지스터 숫자는 경쟁에 의해 다시 한번 큰 폭으로 증가했습니다.
최근 공개된 슬라이드에 의하면 라이젠 7000시리즈의 트랜지스터 집적도는 이미 100억 개를 훌쩍 뛰어넘었습니다.
라이젠 7000은 6nm 공정으로 만든 I/O 다이와 5nm 공정으로 만든 컴퓨트 다이 (CCD) 두 가지 칩렛으로 구성되어 있는데, 각각의 트랜지스터 집적도와 크기를 정확히 공개한 것입니다.
8코어 컴퓨트 다이의 트랜지스터 집적도는 65.7억 개이고 면적은 66.3㎟입니다. I/O 다이의 집적도는 이보다 낮은 33.7억 개이지만 면적은 훨씬 큰 117.8㎟입니다. 공정과 로직이 서로 다른 만큼 트랜지스터 밀도에서 큰 차이가 있습니다.
따라서 컴퓨트 다이 한 개와 I/O 다이 한 개를 지닌 8코어 제품의 경우 트랜지스터 집적도는 100억 개로 볼 수 있습니다. 컴퓨트 다이 2개가 들어간 16코어 라이젠 9 7950X는 165억 개의 트랜지스터를 지녔습니다.
만약 여기에 3D V 캐시를 추가로 올려 캐시 메모리 용량을 늘린 경우 트랜지스터 숫자는 47억 개 증가합니다. 따라서 16코어 라이젠 9 7950X3D의 트랜지스터 집적도는 212억 개에 달합니다. 결국 작년과 올해 나온 중급형 이상의 데스크톱 CPU들은 트랜지스터 집적도가 100–200억 개에 달해 34년 전 486 CPU보다 1만 배 더 많아진 셈입니다.
인텔 13세대 코어 프로세서의 정확한 집적도는 공개하지 않았지만, 24개까지 코어 숫자가 증가한 만큼 경쟁자보다 크게 적지 않을 것으로 예상됩니다. 최대 60개의 고성능 코어를 지닌 사파이어 래피즈 제온 프로세서의 트랜지스터 집적도가 440-480억 개에 달한다는 점을 생각해도 이점을 유추할 수 있습니다.
1-2년마다는 2배는 아니지만, 프로세서의 트랜지스터 집적도는 멈추지 않고 증가하고 있습니다. 어디까지 증가할지는 알 수 없지만, 서버 영역이나 GPU에선 이미 1000억 개에 근접한 만큼 우리가 지금보다 더 많은 트랜지스터를 집적한 CPU를 쓰는 일은 시간문제입니다.
이렇게 보면 무어의 법칙은 큰 틀에서는 아직도 살아 있습니다. 이미 반 세기를 넘어간 무어의 법칙이 어디까지 살아남을 수 있을지 궁금합니다.
고든 정 과학 칼럼니스트 jjy0501@naver.com