||<tablewidth=100%><tablebordercolor=#000000><bgcolor=#000000><color=#ffffff><height=70>
||<tablealign=center><tablebordercolor=#000000><tablebgcolor=#000000>
||<(> {{{#!wiki style="letter-spacing:-0.5px"
CDNA 아키텍처 기반 제품군 ||
||{{{#!wiki style="margin: -16px -11px;" |
<colbgcolor=#007c97><colcolor=#ffffff> CDNA 1 (MI100 ISA) |
Instinct MI100 |
CDNA 2 (MI200 ISA) |
Instinct MI200 시리즈 | |
CDNA 3 (불명) |
Instinct MI300 시리즈 | }}} |
1. 개요
2020년 3월 5일, AMD 파이낸셜 애널리스트 데이에서 처음 소개된 후 11월 16일에 정식 발표된 GCN 마이크로아키텍처의 후속 GPU 마이크로아키텍처. 데이터 센터용이자 연산 특화용 아키텍처라고 한다. 인스팅트 제품군에 채택된 아키텍처이기도 하다. CDNA의 C는 Compute의 머리글자.2. 특징
- AMD Financial Analyst Day 2020 Round-Up: Laying A Path For Bigger & Better Things
- AMD Unveils CDNA GPU Architecture: A Dedicated GPU Architecture for Data Centers
- AMD CDNA 아키텍처
2.1. GCN의 진정한 후계자?
신경 네트워킹, 딥 러닝 및 모든 AI 분야의 빠른 발전으로 데이터 센터의 GPU 수요가 급증해서 GPU는 이제 데이터 센터에서도 매우 중요한 존재가 되었다. 그러나 AMD한테는 이러한 호황에서 제대로 힘을 쓰지 못 했는데 NVIDIA는 그 분야에서 수십 억 달러를 벌어 들일만큼 이미 장악한 상태였기 때문. NVIDIA한테 크게 밀리고 있는 시장 규모지만 게이밍 시장보다 더 높은 수익성이 있어서 포기할 수 없었고, 기존의 GCN으로는 더이상 경쟁력을 갖출 수 없다고 판단했는지 먼저 발표된 RDNA 아키텍처가 게이밍을 위해 GCN에서 크게 변경했던 것처럼 연산 특화용인 CDNA를 발표하게 되었다고 한다.GCN이 게이밍 시장과 데이터 센터 시장에 모두 사용되었지만, 내부적으로는 연산 특화용에 더 적합한 구조를 지녔기 때문에 이러한 특성을 반영하고 더 강화된 CDNA야말로 GCN의 진정한 후속 아키텍처로 보는 의견이 있다. 아키텍처 whitepaper가 공개되면서 소문대로 기존 GCN의 확장판으로 계승되었다. GCN과의 차이점이라면 그래픽스에 필요한 각종 하드웨어 블록들이[1] 전부 제거되었고, RDNA 2부터 도입된 레이 트레이싱 전용 하드웨어 블록인 레이 엑셀러레이터도 당연히 제거되었으며, 심지어 디스플레이 컨트롤러랑 컴퓨트 유닛 안에 포함되어 있던 텍스처 유닛까지 제거되었다는 것. 미디어 디코딩 및 인코딩 기능인 VCN만 제거되지 않고 유지되었다.
아키텍처 코드 역시 gfx9xx(뒤의 2개 x는 숫자)로 5세대 GCN인 Vega의 파생형이라는 느낌을 준다.
3. 세대별 CDNA 일람
3.1. CDNA 1
-
컴퓨트 유닛이 최다 64개 → 128개로 2배 확장
그동안 3세대 GCN 이래로 최다 컴퓨트 유닛이 64개를 넘긴 적이 없었는데, RDNA 2 아키텍처와 마찬가지로 64개를 넘는 스펙을 지원하게 되었다. 그에 따라 셰이더 엔진도 최다 4개에서 8개로 확장되었다. -
L2 캐시 메모리가 최대 4 MB → 8 MB로 2배 확장
연산부 스펙이 크게 확장되었기 때문에 이를 받쳐주기 위해 L2 캐시 메모리의 용량도 증설되었고, 그에 따라 L2 캐시 메모리의 슬라이스도 최다 16개에서 32개로 증가되었으며, L2 캐시 메모리 슬라이스당 대역폭도 RDNA와 마찬가지로 64 바이트/클럭 사이클에서 128 바이트/클럭 사이클로 확장해서 총 6 TB/s로 구현되었다. L2 캐시 메모리 슬라이스 개수는 2배 증가되었지만 캐시 배치 정책은 여전히 16-way Set Associative이다. -
HBM2 대역폭이 1 TB/s → 1.23 TB/s로 약 20% 증가
이전 세대인 7 nm 공정 미세화 버전의 Vega 아키텍처와 마찬가지로 HBM2 규격에 최대 4스택과 최대 32 GB로 구성되어 있으나, 비트레이트가 2 Gbps에서 2.4 Gbps으로 빨라짐에 따라 대역폭도 그만큼 빨라졌다. -
GPU↔GPU 인터커넥트가 링 토폴로지 → 인피니티 페브릭 토폴로지로 변경
이전 세대인 Vega 아키텍처에서는 인피니티 패브릭이 GPU 내부에서만 적용되었지만, 이번에는 GPU 외부의 인터커넥트도 인피니티 패브릭으로 적용된 본격적인 인피니티 아키텍처로 구축되었다. -
3개의 인피니티 패브릭 링크 지원으로 최대 4개의 GPU 연동 가능
인피니티 패브릭 링크당 92 GB/s의 대역폭을 구현할 수 있고, 최대 3개의 링크를 지원하므로 총 276 GB/s의 대역폭을 지니며, 점대점(Point-to-Point)으로 연결되므로 4개의 GPU를 연동하면 이론적으로 최대 552 GB/s의 성능이 된다. 하지만, PCI-Express 4.0 기반이기 때문에 이론적인 한계치는 256 GB/s이다. -
그래픽스 관련 고정 하드웨어들이 전부 삭제
범용 연산에 특화된 아키텍처를 모토로 설계되었기 때문에 이에 불필요한 그래픽 관련 하드웨어 블록들이 전부 제거되었다. -
VCN 2.5
기능적으로는 AV1 디코딩을 지원하지 않는 RDNA 아키텍처 기반 라데온 RX 5000 시리즈, Vega 아키텍처 기반 3세대 라이젠 APU 내장 그래픽과 큰 차이가 없다. -
Matrix Core
행렬/텐서 연산을 하기 위한 코어로, NVIDIA의 텐서코어와 동일한 역할을 수행한다.
2020년 11월 16일에 발표된 CDNA 첫 마이크로아키텍처. 이전부터 루머로 알려진 Arcturus가 CDNA 기반 GPU일 가능성이 높으며, 인스팅트 MI100 컴퓨팅 카드에 사용된 것으로 밝혀졌다.
3.2. CDNA 2
AMD CDNA 2 MICROARCHITECTURE WHITEPAPER- TSMC 7 nm의 하프 노드인 6 nm 공정으로 제조
- 2.5D Elevated Fanout Bridge 기술을 이용한 멀티 다이 GPU 패키징 구현
- 컴퓨트 유닛이 최다 128개 → 128×2개로 2배 확장 (단일 GCD 기준 동일)
- L2 캐시 메모리가 최대 8 MB → 8×2 MB로 2배 확장 (단일 GCD 기준 동일)
- HBM2E 대역폭이 1.23 TB/s → 1.6×2 TB/s로 GCD당 약 30% 증가
- 최다 8개의 인피니티 패브릭 링크 지원
- VCN 2.6
2021년 11월 9일에 발표된 CDNA의 후속 마이크로아키텍처. 이전 로드맵에서는 2022년으로 예정되었으나 2021년 말까지 앞당겨진다는 루머가 나오기 시작했고, 실제로 CDNA가 정식 발표되고 나서 약 1년만에 발표되었다. 코드네임 Aldebaran으로 알려져 있었고, MCM 구조와 HBM2E 메모리가 채택되었다. 2개의 실리콘 다이로 구성되어 있는데, AMD 공식 발표 행사에서 언급되지 않았지만 AMD 회사 내부 문헌에서는 해당 실리콘 다이를 GCD(Graphics Compute Die)라고 언급되어 있어서 앞으로도 GCD로 통용될 가능성이 높다. 인스팅트 MI200 시리즈 컴퓨팅 카드에 사용된 것으로 밝혀졌다.
3.3. CDNA 3
2023년 6월 13일, 데이터센터 & AI 컨퍼런스에서 3세대 CDNA 마이크로아키텍처에 대한 내용이 간략하게 발표되었다.- AI 및 HPC 전용 특화 가속기 엔진
- AMD 4세대 인피니티 아키텍처를 사용한 3D 패키징
- 성능 및 전력 효율성에 최적화
3.4. UDNA
문서 참조4. 같이 보기
[1]
그래픽스 커맨드 프로세서, 지오메트리 프로세서, 프리미티브 유닛, 래스터라이저, 스캔 컨버터, 하이어라키컬-Z, 텍스처 유닛, 렌더 백엔드.