Modul 5 — ANATOMIA UNEI CONSOLE

Lecția 5.2 — APU (CPU + GPU)

APU, integrarea CPU și GPU, comunicarea cu memoria

Începe Lecția

Introducere

În consolele anterioare, CPU-ul și GPU-ul erau cipuri separate pe placa de bază, comunicând prin bus-uri externe. Începând cu generația PS4/Xbox One, cele două procesoare au fost integrate într-un singur chip: APU (Accelerated Processing Unit). Acest design reduce latența, consumul de energie și costul de fabricație — iar în PS5 și Xbox Series X, APU-ul integrează nu doar CPU și GPU, ci și controllere de memorie, interfețe I/O și unități specializate.

Această lecție acoperă conceptul de APU (procesor unificat CPU + GPU), integrarea CPU și GPU pe același die de siliciu și comunicarea cu memoria — modul în care CPU-ul și GPU-ul partajează eficient aceiași 16 GB de GDDR6.

Scopul nu este memorarea specificațiilor APU-ului, ci înțelegerea de ce integrarea CPU + GPU pe același chip reduce latența, cum cele ~16 miliarde de tranzistori coexistă pe un die de 7nm și de ce un APU de consolă nu este simpla sumă a unui CPU și unui GPU separați.

Teorie Structurată

5.2.1 — Definiție și concept APU

  • AMD Accelerated Processing Unit (APU), cunoscută anterior ca Fusion, este o serie de microprocesoare pe 64 de biți de la AMD
  • Combină un CPU general-purpose (AMD64) și un GPU integrat (IGPU) pe un singur die
  • Proiectul AMD Fusion a început în 2006, accelerat de achiziția ATI Technologies în 2006
  • Dificultăți tehnice: combinarea CPU + GPU pe același die la procesul de 45 nm, viziuni diferite asupra rolurilor CPU/GPU
  • Prima generație (Llano): lansată ianuarie 2011 la CES, cu nuclee K10 și GPU Radeon HD 6000, pe socket FM1
  • AMD APU-urile au module CPU, cache și un procesor grafic de clasă discretă, toate pe același die folosind același bus
  • Scopul: crearea unui APU „complet integrat" cu nuclee heterogene capabile să proceseze automat sarcini CPU și GPU

5.2.2 — Evoluția APU – generații și console

  • Gen 1 – Llano (2011): K10 cores, Radeon HD 6000, 32 nm, TDP 65-100W, Socket FM1
  • Gen 1 low-power – Brazos/Bobcat (2011): 1-2 nuclee Bobcat, Radeon Evergreen GPU, 9W (Ontario) / 18W (Zacate)
  • Gen 2 – Trinity (2012): Piledriver cores, Radeon HD 7000, Socket FM2, TDP 65-100W
  • Gen 2 – Richland (2013): Enhanced Piledriver, Temperature Smart Turbo Core
  • Console semi-custom: PS4 și Xbox One = APU-uri semi-custom bazate pe Jaguar (8 nuclee, 28 nm, GCN GPU)
  • Ulterior: Xbox Series X|S și PlayStation 5 = APU-uri semi-custom AMD
  • Gen 3 – Kaveri (2014): Steamroller cores, GCN 2nd gen GPU, Socket FM2+, HSA-enabled zero-copy
  • CPU+GPU partajează același spațiu de adrese de memorie (Heterogeneous Memory Management)
  • Kabini/Temash (2013): Jaguar cores, primele SoC-uri quad-core x86, 28 nm TSMC
  • Gen 4 – Carrizo (2015): Excavator cores, GCN 3rd gen, integrare southbridge, 15-35W TDP
  • Era Zen: APU-urile redenumite Ryzen with Radeon Graphics
  • Raven Ridge (2017): Zen + Vega GPU, 14 nm, Socket AM4/FP5
  • Picasso (2018): Zen+, 12 nm refresh
  • Renoir (2019): Zen 2 + Vega GPU, 7 nm TSMC, DDR4 + LPDDR4X
  • Cezanne (2020): Zen 3 + Vega GPU, 7 nm
  • Rembrandt (2022): Zen 3+ + RDNA 2 GPU, 6 nm, DDR5 support
  • Phoenix Point (2023): Zen 4 + RDNA 3 GPU, 4 nm TSMC, XDNA NPU (16 TOPS)
  • Strix Point (2024): Zen 5 + RDNA 3.5 GPU, 4 nm, XDNA2 NPU (55 TOPS)

5.2.3 — Heterogeneous System Architecture (HSA) și comunicarea cu memoria

  • AMD este membru fondator al HSA Foundation
  • Evoluția HSA în APU-uri:
  • 2012 (Trinity): GPU Compute C++ Support – CPU și GPU lucrează împreună pentru sarcini paralele (OpenCL C++, C++ AMP)
  • HSA-aware MMU: GPU poate accesa întreaga memorie de sistem prin serviciile de traducere ale MMU-ului HSA
  • Shared Power Management: CPU și GPU partajează bugetul de putere, prioritate merge la procesorul potrivit sarcinii curente
  • 2014 (PS4, Kaveri): Architectural Integration – MMU-ul CPU și IOMMU-ul GPU partajează același spațiu de adrese
  • CPU și GPU accesează memoria cu același spațiu de adrese
  • Pointerii pot fi trecuți liber între CPU și GPU → zero-copy
  • Memorie complet coerentă: GPU accesează date din regiuni coerente de memorie + referință cache CPU
  • GPU folosește memorie paginabilă prin pointeri CPU (fără copiere/pinning)
  • 2015 (Carrizo): System Integration
  • GPU compute context switch (multitasking)
  • GPU graphics pre-emption (latență scăzută)
  • Quality of service: resurse hardware echilibrate/prioritizate

5.2.4 — Comunicarea cu memoria – specificații tehnice

  • Memorie RAM: evoluție de la DDR3-1866 (Llano) → DDR3-2133 → DDR4-2400 → DDR4-3200 → DDR5-5600, LPDDR5x-7500
  • Canale de memorie: 2 canale per APU (mainstream), 1 canal (low-power)
  • Bandwidth maxim (stock): 29.8 GB/s (Llano DDR3) → 102.4 GB/s (Zen 4 DDR5) → 120 GB/s (Zen 5)
  • Controller de memorie integrat: arbitrare între cereri coerente și non-coerente
  • Llano: memoria fizică partiționată între GPU (max 512 MB) și CPU (restul)
  • Kaveri+: spațiu de adrese unificat CPU/GPU (HSA), fără partiționare
  • GPU microarchitecturi integrate: TeraScale 2/3 → GCN (2nd-5th gen) → RDNA 2/3/3.5
  • Cache: L1 data 16-64 KiB/core, L2 1-16 MiB total, L3 4-128 MiB (inclusiv 3D V-Cache la Zen 4+)
  • TDP: de la 4.5W (ultra-low-power) la 170W (desktop performance)
  • Die area: 75-250 mm², tranzistori de la 1.178B (Llano) la mai mulți B (Phoenix la 4nm)

5.2.5 — APU în console de jocuri

  • PS4 (2013): 8 nuclee Jaguar semi-custom, GCN GPU, 28 nm, memorie GDDR5 unificată 8 GB
  • Xbox One (2013): 8 nuclee Jaguar semi-custom, GCN GPU, 28 nm
  • PS5 (2020): Zen 2 + RDNA 2 semi-custom, 7 nm
  • Xbox Series X|S (2020): Zen 2 + RDNA 2 semi-custom
  • Toate consolele moderne folosesc APU-uri semi-custom AMD cu memorie unificată
  • Avantaj console: memorie partajată/unificată între CPU și GPU = lățime de bandă maximă, latență minimă
  • Turbo Core bidirectional: puterea se redistribuie automat între CPU și GPU în funcție de sarcină

Legătura Fizică — Informatică

Definiție și concept APU

  • Combină un CPU general-purpose (AMD64) și un GPU integrat (IGPU) pe un singur die
  • Dificultăți tehnice: combinarea CPU + GPU pe același die la procesul de 45 nm, viziuni diferite asupra rolurilor CPU/GPU
  • Prima generație (Llano): lansată ianuarie 2011 la CES, cu nuclee K10 și GPU Radeon HD 6000, pe socket FM1

Heterogeneous System Architecture (HSA) și comunicarea cu memoria

  • 2012 (Trinity): GPU Compute C++ Support – CPU și GPU lucrează împreună pentru sarcini paralele (OpenCL C++, C++ AMP)
  • HSA-aware MMU: GPU poate accesa întreaga memorie de sistem prin serviciile de traducere ale MMU-ului HSA
  • Shared Power Management: CPU și GPU partajează bugetul de putere, prioritate merge la procesorul potrivit sarcinii curente
  • CPU și GPU accesează memoria cu același spațiu de adrese
  • Pointerii pot fi trecuți liber între CPU și GPU → zero-copy
  • Memorie complet coerentă: GPU accesează date din regiuni coerente de memorie + referință cache CPU
  • GPU folosește memorie paginabilă prin pointeri CPU (fără copiere/pinning)
  • GPU compute context switch (multitasking)
  • GPU graphics pre-emption (latență scăzută)

Aplicare Directă în Console

Definiție și concept APU

  • AMD Accelerated Processing Unit (APU), cunoscută anterior ca Fusion, este o serie de microprocesoare pe 64 de biți de la AMD
  • AMD APU-urile au module CPU, cache și un procesor grafic de clasă discretă, toate pe același die folosind același bus
  • Scopul: crearea unui APU „complet integrat" cu nuclee heterogene capabile să proceseze automat sarcini CPU și GPU

Evoluția APU – generații și console

  • Gen 1 – Llano (2011): K10 cores, Radeon HD 6000, 32 nm, TDP 65-100W, Socket FM1
  • Gen 1 low-power – Brazos/Bobcat (2011): 1-2 nuclee Bobcat, Radeon Evergreen GPU, 9W (Ontario) / 18W (Zacate)
  • Gen 2 – Trinity (2012): Piledriver cores, Radeon HD 7000, Socket FM2, TDP 65-100W
  • Gen 2 – Richland (2013): Enhanced Piledriver, Temperature Smart Turbo Core
  • Console semi-custom: PS4 și Xbox One = APU-uri semi-custom bazate pe Jaguar (8 nuclee, 28 nm, GCN GPU)
  • Ulterior: Xbox Series X|S și PlayStation 5 = APU-uri semi-custom AMD
  • Gen 3 – Kaveri (2014): Steamroller cores, GCN 2nd gen GPU, Socket FM2+, HSA-enabled zero-copy
  • CPU+GPU partajează același spațiu de adrese de memorie (Heterogeneous Memory Management)
  • Kabini/Temash (2013): Jaguar cores, primele SoC-uri quad-core x86, 28 nm TSMC
  • Gen 4 – Carrizo (2015): Excavator cores, GCN 3rd gen, integrare southbridge, 15-35W TDP
  • Era Zen: APU-urile redenumite Ryzen with Radeon Graphics
  • Raven Ridge (2017): Zen + Vega GPU, 14 nm, Socket AM4/FP5
  • Picasso (2018): Zen+, 12 nm refresh
  • Renoir (2019): Zen 2 + Vega GPU, 7 nm TSMC, DDR4 + LPDDR4X
  • Cezanne (2020): Zen 3 + Vega GPU, 7 nm
  • Rembrandt (2022): Zen 3+ + RDNA 2 GPU, 6 nm, DDR5 support
  • Phoenix Point (2023): Zen 4 + RDNA 3 GPU, 4 nm TSMC, XDNA NPU (16 TOPS)
  • Strix Point (2024): Zen 5 + RDNA 3.5 GPU, 4 nm, XDNA2 NPU (55 TOPS)

Heterogeneous System Architecture (HSA) și comunicarea cu memoria

  • Evoluția HSA în APU-uri:
  • 2014 (PS4, Kaveri): Architectural Integration – MMU-ul CPU și IOMMU-ul GPU partajează același spațiu de adrese

APU în console de jocuri

  • PS4 (2013): 8 nuclee Jaguar semi-custom, GCN GPU, 28 nm, memorie GDDR5 unificată 8 GB
  • Xbox One (2013): 8 nuclee Jaguar semi-custom, GCN GPU, 28 nm
  • PS5 (2020): Zen 2 + RDNA 2 semi-custom, 7 nm
  • Xbox Series X|S (2020): Zen 2 + RDNA 2 semi-custom
  • Toate consolele moderne folosesc APU-uri semi-custom AMD cu memorie unificată
  • Avantaj console: memorie partajată/unificată între CPU și GPU = lățime de bandă maximă, latență minimă
  • Turbo Core bidirectional: puterea se redistribuie automat între CPU și GPU în funcție de sarcină

Exemplu Real de Hardware

Definiție și concept APU

  • Proiectul AMD Fusion a început în 2006, accelerat de achiziția ATI Technologies în 2006

Heterogeneous System Architecture (HSA) și comunicarea cu memoria

  • AMD este membru fondator al HSA Foundation

Comunicarea cu memoria – specificații tehnice

  • Memorie RAM: evoluție de la DDR3-1866 (Llano) → DDR3-2133 → DDR4-2400 → DDR4-3200 → DDR5-5600, LPDDR5x-7500
  • Canale de memorie: 2 canale per APU (mainstream), 1 canal (low-power)
  • Bandwidth maxim (stock): 29.8 GB/s (Llano DDR3) → 102.4 GB/s (Zen 4 DDR5) → 120 GB/s (Zen 5)
  • Controller de memorie integrat: arbitrare între cereri coerente și non-coerente
  • Llano: memoria fizică partiționată între GPU (max 512 MB) și CPU (restul)
  • Kaveri+: spațiu de adrese unificat CPU/GPU (HSA), fără partiționare
  • GPU microarchitecturi integrate: TeraScale 2/3 → GCN (2nd-5th gen) → RDNA 2/3/3.5
  • Cache: L1 data 16-64 KiB/core, L2 1-16 MiB total, L3 4-128 MiB (inclusiv 3D V-Cache la Zen 4+)
  • TDP: de la 4.5W (ultra-low-power) la 170W (desktop performance)
  • Die area: 75-250 mm², tranzistori de la 1.178B (Llano) la mai mulți B (Phoenix la 4nm)

Probleme Frecvente Asociate

⚠️ Probleme asociate cu APU (CPU + GPU)

Problemele frecvente asociate cu această temă vor fi detaliate pe măsură ce cursul avansează.

Recapitulare

  • Definiție și concept APU: AMD Accelerated Processing Unit (APU), cunoscută anterior ca Fusion, este o serie de microprocesoare pe 64 de biți de la AMD
  • Evoluția APU – generații și console: Gen 1 – Llano (2011): K10 cores, Radeon HD 6000, 32 nm, TDP 65-100W, Socket FM1
  • Heterogeneous System Architecture (HSA) și comunicarea cu memoria: AMD este membru fondator al HSA Foundation
  • Comunicarea cu memoria – specificații tehnice: Memorie RAM: evoluție de la DDR3-1866 (Llano) → DDR3-2133 → DDR4-2400 → DDR4-3200 → DDR5-5600, LPDDR5x-7500
  • APU în console de jocuri: PS4 (2013): 8 nuclee Jaguar semi-custom, GCN GPU, 28 nm, memorie GDDR5 unificată 8 GB

Quiz — 5 Întrebări

Întrebarea 1

Care afirmație este corectă despre: Dificultăți tehnice?

  • a) crearea unui APU „complet integrat" cu nuclee heterogene capabile să proceseze automat sarcini CPU și GPU
  • b) combinarea CPU + GPU pe același die la procesul de 45 nm, viziuni diferite asupra rolurilor CPU/GPU
  • c) lansată ianuarie 2011 la CES, cu nuclee K10 și GPU Radeon HD 6000, pe socket FM1
  • d) K10 cores, Radeon HD 6000, 32 nm, TDP 65-100W, Socket FM1
Arată răspunsul

b) — combinarea CPU + GPU pe același die la procesul de 45 nm, viziuni diferite asupra rolurilor CPU/GPU

Întrebarea 2

Care afirmație este corectă despre: Gen 1 – Llano (2011)?

  • a) combinarea CPU + GPU pe același die la procesul de 45 nm, viziuni diferite asupra rolurilor CPU/GPU
  • b) lansată ianuarie 2011 la CES, cu nuclee K10 și GPU Radeon HD 6000, pe socket FM1
  • c) crearea unui APU „complet integrat" cu nuclee heterogene capabile să proceseze automat sarcini CPU și GPU
  • d) K10 cores, Radeon HD 6000, 32 nm, TDP 65-100W, Socket FM1
Arată răspunsul

d) — K10 cores, Radeon HD 6000, 32 nm, TDP 65-100W, Socket FM1

Întrebarea 3

Care afirmație este corectă despre: 2012 (Trinity)?

  • a) lansată ianuarie 2011 la CES, cu nuclee K10 și GPU Radeon HD 6000, pe socket FM1
  • b) crearea unui APU „complet integrat" cu nuclee heterogene capabile să proceseze automat sarcini CPU și GPU
  • c) GPU Compute C++ Support – CPU și GPU lucrează împreună pentru sarcini paralele (OpenCL C++, C++ AMP)
  • d) combinarea CPU + GPU pe același die la procesul de 45 nm, viziuni diferite asupra rolurilor CPU/GPU
Arată răspunsul

c) — GPU Compute C++ Support – CPU și GPU lucrează împreună pentru sarcini paralele (OpenCL C++, C++ AMP)

Întrebarea 4

Care afirmație este corectă despre: Memorie RAM?

  • a) lansată ianuarie 2011 la CES, cu nuclee K10 și GPU Radeon HD 6000, pe socket FM1
  • b) combinarea CPU + GPU pe același die la procesul de 45 nm, viziuni diferite asupra rolurilor CPU/GPU
  • c) evoluție de la DDR3-1866 (Llano) → DDR3-2133 → DDR4-2400 → DDR4-3200 → DDR5-5600, LPDDR5x-7500
  • d) crearea unui APU „complet integrat" cu nuclee heterogene capabile să proceseze automat sarcini CPU și GPU
Arată răspunsul

c) — evoluție de la DDR3-1866 (Llano) → DDR3-2133 → DDR4-2400 → DDR4-3200 → DDR5-5600, LPDDR5x-7500

Întrebarea 5

Care afirmație este corectă despre: PS4 (2013)?

  • a) crearea unui APU „complet integrat" cu nuclee heterogene capabile să proceseze automat sarcini CPU și GPU
  • b) combinarea CPU + GPU pe același die la procesul de 45 nm, viziuni diferite asupra rolurilor CPU/GPU
  • c) lansată ianuarie 2011 la CES, cu nuclee K10 și GPU Radeon HD 6000, pe socket FM1
  • d) 8 nuclee Jaguar semi-custom, GCN GPU, 28 nm, memorie GDDR5 unificată 8 GB
Arată răspunsul

d) — 8 nuclee Jaguar semi-custom, GCN GPU, 28 nm, memorie GDDR5 unificată 8 GB

Exercițiu Aplicat de Gândire

🧠 Exercițiu: APU (CPU + GPU)

Scenariu: Analizezi un sistem hardware care utilizează conceptul de APU. Pe baza cunoștințelor din această lecție, răspunde la următoarele întrebări:

  • 1. Defineste pe scurt: APU.
  • 2. Ce rol are integrarea CPU și GPU în contextul hardware-ului?
  • 3. Explică relația dintre APU și comunicarea cu memoria.
Arată rezolvarea

1. AMD Accelerated Processing Unit (APU), cunoscută anterior ca Fusion, este o serie de microprocesoare pe 64 de biți de la AMD

2. Gen 1 – Llano (2011): K10 cores, Radeon HD 6000, 32 nm, TDP 65-100W, Socket FM1

3. AMD este membru fondator al HSA Foundation

Video Recomandat

0:00 / 0:00

APU vs CPU vs GPU: ce diferă între ele și când se folosește fiecare tip de procesor, cu exemple practice.