Modul 7 — PERFORMANȚĂ ȘI GRAFICĂ
bandwidth, latență, influența asupra performanței
Începe LecțiaUn GPU cu 10 TFLOPS de putere de calcul este inutil dacă nu primește datele suficient de repede. Bandwidth-ul — cantitatea de date transferată pe secundă între memorie și procesor — este adesea factorul care determină performanța reală a unui sistem grafic. PlayStation 5 oferă 448 GB/s de bandwidth prin GDDR6, iar Xbox Series X atinge 560 GB/s — numere care definesc câte texturi, vertecși și framebuffer-uri pot fi procesate pe secundă.
Această lecție acoperă bandwidth-ul (capacitatea de transfer a bus-ului de memorie), latența (timpul de acces la fiecare cerere individuală) și influența acestora asupra performanței — de ce un GPU cu bandwidth insuficient nu poate atinge rezoluția sau framerate-ul nominal.
Scopul nu este memorarea specificațiilor de bandwidth, ci înțelegerea de ce PS5 folosește un bus de 256-bit pentru a atinge 448 GB/s, cum aceste numere determină direct calitatea vizuală sustenabilă în timp real și de ce bandwidth-ul, nu doar puterea de calcul, dictează performanța grafică.
1. Convenția bcopy: numără cantitatea de date copiate dintr-o locație în alta per unitate de timp
2. Convenția STREAM: sumează datele citite explicit + datele scrise explicit de codul aplicației
3. Convenția hardware: numără traficul real de date al hardware-ului (inclusiv cel neexplicit)
• Frecvența de bază a ceasului DRAM
• Numărul de transferuri de date per ciclu de ceas: 2 (pentru DDR = "double data rate")
• Lățimea magistralei de memorie (interfață): 64 biți per interfață DDR
• Numărul de interfețe: PC-urile moderne folosesc de obicei 2 interfețe (dual-channel) = 128 biți efectivi
400.000.000 cicluri/s × 2 transferuri/ciclu × 64 biți/transfer × 2 interfețe =
102.400.000.000 biți/s = 12.800 MB/s = 12,8 GB/s (burst rate teoretic)
dar latența absolută a rămas relativ stabilă (~10-15 ns) datorită frecvențelor mai mari
Aceasta crește rata externă fără a crește frecvența internă a DRAM-ului
și recuperarea acestuia de către procesor
dar s-a îmbunătățit în termeni de timp absolut
vs DDR4 DIMMs moderne cu sub 15 ns
și recuperarea acestuia de către procesor
vs DDR4 DIMMs moderne cu sub 15 ns
Problemele frecvente asociate cu această temă vor fi detaliate pe măsură ce cursul avansează.
Care afirmație este corectă despre: Exemplu?
b) — copierea a 1 milion de bytes = 1 milion bytes/s
Care afirmație este corectă despre: Calculul bandwidth-ului și nomenclatura?
d) — Pentru DDR SDRAM (DDR, DDR2, DDR3, DDR4), bandwidth-ul total = produs de:
Care afirmație este corectă despre: DRAM asincron?
b) — interval specificat în nanosecunde (timp absolut)
Care afirmație este corectă despre: EXEMPLU modul 1 GiB SDRAM?
c) — 8 chipuri de 1 Gbit (128 MiB fiecare)
Care afirmație este corectă despre: ATENȚIE?
d) — bandwidth-ul maxim se atinge doar când adresa datelor este cunoscută suficient de devreme
Scenariu: Analizezi un sistem hardware care utilizează conceptul de bandwidth. Pe baza cunoștințelor din această lecție, răspunde la următoarele întrebări:
1. Memory bandwidth = rata la care datele pot fi citite din sau stocate într-o memorie semiconductoare de către un procesor
2. 3 convenții diferite pentru definirea cantității de date transferate:
3. Pentru DDR SDRAM (DDR, DDR2, DDR3, DDR4), bandwidth-ul total = produs de:
Lățimea de bandă a memoriei (CPU și GPU): ce este, cum se măsoară și cum afectează performanța.