Dlaczego karty graficzne eGPU nie tracą drastycznie na wydajności?

Na pierwszy rzut oka może wydawać się, że podłączanie bardzo wydajnej karty graficznej przez zewnętrzną obudowę eGPU ograniczoną do interfejsu Thunderbolt 3, Thunderbolt 4 lub USB4 o przepustowości portu 40 Gb/s, czyli ok. 5 GB/s powinno oznaczać ogromny spadek wydajności. Dla porównania – standardowe gniazdo PCIe 4.0 x16 oferuje przepustowość aż 32 GB/s. Skoro różnica jest ponad sześciokrotna, to czemu realne straty w grach i aplikacjach to przeważnie tylko 10%, maksymalnie dochodząc do straty w wysokości 20%?

Odpowiedź kryje się w tym, jak faktycznie działa karta graficzna i w jaki sposób korzysta z magistrali komunikacyjnej PCIe. A zatem:

1. GPU nie potrzebuje ciągłego transferu maksymalnym pasmem magistrali PCIe

Wbrew pozorom karta graficzna nie musi nieustannie wymieniać ogromnych ilości danych z pamięcią RAM komputera. Tekstury, shadery czy bufory ładowane są do pamięci VRAM karty i tam pozostają. Proces renderowania odbywa się lokalnie w VRAM, bez ciągłego korzystania z magistrali PCIe. Dzięki temu ograniczona przepustowość złącza Thunderbolt lub USB4 rzadko staje się krytycznym wąskim gardłem.

2. Standard PCIe jest przewymiarowany względem wymagań gier i oprogramowania np. CAD/CAM/GIS

Złącze PCIe x16 zapewnia bardzo duży zapas przepustowości, aby sprostać najbardziej wymagającym scenariuszom (np. obliczeniom naukowym czy bazom danych GPU). Gry i większość programów 3D nie potrzebują pełnej szybkości PCIe x16.

W praktyce przepustowości magistrali wyglądają następująca:

  • PCIe 3.0 x16 → 16 GB/s
  • PCIe 3.0 x8 → 8 GB/s (różnice w grach często minimalne)
  • PCIe 3.0 x4 → 4 GB/s (transfer zbliżony do Thunderbolt 3, Thunderbolt 4, USB4)

Oznacza to, że eGPU działa tak, jakby karta była wsadzona w slot PCIe x4 – a to w grach przekłada się zwykle na różnicę 10–15% a nie 60–80%.

3. Optymalizacje transferu danych

Systemy eGPU i sterowniki dbają o to, żeby ograniczać przesyłanie zbędnych danych przez magistralę PCIe. Dane buforowane są i przesyłane tylko raz. Obraz może być wyświetlany bezpośrednio z karty (gdy monitor podłączony jest do wyjścia bezpośrednio na karcie w obudowie eGPU), co eliminuje dodatkowe przesyły danych przez złącze Thunderbolt lub USB4.

Transfery są priorytetyzowane i czasem kompresowane. Dzięki temu wykorzystanie dostępnej przepustowości jest znacznie bardziej efektywne niż wynikałoby to z samej prędkości złącza.

4. Wydajność zależy od scenariusza w których używana jest karta w obudowie eGPU Thunderbolt lub USB4

W przypadku gier GPU-bound spadki wydajności są niewielkie (5-10%), bo karta i tak jest zajęta obliczeniami. Efektywność działania zestawu obudowa + karta ograniczona jest jedynie mocą samej karty. 

W przypadku obliczeń GPGPU / AI różnice mogą być dużo większe. Wymiana dużych zestawów danych z CPU i pamięcią RAM jest częstsza.

Gdy podłączamy monitor bezpośrednio do laptopa (lub korzystamy tylko z wyświetlacza laptopa), nie do zewnętrznej karty umieszczonej w obudowie eGPU dodatkowy transfer obrazu przez złącze Thunderbolt lub USB4 może kosztować stratę dodatkowych 5–15% wydajności.

Porównanie liczbowe: PCIe vs Thunderbolt

Poniżej uproszczone zestawienie realnej przepustowości:

Standard, efektywna przepustowość (jedna strona) oraz wpływ na gry

  • PCIe 4.0 x16, ~32 GB/s, 100% bazowej mocy
  • PCIe 3.0 x16, ~16 GB/s, 97–100%
  • PCIe 3.0 x8, ~8 GB/s, 95–99%
  • PCIe 3.0 x4, ~4 GB/s, 85–95%
  • Thunderbolt 3/4 USB4 (40 Gb/s), ~5 GB/s, 80–90%

Jak widać, Thunderbolt i USB4 plasuje się mniej więcej na poziomie PCIe 3.0 x4, co de facto w grach oznacza umiarkowane spadki.

Podsumowanie

Mimo że Thunderbolt 3, Thunderbolt 4 lub USB4 oferują znacznie mniejszą przepustowość niż PCIe x16, w praktyce wydajność eGPU pozostaje wysoka, ponieważ:

  • większość pracy GPU odbywa się w VRAM karty,
  • gry nie potrzebują pełnej wydajności złącza PCIe,
  • stosowane są wysokowydajne optymalizacje transferu,
  • realny bottleneck w grach to najczęściej moc obliczeniowa karty, a nie interfejs.

Dlatego nawet bardzo wydajne karty podłączone przez eGPU potrafią zaoferować 80–90% swojej „desktopowej” mocy – co sprawia, że dla laptopów i mobilnych stacji roboczych to rozwiązanie ma ogromny sens.

Zapraszamy do zapoznania się z ofertą obudów i gotowych rozwiązań eGPU w ofercie Abart Pro. W ofercie posiadamy takie obudowy eGPU jak Sonnet eGPU Breakaway Box 750ex, Akitio Node Titan 650w eGPU czy też Acasis eGPU Dock 40Gb/s External Box for 1x PCIe 3.0 x16 to Thunderbolt | USB4 with USB-A 10Gb/s | bez zasilacza.

Na życzenie konfigurujemy również kompletne zestawy eGPU tj. obudowa Thunderbolt | USB4 oraz karta graficzna. 

Komentarze (0)

Brak komentarzy w tym momencie.