Forstå PCIe-baner: undgå at GPU’en deler båndbredde
Har du netop brugt en mindre formue på det nyeste grafikkort, men oplever stadig uventede hak i billedet eller lavere fps end anmeldelserne lover? Du er langt fra den eneste
I mange systemer er problemet nemlig ikke selve GPU’en - det er de PCIe-baner, den skal dele med andre sultne enheder.
PCI Express fungerer som computerens motorvej: jo flere baner og jo højere generation, desto større båndbredde. Alligevel ser vi alt for ofte toptunede grafikkort, der pludselig er tvunget ned i et x8-spor, fordi et ekstra M.2-drev, et lydkort eller en Wi-Fi-controller kaprer vejen. Resultatet? Din GPU får færre "vognbaner" og tempoet daler - præcis når du forventer maksimal ydelse.
I denne artikel dykker vi ned i, hvordan banerne fordeles fra CPU og chipset, hvorfor bundkortproducenter jonglerer med switches og bifurcation, og - vigtigst af alt - hvordan du sikrer, at din dyre GPU aldrig igen må dele båndbredde med resten af hardware-parken.
Følg med, når vi på IT Forum Danmark afmystificerer alt fra Gen3 vs. Gen5 til block-diagrammer og BIOS-tricks. Efter læsningen står du tilbage med konkrete tjeklister og værktøjer til at afsløre - og eliminere - enhver skjult flaskehals i dit system.
PCIe-baner forklaret: generationer, bredder og hvor banerne kommer fra
PCI Express (PCIe) er det højeffektive, serielle bus-system der forbinder alt fra grafikkort til SSD’er i en moderne pc. For at forstå hvorfor nogle enheder stjæler båndbredde fra andre, skal vi først have styr på tre grundbegreber: generationer, linkbredder og hvor banerne egentlig kommer fra.
Generationer: Hastighed pr. Bane
| Generation | Signal-hastighed | Teoretisk båndbredde pr. bane (fuld-duplex) |
|---|---|---|
| PCIe 3.0 | 8,0 GT/s | ~1 GB/s op + ~1 GB/s ned |
| PCIe 4.0 | 16,0 GT/s | ~2 GB/s op + ~2 GB/s ned |
| PCIe 5.0 | 32,0 GT/s | ~4 GB/s op + ~4 GB/s ned |
Fuld-duplex betyder, at der er lige så meget båndbredde i retningen til enheden (downlink) som fra enheden (uplink); et x16-slot i Gen 4 kan derfor flytte cirka 32 GB/s hver vej på samme tid.
Linkbredder: X1, x4, x8, x16
- Et link er en samling af én eller flere baner (lanes).
- Et x1-link bruger én bane, et x4 bruger fire osv.
- Under link-negotiation forhandler enheden og bundkortet sig frem til den højeste fælles generation og bredde. Sætter du et ældre Gen 3-kort i et Gen 5-slot, falder både hastighed og evt. bredde til hvad kortet understøtter.
Hvor kommer banerne fra?
En moderne desktop-platform har to primære kilder:
-
CPU-baner
- Direkte forbundet til processoren - lavest latenstid og fuld båndbredde.
- Mainstream CPU’er (Intel Core, AMD Ryzen) giver typisk 16 PCIe-baner til grafikkort + 4 baner til en NVMe-SSD.
- HEDT/Workstation CPU’er (Threadripper, Xeon-W) kan tilbyde 48+ baner.
-
Chipset-baner
- Fysisk terminerer på bundkortets PCH (Intel) eller Promontory/FP6 (AMD).
- Alle disse enheder dele et enkelt link til CPU’en: DMI (Intel) eller IF-Link (AMD).
- Det link svarer groft til x4 PCIe Gen 4 på de nyeste platforme (≈8 GB/s hver vej). Alle USB-porte, SATA-kontrollere, lydkort, ekstra M.2-pladser osv. skiftes igennem denne “motorvej”.
Pointen er, at CPU-baner er dedikerede, mens chipset-baner er delt. Det er derfor GPU’en altid bør bo på et CPU-koblet slot.
Switche og bifurcation: Flere muligheder (og faldgruber)
-
PCIe-switch / retimer (PLX, Broadcom, Asmedia)
En aktiv chip, der kloner én indgående forbindelse til flere udgående. Effektivt giver den flere slots adgang til CPU-baner uden at låse båndbredden pr. slot. Du ser dem oftest på dyre Z790- eller X670E-bundkort med mange x16-slots og M.2-porte. -
Bifurcation
En passiv opdeling af et x16-link til fx 2 × x8 eller 4 × x4. Kræver at CPU og BIOS understøtter det. Uundværligt i servere og ekstern GPU-bokse, men kan koste GPU’en halvdelen af dens baner hvis man ikke passer på.
At kende forskellen på switch og bifurcation er centralt: switches bevarer x16 til GPU’en og fordeler trafikken smartere, mens bifurcation fysisk splitter banerne op.
Med disse byggeklodser på plads er du klar til at se, hvordan producenternes bundkortlayout fordeler sporene - og hvordan du undgår at din GPU må nøjes med mindre end dens maksimale x16-link.
Sådan fordeler bundkort baner: slots, M.2 og delte ressourcer
Inden du begynder at flytte rundt på dine udvidelseskort, er det afgørende at forstå, hvor hver enkelt PCIe-bane kommer fra. På moderne bundkort findes der nemlig to overordnede “kilder” til baner:
- CPU-baner - typisk de hurtigste og lavest latent-se.
- Chipset-baner - fødes via et samlet uplink (DMI hos Intel, IF-link hos AMD) og skal deles af alt, der ikke er forbundet direkte til CPU’en.
1. Mainstream-platforme: Lga1700 (intel) og am4/am5 (amd)
| Platform | CPU-baner | Typisk fordeling på bundkortet |
|---|---|---|
| Intel 12.-14. gen (LGA1700) | 16 × PCIe 5.0 + 4 × PCIe 4.0 (til M.2 NVMe) |
|
| AMD Ryzen 5000/7000 (AM4/AM5) | 16 × PCIe 4.0/5.0 + 4 × PCIe 4.0 (til M.2 NVMe) |
|
På disse platforme er grundreglen simpel: GPU’en vil altid elske den øverste x16-slot. Smider du et andet kort i den sekundære x16-slot, sker der automatisk link-bifurcation til x8/x8. Det er sjældent et problem for ydelsen (PCIe 4.0 ×8 ≈ PCIe 3.0 ×16), men det er værd at notere, hvis du også befolker flere M.2-drev eller tilføjer en Thunderbolt-controller, der i stedet tager baner fra chipsettet - og dermed DMI/IF-uplinket.
2. Hedt/workstation: Trx40, wrx80, lga2066, w790 m.fl.
Her får du markant flere baner direkte fra CPU’en, hvilket fjerner mange flaskehalse:
- Threadripper Pro (WRX80) - op til 128 PCIe 4.0-baner.
- Intel Sapphire Rapids (W-3400/W-2400) - 64/112 PCIe 5.0-baner.
Resultatet er flere fulde x16-slots og M.2-porte, der ikke deles. Ofte sidder der dog stadig en switch (f.eks. Broadcom/PLX) i midten, så fire fysiske x16-slots kan konkurrere om 32 baner. Læs derfor altid det med småt:
“Any combination of slots 2/3/4 populated will operate at x16/x8/x8.” - Eksempel fra ASUS Pro WS WRX80-E manualen
3. Sådan tolker du bundkortets blokdiagram
- Find CPU-banerne - de løber ubeskåret til én eller to x16-slots og den primære M.2.
- Identificér chipset-uplinket - oftest en enkelt lodret linje mærket “DMI 4.0 ×4” eller “PCIe 4.0 ×4”. Alt der hænger nedenunder, deler båndbredden.
-
Læg mærke til ”shared with” noter i manualens tabel.
- “M2_2 shares bandwidth with SATA 6G_56.” - Isættes der NVMe, forsvinder to SATA-porte.
- “PCIe x1_2 disabled when PCIEX16_2 runs at x4.” - Lille x1-slot bliver tom, hvis du udnytter ekstra baner på x16-slot 2.
- Se efter clock-generator(er) og switches - et rektangel benævnt “ASM1480 mux” fortæller, at banerne omdirigeres dynamisk, mens “PEX8747” afslører en ægte PCIe-switch med ekstra latency, men fuld båndbredde.
4. Mini-itx & micro-atx: Kompromisernes kunst
Små bundkort har typisk:
- Én fysisk x16-slot (CPU) - bruger du en riser, så kvaliteten er kritisk.
- 1-2 M.2-porte - ofte delt med de få chipset-baner, hvilket kan deaktivere USB- eller SATA-porte.
Her er det ekstra vigtigt at tjekke manualen; et enkelt Wi-Fi-kort i M.2 Key-E kan fjerne halvdelen af dine USB-porte, hvis de deler samme banepool.
5. Huskeliste før du bestykker bundkortet
- Sæt GPU’en i første x16-slot - intet andet sted leverer fuld CPU-båndbredde.
- Placér dit hurtigste NVMe-drev i CPU-bundne M.2-slot (typisk M.2_1).
- Undgå samtidige højtydende enheder på chipsettet (fx capture-kort + 10 GbE NIC + to NVMe-drev) - DMI ×4 er hurtigt mættet.
- Overvej et bundkort med indbygget PCIe-switch, hvis du har mange add-in-kort.
Med ovenstående rettesnor kan du læse ethvert blokdiagram og straks se, hvor flaskehalsen opstår - og vigtigst: sikre, at din GPU aldrig skal deles om banen.
Undgå at GPU’en deler båndbredde: praktiske regler og BIOS-indstillinger
Det kræver ikke dyre værktøjer at sikre, at dit grafikkort får al den PCIe-båndbredde, det er berettiget til - kun lidt planlægning og et kig i BIOS. Følg retningslinjerne herunder, så havner du ikke i den klassiske fælde, hvor GPU’en pludselig kører på et halvt (eller værre) link.
5 hurtige tommelfingerregler
-
Anbring altid GPU’en i den primære x16-slot
På 99 % af alle ATX-bundkort er øverste fuldlængde-slot direkte forbundet til CPU’en med 16 baner. Andre slots kan se identiske ud fysisk, men styres ofte af chipset-baner eller deler ressourcer. -
Hold øje med delte M.2-porte
Mange moderne bundkort kobler én eller flere M.2-pladser til de samme baner, som den sekundære PCIe-slot bruger. Sætter du en NVMe-SSD i én af disse porte, kan GPU’en blive nedforhandlet til x8. -
ITX og mATX er kompromis-platforme
Små printkort har færre routed baner. Selv hvis der kun er én fuldlængde-slot, kan en ekstra M.2 eller 10 GbE-controller tappe banerne, så grafikkortet kører Gen4 x8 i stedet for x16. -
Tjek manualens blokdiagram
Producenter tegner tydeligt, hvilke porte der deler “Lane Switch” eller “Mux”. Hvis to porte er knyttet til samme PCH-lane-gruppe, bør du kun bruge én af dem, hvis maksimal GPU-ydelse er målet. -
Planlæg omkring fremtidigt udstyr
Capture-kort, Thunderbolt-udvidelser og high-end netværk kan nemt stjæle baner. Overvej derfor bundkort med indbyggede PCIe-switches, hvis du ved, at du skal bruge mange enheder.
Vigtige bios-indstillinger
| Indstilling | Hvad gør den? | Når du bør ændre den |
|---|---|---|
| PCIe Link Speed / Gen-mode | Tvinger slotten til Gen3, Gen4 eller Gen5 i stedet for Auto. | Sæt til højeste understøttede stabile hastighed, hvis automatisk forhandling fejler (ses som x16 @ 8 GT/s i GPU-Z). |
| Bifurcation | Deler et x16-link op i 2× x8 eller 4× x4. | Lad stå på x16 eller Disabled, medmindre du kører dual-GPU eller en AIC-SSD-adapter. |
| Unused SATA/USB Controller Disable | Frigør PCH-baner ved at slukke for chips, du ikke bruger. | Aktiver, hvis du ikke har behov for ældre SATA-porte eller USB 2.0-hubs. |
| “Above 4G Decoding” & Resizable BAR | Indvirker ikke direkte på båndbredde, men sikrer korrekt adresserum. | Lad være slået til for moderne GPU’er - ellers kan linket droppe til Gen3 under POST. |
Eksempel: Z690-atx kontra b650-itx
På et typisk Z690-ATX får du:
- CPU → PCIe Gen5 x16 (slot 1) - fuld båndbredde til GPU.
- CPU → PCIe Gen4 x4 (M.2_1) - ingen deling med slot 1.
- PCH-baner til øvrige slots og M.2 - disse kan deles indbyrdes, men ikke med GPU.
På et B650-ITX:
- CPU → PCIe Gen4 x16 (slot 1) - men samme link bliver halveret til x8, hvis du sætter en SSD i M.2_2 (også CPU-forbundet).
Moral: Læs manualen før køb, og vælg bundkort, hvor GPU-slotten er elektrisk isoleret.
Når du har brug for flere enheder end cpu’en kan levere
Skal du både have high-end GPU, dobbelt capture-kort og to Gen4-NVMe på fuld hastighed, er en PCIe-switch (Broadcom/PLX) vejen frem. Switchen fungerer som en intern hub og multiplexer baner fra CPU’en til flere nedstrøms-porte uden at reducere GPU’ens link. Kig efter:
- Workstation- eller HEDT-bundkort (WRX80/Xeon-W/X299) med indbygget switch.
- Udvidelseskort som ASUS Hyper M.2 x16 Gen4 med egen PLX til flere SSD’er.
Med den viden kan du placere dine enheder korrekt, trimme BIOS og sikre, at grafikkortet altid har fri motorvej - uanset hvor mange gadgets du ellers kaster i maskinen.
Verificér linkhastighed og fejlfinding af flaskehalse
Det første skridt er at bekræfte, hvor mange baner og hvilken generation din GPU rent faktisk kører med.
- GPU-Z
- Åbn GPU-Z og kig under feltet Bus Interface.
Eksempel:PCIe x16 4.0 @ x8 4.0betyder, at kortet er i en x16-slot, men aktuelt kun får 8 baner. - Klik på den lille “>”-knap (render test) for at belaste kortet. Under load bør linket skifte fra fx
@ x1 4.0til sin maksimale forhandlende hastighed.
- Åbn GPU-Z og kig under feltet Bus Interface.
- HWiNFO
- I Sensors vises PCIe Link Speed og Current Link Width. Hold øje med værdien mens du kører en 3D-belastning (spil, benchmark eller GPU-Zs render-test).
2. Benchmark forskellen mellem x16 og x8
De fleste moderne GPU’er taber kun 1-3 % i gennemsnitlig FPS ved at gå fra x16 Gen4 til x8 Gen4, men i PCIe-tunge scenarier (f.eks. 4K textures, compute-workloads, DirectStorage) kan forskellen være større.
| Workload | x16 Gen4 | x8 Gen4 | Forskel |
|---|---|---|---|
| 3DMark Time Spy Graphics | 100 % | 97 % | -3 % |
| 4K Ray-Tracing Titel | 100 % | 94 % | -6 % |
| Compute/AI (Tensor) | 100 % | 90 % | -10 % |
Hvis du ser tocifrede fald i spil, der normalt ikke er begrænset af GPU’en, har du sandsynligvis et båndbreddeproblem.
3. Typiske symptomer på båndbreddeflasker
- Uforklarlig micro-stuttering eller frame time spikes trods lav GPU-udnyttelse.
- Lavere minimums-FPS og ustabile frametimes i scener med tung asset-streaming.
- I HWiNFO kan GPU Busy være lav, mens CPU’en ikke er begrænset.
4. Fejlfinding: Hvor forsvinder banerne?
-
Tjek fysisk placering
GPU skal sidde i primær CPU-forbundne x16-slot (typisk øverste). På mini-ITX deler den ofte baner med den eneste M.2. -
Riser-kabler og vertikale brackets
Dårlige eller forældede Gen3-risers kan tvinge linket ned til Gen3 eller x8. Test altid GPU’en direkte i slotten. -
BIOS-indstillinger
- Sæt PCIe Link Speed til Gen4/Gen5 manuelt.
- Deaktiver ubrugte SATA-/USB-/Onboard NIC-controllere der optager chipset-baner på ældre platforme.
- Sørg for, at Bifurcation er Disabled for den slot, hvis du ikke bruger dobbelt-kort eller NVMe-adaptere.
-
Firmware og drivere
Opdater bundkort-BIOS og chipset-driver. Nye AGESA- eller ME-firmwares retter ofte PCIe-kompatibilitet. -
Kortlæg “delt” infrastruktur
Brug manualens blokdiagram:- Fjern NVMe-drev ét ad gangen og tjek GPU-linket igen.
- Flyt evt. capture-/lyd-kort til anden slot eller USB-enhed.
5. Slutkontrol
Når GPU-Z viser x16 ved fuld belastning og dine benchmarks ligger på forventet niveau uden stuttering, er flaskehalsen fjernet.
Indholdsfortegnelse
- PCIe-baner forklaret: generationer, bredder og hvor banerne kommer fra
- Generationer: Hastighed pr. Bane
- Linkbredder: X1, x4, x8, x16
- Hvor kommer banerne fra?
- Switche og bifurcation: Flere muligheder (og faldgruber)
- Sådan fordeler bundkort baner: slots, M.2 og delte ressourcer
- 1. Mainstream-platforme: Lga1700 (intel) og am4/am5 (amd)
- 2. Hedt/workstation: Trx40, wrx80, lga2066, w790 m.fl.
- 3. Sådan tolker du bundkortets blokdiagram
- 4. Mini-itx & micro-atx: Kompromisernes kunst
- 5. Huskeliste før du bestykker bundkortet
- Undgå at GPU’en deler båndbredde: praktiske regler og BIOS-indstillinger
- 5 hurtige tommelfingerregler
- Vigtige bios-indstillinger
- Eksempel: Z690-atx kontra b650-itx
- Når du har brug for flere enheder end cpu’en kan levere
- Verificér linkhastighed og fejlfinding af flaskehalse