- vGPU Software: 18.0
- Host driver: 570.124.03
- Linux guest driver: 570.124.06
- Windows guest driver: 572.60
We hebben de NVIDIA L40S en een Dell PowerEdge R760 gebruikt voor dit project.
![]()
Daarnaast heeft u een speciale licentieserver (DLS) of cloudlicentieserver (CLS) nodig om vGPU-functionaliteit op uw gasten te activeren. U kunt een snelstartgids vinden door hier te klikken.
Verifieer vervolgens dat de UEFI (BIOS)-instellingen van uw server de juiste virtualisatiefuncties inschakelen. Zoek naar VT-d of AMD-v, SR-IOV, above 4G decoding, resizable bar, en Alternative Routing ID Interpretation (ARI) instellingen, en zorg ervoor dat ze allemaal zijn ingeschakeld.
Opmerking: Mogelijk vindt u niet al deze functies in het UEFI-menu, aangezien sommige mogelijk niet aan de gebruiker worden blootgesteld.
Controleer ten slotte of u een geschikte versie van Proxmox VE gebruikt. vGPU-functionaliteit vereist minimaal pve-manager versie 8.3.4, met kernel 6.18.12-8-pve of nieuwer. U kunt de softwareversies van uw PVE-node controleren door naar het tabblad "Summary" op de gewenste server te navigeren, zoals hieronder weergegeven:
De Host met de Meeste (Proxmox Host vGPU Setup)
Nu alles klaar is, is het tijd om de Proxmox VE-server te configureren. Klik in de webinterface van uw Proxmox VE-server op de servernaam aan de linkerkant van het scherm en selecteer het tabblad "Shell". Typ dit commando in het consolevenster dat verschijnt en druk op Enter wanneer u klaar bent:
apt install pve-nvidia-vgpu-helper
Dit zorgt ervoor dat de vGPU-setup-tool op uw server wordt geïnstalleerd, waardoor deze wordt voorbereid op Proxmox vGPU-ondersteuning. Nadat de server klaar is met het installeren van het script of u informeert dat het al aanwezig is, voert u nog een commando uit om de tool uit te voeren.
pve-nvidia-vgpu-helper setup
Beantwoord "Y" op alle vragen en ga door totdat het consolevenster terugkeert en het script is voltooid. Voer een snelle herstart van de server uit door naar het tabblad "Summary" van de server te navigeren en op de knop "Reboot" te drukken, of typ het reboot-commando in de console van het tabblad "Shell" en druk op Enter.
Vervolgens moet de NVIDIA vGPU-hostdriver op de server worden geladen. Nadat de server is herstart, gebruikt u een SSH- of SCP-overdrachtstool zoals WinSCP om de hostdriver naar de node te kopiëren.
Opmerking: Als u alle stuurprogramma's samen als een gecomprimeerd (.zip) map hebt gedownload, moet u mogelijk eerst de inhoud uitpakken en het ".run"-bestand uit de map "Host_Drivers" kiezen.
Plaats het bestand in de "/home"-directory van de server en bereid u voor om de installer uit te voeren met de volgende commando's.
cd /home chown root NVIDIA-Linux-x86_64-570.124.03-vgpu-kvm.run chmod +X NVIDIA-Linux-x86_64-570.124.03-vgpu-kvm.run ./NVIDIA-Linux-x86_64-570.124.03-vgpu-kvm.run --dkms
Opmerking: Vervang "NVIDIA-Linux-x86_64-570.124.03-vgpu-kvm.run" door de daadwerkelijke naam van de gedownloade driver. U kunt het commando "ls" gebruiken om de naam van het bestand weer te geven zodra het in de map "/home" is geplaatst.
Nu de driver op de server is geïnstalleerd, zijn we nog maar een paar stappen verwijderd van het voltooien van de hostzijde van onze Proxmox vGPU-configuratie! Voordat we de GPU kunnen markeren als een apparaat dat kan worden gesplitst tussen virtuele machines, moeten we Single Root I/O Virtualization (SR-IOV) inschakelen. NVIDIA definieert deze functie als "...een technologie die een fysiek PCIe-apparaat toestaat om zichzelf meerdere keren via de PCIe-bus te presenteren. Deze technologie maakt meerdere virtuele instanties van het apparaat met aparte bronnen mogelijk." Aangezien SR-IOV een cruciaal onderdeel van de technologie is dat nodig is voor basale vGPU-functionaliteit op moderne GPU's, stelt u het in om bij het opstarten te worden ingeschakeld met het volgende commando:
systemctl enable --now pve-nvidia-sriov@ALL.service
Ten slotte kunnen we de bronnen van de GPU in kaart brengen om ze netjes te verdelen over VM's. Klik in de webinterface van de Proxmox VE-server op "Datacenter" in de linkerbovenhoek en scrol omlaag om het tabblad "Resource Mappings" te selecteren.
Klik op de knop "Add" onder het gedeelte "PCI Devices" van de pagina en vul het veld "Name:" in het volgende venster in met de naam die de te mappen GPU beschrijft.
Vervolgens vinkt u het vakje "Use with Mediated Devices" aan en zorgt u ervoor dat het "Mapping on Node"-dropdownmenu de server met de te mappen GPU bevat. Scrol omlaag door de lijst met apparaten en bevestig dat alle apparaat-ID's "NVIDIA Corporation" in de kolom "Vendor" hebben staan. Als dit waar is, klikt u op het selectievakje linksboven in de tabel om alle apparaten te selecteren; anders selecteert u alleen de apparaten met "NVIDIA Corporation" als leverancier.
Opmerking: Als er meerdere GPU's in uw systeem zijn geïnstalleerd, kunt u het commando "lspci" in het tabblad "Shell" op de gewenste server gebruiken om de ID's te bepalen die bij elke kaart horen.
Wanneer u klaar bent met het selecteren van het apparaat, klikt u op de knop "Create" rechtsonder in het pop-upvenster om uw selectie te bevestigen. Uw NVIDIA GPU is nu klaar om te worden opgesplitst in vGPU's voor de gasten van uw Proxmox VE-server!
De Gasten Bedienen (vGPU's Toewijzen aan Virtuele Machines)
De stukjes liggen allemaal klaar om te beginnen met het toewijzen en gebruiken van vGPU's op onze virtuele machines. Begin met het aanmaken van een nieuwe virtuele machine, zoals gewoonlijk, of door een bestaande VM te gebruiken. Voor onze demonstratie gebruiken we een Windows Server 2025 virtuele machine.
In de webinterface van de Proxmox VE-server, schakelt u de virtuele machine uit met een methode naar keuze (noVNC-console, gast-power-menu, etc.) en klikt u op het tabblad "Hardware" van de gast.
Selecteer in het dropdownmenu dat verschijnt na het klikken op de knop "Add" een "PCI Device."
Selecteer in het pop-upvenster "Add: PCI Device" de naam die u aan de resource-gemapte GPU hebt toegewezen in het veld "Device:".
Klik vervolgens op het veld "MDev Type:" en observeer de lijst met gepresenteerde opties voor het type gemedieerde apparaten. U zult merken dat elke keuze een nummer en letteraanduiding heeft. Het nummer vertegenwoordigt de hoeveelheid VRAM die aan de gast is toegewezen (in gigabytes), terwijl de "A", "B" en "Q" verwijzen naar het gebruiksscenario van de vGPU:
- Q – Virtuele werkstations met RTX Enterprise Drivers (vereist RTX vWS-licentie)
- B – Virtuele desktops (vereist NVIDIA Virtual PC-licentie of RTX vWS-licentie)
- A – Applicatieoplossingen (vereist een NVIDIA Virtual Applications-licentie)
Opmerking: U kunt hier meer lezen over de verschillende vGPU-profielen en hun vereiste licenties.
Voor deze demonstratie hebben we het profiel "NVIDIA L40S-12Q" gebruikt. Nadat u het gewenste type gemedieerde apparaat hebt geselecteerd, voltooit u door het selectievakje "PCI-Express" aan te vinken en op de blauwe knop "Add" te klikken.
De VM heeft nu een vGPU toegewezen gekregen, maar we moeten nog steeds de gastdriver en een licentietoken installeren om aan de slag te gaan. U kunt nu de virtuele machine inschakelen en inloggen.
Na het inloggen, brengt u de eerder verkregen NVIDIA vGPU-gastdriver van het licentieportaal naar de VM op een manier naar keuze (SMB, SCP, directe download, etc.). Als alternatief kunt u een virtueel CD-ROM-bestand (.iso) met de driver aanmaken en uploaden naar de opslag van uw PVE-server met software zoals ImgBurn om tegelijkertijd veel vGPU-geschikte gasten te implementeren.
Voer het driverinstallatiebestand uit door op de uitvoerbare bestanden te dubbelklikken en volg de instructies op het installatiemenu dat verschijnt.
Pak de driver uit naar de standaardlocatie in het veld "Extraction path:" en kies de "Express"-installatieoptie wanneer daarom wordt gevraagd.
Zodra de driverinstallatie is voltooid, klikt u op de knop "CLOSE" om het menu te sluiten.
Vervolgens moeten we de vGPU-licentie op de gast activeren. Activeringsmethoden kunnen aanzienlijk verschillen, afhankelijk van of u een dedicated license server (DLS) of cloud license server (CLS) selecteert, en uw besturingssysteem. Volg de Quick Start Guide van NVIDIA's License System en de Client Licensing User Guide voor gedetailleerde stappen voor het activeren van clients voor uw specifieke setup.
We hebben een cloudlicentieserver gebruikt en een tokenbestand ontvangen om op gasten te plaatsen voor activering. Verplaats dit bestand naar de gast en kopieer het naar de map "C:Program FilesNVIDIA CorporationvGPU LicensingClientConfigToken".
Vervolgens is een herstart van de gast noodzakelijk om het activeringsproces te voltooien.
Na het volgen van alle host- en gastconfiguratiestappen die hier worden beschreven, zou u klaar moeten zijn om programma's en applicaties te draaien die een GPU vereisen. Vergeet niet om Remote Desktop Protocol (RDP) in te schakelen of uw favoriete remote desktopsoftware op uw gasten te installeren na de herstart om te genieten van GPU-versnelde remote viewing!
De Motor Laten Draaien (Proxmox vGPU Uitproberen)
Nu we enkele virtuele servers met virtuele GPU's hebben, laten we ze uitproberen! Elk van onze VM's is geconfigureerd met 8 vastgepinde Intel Xeon Platinum 8580 vCPU's (4 hyperthreaded cores), 32 gigabyte DDR5 4800 MT/s registered ECC RAM, en het NVIDIA L40S-12Q (virtuele workstation) vGPU-profiel met 12 gigabyte VRAM. U kunt de volledige hardwareconfiguratie van de virtuele machines hieronder zien:
Cinebench 2024
Gebaseerd op Maxon's Cinema 4D modellering- en animatiesoftware, biedt Cinebench 2024 een interessante en objectieve kijk op renderingprestaties op vGPU's. Laten we de volledige kracht van de L40S in zijn "48Q" (alle 48 gigabyte VRAM) profiel vergelijken met één virtuele machine versus vier VM's die het "12Q"-profiel draaien.
Hoewel het niet veel zin heeft om één virtuele machine de volledige L40S te laten opslokken, kunnen we zien dat de prestaties indrukwekkend zijn met 21.147 punten in de single-pass GPU-benchmark. Het opsplitsen van de GPU in vier delen toont echter de impact van NVIDIA's time-slicing benadering voor het delen van de CUDA-cores van de GPU, met individuele scores variërend van 2.514 tot 2.567 wanneer de benchmark tegelijkertijd op alle VM's werd uitgevoerd.
Het opnieuw uitvoeren van de test op een enkele virtuele machine met het "12Q"-profiel, en de andere drie VM's inactief, verhoogt de score terug naar 15.133. Het is niet precies een terugkeer naar de score van de volledige GPU, maar het is nog steeds respectabel voor een gepartitioneerde vGPU.
Blender Benchmarks
Laten we verdergaan met nog een paar renderingbenchmarks met Blender. In lijn met vergelijkbare trends als Cinebench 2024, resulteert het opsplitsen van de GPU in vier delen in dramatisch lagere totale prestaties in vergelijking met een enkele virtuele machine die dezelfde workload in hetzelfde profiel draait.
Zoals gedemonstreerd in de Monster benchmark, betekent het delen van de rekenkracht van de GPU door slechts vier VM's dat de individuele renderprestaties slechts 8% van een enkele VM met hetzelfde profiel kunnen zijn. We hebben echter waargenomen dat één virtuele machine een flinke voorsprong nam op de anderen - tot 2,4 keer de score van de slechtst presterende.
De Junkshop en Classroom benchmarks vertellen vergelijkbare verhalen, met grote prestatiedips voor drie van de vier VM's en één gast die een veel hogere score behaalt dan de anderen.
Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Global Strategy Director
WhatsApp / WeChat: +86 13426366826
E-mail: yangyd@qianxingdata.com
Website: www.qianxingdata.com/www.storagesserver.com
Zakelijke focus:
ICT Productdistributie/Systeemintegratie & Services/Infrastructuuroplossingen
Met meer dan 20 jaar ervaring in IT-distributie werken we samen met toonaangevende wereldwijde merken om betrouwbare producten en professionele diensten te leveren.
"Technologie gebruiken om een intelligente wereld te bouwen" Uw Betrouwbare ICT Product Service Provider!



