Instance GPU L40S

Accélérez la prochaine génération d'applications boostées par l'IA avec l'Instance GPU L40S universelle, plus rapide que la L4 et moins chère que la H100 PCIe.

Un usage universel

L'Instance GPU L40S offre des performances inégalées pour un large éventail de tâches, notamment pour l'intelligence artificielle générative, l'inférence de LLM, l'entraînement et peaufinage de petits modèles, ainsi que pour les applications en 3D, le rendering et la vidéo.

Scalabilité rentable

À partir de 1,4 €/heure pour 1 GPU avec 48 Gb de mémoire GPU et disponible en 4 formats différents (1, 2, 4, 8 GPUs), l'Instance GPU L40S permet une mise à l'échelle rentable en fonction des besoins de charge de travail, garantissant une utilisation optimale des ressources en plus de ses capacités de haute performance.

Compatible avec K8s

Intégrez sans effort l'Instance GPU L40S dans votre infrastructure existante avec le support de Kubernetes, simplifiant le déploiement et la gestion des charges de travail en intelligence artificielle tout en conservant la scalabilité et la flexibilité.

L40S GPU Spécificités techniques

gpu
GPU
NVIDIA L40S GPU
gpu_memory
Mémoire GPU
48GB GDDR6 (864GB/s)
processor
Processeur
8 vCPUs AMD EPYC 7413
processor_frequency
Fréquence du processeur
2.65 Ghz
memory
Mémoire
96GB of RAM
memory_type
Type de mémoire
DDR4
bandwidth
Bande passante réseau
2.5 Gbps
storage
Stockage
1.6TB of Scratch Storage and additional Block Storage
threads_cores
Cores
Tensor Cores 4th generation RT Cores 3rd generation

Cas d'usage pour L40S GPU Instance

Fine-tuning & entrainement de LMM

Utilisez les Instances GPU H100 PCIe pour l'entraînement de modèles fondamentaux de taille moyenne à grande échelle, mais exploitez les capacités de la L40S pour fine-tuner en quelques heures et entraîner en quelques jours de petits LLM.

Une infrastructure alimentée par des GPU L40S peut entraîner des modèles en quelques jours
Pour entraîner Llama 2-7B (100B tokens), cela nécessiterait 64 GPU L40S et prendrait 2,9 jours (contre 1 jour avec les GPU H100 NVlink, comme sur Nabu2023)
Affinez les modèles en quelques heures
Pour affiner Llama 2-70B SFT (1T tokens), cela nécessitera 64 GPU L40S et prendra 8,2 heures (contre 2,5 heures avec les GPU H100 NVlink, comme sur Nabu2023)

Source: Présentation produit NVIDIA L40S, octobre 2023

"Nous utilisons une instance L40S, et c'est une alternative fantastique à la H100 PCIe compte tenu du rapport qualité-prix et de la vitesse.",
Wilson Wongso Machine Learning Engineer chez Bookbot

Essayez-la aujourd'hui

Estimez votre coût

Choisissez votre forfait

Coût estimé

Option and value	Price
ZoneParis 2
Instance1x	0€
Volume10GB	0€
IPv4 flexibleNon	0€

Testez le GPU L40S aujourd'hui

Faites évoluer votre infrastructure sans effort

Choisissez le bon format

Avec quatre formats flexibles, dont les options 1, 2, 4 et 8 GPU, vous pouvez désormais facilement faire évoluer votre infrastructure en fonction de vos besoins spécifiques.

Nom de l'Instance	Nombre de GPU	TFLOPS FP16 Tensor Cores	VRAM	prix par heure	prix par minute
L40S-1-48G	1 NVIDIA L40S GPU	362 TFLOPS	48 GB	1,4€/hour	0,0235€/min
L40S-2-48G	2 NVIDIA L40S GPUs	724 TFLOPS	2x 48 GB	2,8€/hour	0,047€/min
L40S-4-48G	4 NVIDIA L40S GPUs	1448 TFLOPS	4x 48 GB	5,6€/hour	0,094€/min
L40S-8-48G	8 NVIDIA L40S GPUs	2896 TFLOPS	8x 48GB	11,2€/hour	0,188€/min

Construire et surveiller une infrastructure cloud flexible et sécurisée

Innovation verte : 50 % d’énergie en moins, 100 % renouvelable
DC5 est l'un des centres de données les plus écologiques d'Europe, entièrement alimenté par de l'énergie éolienne et hydraulique renouvelable (certifiée GO), avec un système de refroidissement ultra-efficace utilisant la ventilation directe et le refroidissement adiabatique. Avec un PUE de 1,16 (vs. 1,55 en moyenne dans l'industrie), il réduit la consommation d'énergie de 30 à 50 % par rapport aux centres de données traditionnels.
Découvrez les engagements

Bénéficiez d'un écosystème cloud complet

Kubernetes Kapsule

Simple d’utilisation, Kubernetes Kapsule est entièrement intégré à notre écosystème cloud.

Load Balancer

Répartissez les charges de travail sur plusieurs serveurs à l'aide d'un Load Balancer afin de garantir une disponibilité continue et d'éviter la surcharge des serveurs.

Virtual Private Cloud

Sécurisez vos ressources cloud facilement sur un réseau privé régional résilient

Try the L40S GPU Instance now

Foire aux questions

Qu'est-ce qui est inclus dans le prix de l'Instance ?

Le prix de notre instance GPU comprend le vCPU, la RAM nécessaire pour une performance optimale, un stockage Scratch de 1,6TB. Il n'inclut pas le Block Storage et l'IP flexible.
Pour lancer l'Instance GPU L40S, nous vous recommandons fortement de provisionner un volume supplémentaire de Block Storage, car le Scratch Storage est un stockage éphémère qui disparaît lorsque vous éteignez la machine. L'objectif du Scratch Storage est d'accélérer le transfert de vos données vers le GPU.
Si vous souhaitez obtenir davantage d'informations sur l'utilisation de la mémoire temporaire, cliquez sur Follow the guide
En cas de doute sur le prix, utilisez la calculatrice, elle est faite pour ça !

Quelles sont les différences entre L40S-1-48G, L40S-2-48G, L40S-4-48G, L40S-8-48G ?

Il s'agit de 4 formats de la même instance intégrant le GPU NVIDIA L40S.

L40S-1-48G intègre 1 GPU NVIDIA L40S, offrant une mémoire GPU de 48 Gb.
L40S-2-48G intègre 2 GPU NVIDIA L40S, offrant une mémoire GPU de 2 fois 48 Gb.
L40S-4-48G embarque 4 GPU NVIDIA L40S, offrant une mémoire GPU de 4 fois 48 Gb.
L40S-8-48G intègre 8 GPU NVIDIA L40S, offrant une mémoire GPU de 8 fois 48 Gb.

Puis-je utiliser MIG pour tirer le meilleur parti de mon GPU ?

NVIDIA Multi-Instance GPU (MIG) est une technologie introduite par NVIDIA pour améliorer l'utilisation et la flexibilité des GPU en data center, spécialement conçus pour la virtualisation et les environnements multi-tenant. Cette fonctionnalité est disponible sur l'Instance GPU H100 PCIe mais pas sur l'Instance GPU L40S. Cependant, les utilisateurs peuvent bénéficier de la compatibilité avec Kubernetes Kapsule pour optimiser leur infrastructure.

Comment choisir le bon GPU pour ma charge de travail ?

De nombreux critères doivent être pris en compte pour choisir la bonne instance GPU :

Exigences de la charge de travail ;
Exigences en matière de performances ;
Type de GPU ;
Mémoire du GPU ;
CPU et RAM ;
Compatibilité des pilotes de GPU et des logiciels ;
Mise à l'échelle.

Pour plus d'informations, consultez la documentation dédiée à ce sujet

Instance GPU L40S

Un usage universel

Scalabilité rentable

Compatible avec K8s

Cas d'usage pour L40S GPU Instance

Fine-tuning & entrainement de LMM

Accélérez l'inférence de Llama 2-7B

Une expérience graphique hors du commun

Estimez votre coût

Choisissez votre forfait

Coût estimé

Faites évoluer votre infrastructure sans effort

Construire et surveiller une infrastructure cloud flexible et sécurisée

Innovation verte : 50 % d’énergie en moins, 100 % renouvelable

Bénéficiez d'un écosystème cloud complet

Kubernetes Kapsule

Load Balancer

Virtual Private Cloud

Foire aux questions

Qu'est-ce qui est inclus dans le prix de l'Instance ?

Quelles sont les différences entre L40S-1-48G, L40S-2-48G, L40S-4-48G, L40S-8-48G ?

Puis-je utiliser MIG pour tirer le meilleur parti de mon GPU ?

Comment choisir le bon GPU pour ma charge de travail ?