Qu'est-ce qui est inclus dans le prix de l'Instance ?

Le prix de notre instance GPU comprend le vCPU, la RAM nécessaire pour une performance optimale, un stockage Scratch de 1,6TB. Il n'inclut pas le Block Storage et l'IP flexible. Pour lancer l'Instance GPU L40S, nous vous recommandons fortement de provisionner un volume supplémentaire de Block Storage, car le Scratch Storage est un stockage éphémère qui disparaît lorsque vous éteignez la machine. L'objectif du Scratch Storage est d'accélérer le transfert de vos données vers le GPU. Si vous souhaitez obtenir davantage d'informations sur l'utilisation de la mémoire temporaire, cliquez sur Follow the guide En cas de doute sur le prix, utilisez la calculatrice, elle est faite pour ça !

Quelles sont les différences entre L40S-1-48G, L40S-2-48G, L40S-4-48G, L40S-8-48G ?

Il s'agit de 4 formats de la même instance intégrant le GPU NVIDIA L40S. L40S-1-48G intègre 1 GPU NVIDIA L40S, offrant une mémoire GPU de 48 Gb. L40S-2-48G intègre 2 GPU NVIDIA L40S, offrant une mémoire GPU de 2 fois 48 Gb. L40S-4-48G embarque 4 GPU NVIDIA L40S, offrant une mémoire GPU de 4 fois 48 Gb. L40S-8-48G intègre 8 GPU NVIDIA L40S, offrant une mémoire GPU de 8 fois 48 Gb.

Puis-je utiliser MIG pour tirer le meilleur parti de mon GPU ?

NVIDIA Multi-Instance GPU (MIG) est une technologie introduite par NVIDIA pour améliorer l'utilisation et la flexibilité des GPU en data center, spécialement conçus pour la virtualisation et les environnements multi-tenant. Cette fonctionnalité est disponible sur l'Instance GPU H100 PCIe mais pas sur l'Instance GPU L40S. Cependant, les utilisateurs peuvent bénéficier de la compatibilité avec Kubernetes Kapsule pour optimiser leur infrastructure. En savoir plus

Comment choisir le bon GPU pour ma charge de travail ?

De nombreux critères doivent être pris en compte pour choisir la bonne instance GPU : Exigences de la charge de travail ; Exigences en matière de performances ; Type de GPU ; Mémoire du GPU ; CPU et RAM ; Compatibilité des pilotes de GPU et des logiciels ; Mise à l'échelle. Pour plus d'informations, consultez la [documentation dédiée à ce sujet] (https://www.scaleway.com/en/docs/compute/gpu/reference-content/choosing-gpu-instance-type/)

Accueil L40S GPU Instance

Instance GPU L40S

Accélérez la prochaine génération d'applications boostées par l'IA avec l'Instance GPU L40S universelle, plus rapide que la L4 et moins chère que la H100 PCIe.

Créez votre compte Contactez-nous pour une remise

Un usage universel

L'Instance GPU L40S offre des performances inégalées pour un large éventail de tâches, notamment pour l'intelligence artificielle générative, l'inférence de LLM, l'entraînement et peaufinage de petits modèles, ainsi que pour les applications en 3D, le rendering et la vidéo.

Scalabilité rentable

À partir de 1,4 €/heure pour 1 GPU avec 48 Gb de mémoire GPU et disponible en 4 formats différents (1, 2, 4, 8 GPUs), l'Instance GPU L40S permet une mise à l'échelle rentable en fonction des besoins de charge de travail, garantissant une utilisation optimale des ressources en plus de ses capacités de haute performance.

Compatible avec K8s

Intégrez sans effort l'Instance GPU L40S dans votre infrastructure existante avec le support de Kubernetes, simplifiant le déploiement et la gestion des charges de travail en intelligence artificielle tout en conservant la scalabilité et la flexibilité.

Zones disponibles :

Paris:PAR 2

Spécificités techniques

GPU NVIDIA GPU L40S

Mémoire GPU48 GB GDDR6 (864 GB/s)

Processeur8 vCPUs AMD EPYC 7413

Fréquence du processeur2,65 Ghz

Mémoire92 GB de RAM

Type de mémoireDDR4

Bande passante réseau2,5 Gbps

Stockage1,6 TB de Scratch Storage et Block Storage (additionnel)

CoresTensor Cores 4ème génération RT Cores 3ème génération

Cas d'usage

Fine-tuning & entrainement de LMM

Utilisez les Instances GPU H100 PCIe pour l'entraînement de modèles fondamentaux de taille moyenne à grande échelle, mais exploitez les capacités de la L40S pour fine-tuner en quelques heures et entraîner en quelques jours de petits LLM.

Une infrastructure alimentée par des GPU L40S peut entraîner des modèles en quelques jours
Pour entraîner Llama 2-7B (100B tokens), cela nécessiterait 64 GPU L40S et prendrait 2,9 jours (contre 1 jour avec les GPU H100 NVlink, comme sur Nabu2023)
Affinez les modèles en quelques heures
Pour affiner Llama 2-70B SFT (1T tokens), cela nécessitera 64 GPU L40S et prendra 8,2 heures (contre 2,5 heures avec les GPU H100 NVlink, comme sur Nabu2023)

Source: Présentation produit NVIDIA L40S, octobre 2023

Construire et surveiller une infrastructure cloud flexible et sécurisée

Bénéficiez d'un écosystème cloud complet

Kubernetes Kapsule

Simple d’utilisation, Kubernetes Kapsule est entièrement intégré à notre écosystème cloud.

Load Balancer

Répartissez les charges de travail sur plusieurs serveurs à l'aide d'un Load Balancer afin de garantir une disponibilité continue et d'éviter la surcharge des serveurs.