H100 PCIe GPU Instance

Accélérez l'entraînement de vos modèles et de vos inférences avec la puce IA la plus haut de gamme du marché !

Affinez des modèles tels que LLaMA 2

Optimisez les Transformers Models et les LLM à travers un traitement efficace, et accélerez les entraînements de modèles plus importants grâce à la technologie de pointe Tensor Cores de 4ᵉ génération et au dernier format de données 8 bits.

Accélérez jusqu'à 30 fois le traitement de l'inférence

Augmentez la vitesse de traitement de vos modèles grâce au Transformer Engine, 30 fois plus rapide pour l'inférence de l'IA et les nouveaux formats de données.

Optimisez la capacité des GPU en fonction de vos besoins

Grâce à la deuxième génération de Secure MIG (GPU multi-instances), vous pouvez partitionner le GPU en instances isolées de taille adéquate afin de maximiser l'utilisation des tâches multi-GPU, des plus petites aux plus grandes.

Innovation verte : 50 % d’énergie en moins, 100 % renouvelable

DC5 PAR2 Paris

DC5 est l'un des centres de données les plus écologiques d'Europe, entièrement alimenté par de l'énergie éolienne et hydraulique renouvelable (certifiée GO), avec un système de refroidissement ultra-efficace utilisant la ventilation directe et le refroidissement adiabatique. Avec un PUE de 1,16 (vs. 1,55 en moyenne dans l'industrie), il réduit la consommation d'énergie de 30 à 50 % par rapport aux centres de données traditionnels.

WAW2 Varsovie

WAW2 est alimenté à 100 % par de l'énergie éolienne (certifiée GO) et utilise une combinaison de refroidissement direct, de free chilling, de systèmes d'immersion et de climatisation pour optimiser le refroidissement des systèmes. Avec un PUE de 1,32 — inférieur à la moyenne du secteur — il minimise la consommation d'énergie pour une efficacité maximale.

Découvrez les engagements environnementaux de Scaleway

GPU H100 PCIe spécifications techniques

gpu
GPU
NVIDIA H100 PCIe Tensor Core
memory
Mémoire GPU
80 Go HBM2e
processor
Processeur
24 vCPU AMD Epyc Zen 4
processor_frequency
Fréquence du processeur
2,7 Ghz
memory
Mémoire
240 Go de RAM
memory_type
Type de mémoire
DDR5
bandwidth
Bande passante
10 Gbps
storage
Stockage
Block Storage pour le démarrage et 3 To de stockage Scratch NVMe

Optimisez votre budget pour l'instance GPU PCIe H100 en vous engageant à l'avance.

Discutez avec un expert

De nombreux cas d’usages

Natural Language Processing

Comprend, interprète et génère du langage humain de manière à le rendre compréhensible et pertinent en fonction du contexte.
Grâce à des modèles et des algorithmes spécialisés dans :

Text classification ;
Machine translation ;
Entailment prediction ;
Named entity recognition ;
Sequence-to-sequence, like BERT for text extraction ;
Text similarity search, like BERT to find semantic similarities ;
Language modeling.

Estimer le coût du GPU

Choisissez votre forfait

Estimated cost

Option	Value	Price
Zone	Paris 2
Instance	1x	0€
Volume	10GB	0€
IPv4 flexible	Oui	0.004€

Total
À l'heure	0.004€
À la journée	0.10€
À la semaine	0.67€
Au mois	2.92€

Choisissez votre format de GPU

Nom de l'instance	Nombre de GPU	TFLOP en FP16 Tensor Cores	VRAM	Prix jusqu'au 30 juin	Prix à partir du 1 juillet
H100-1-80G	1 H100 PCIe Tensor Core	Jusqu'à 1513 teraFLOP	80 Go	2,52€/heure	2,73€/heure
H100-2-80G	2 H100 PCIe Tensor Core	Jusqu'à 3026 teraFLOP	2 x 80 Go	5,04€/heure	5,46€/heure

Contactez-nous pour obtenir le meilleur prix

Profitez de la simplicité d'un environnement IA préconfiguré

Optimisez le système d'exploitation de vos GPU

Bénéficiez d'une image Ubuntu prête à l'emploi pour lancer vos conteneurs d'apprentissage profond préférés (pilote NVIDIA préinstallé et environnement Docker).

Profitez de votre environnement Jupyter préféré

Lancez facilement votre JupyterLab ou Notebook préféré grâce à l'environnement Docker préinstallé.

Choisissez vos AI containers parmi plusieurs registres

Accédez à plusieurs registres de conteneurs : vos propres conteneurs compilés, les conteneurs IA de Scaleway, le registre NVIDIA NGC et tout autre registre.

Les logiciels NVIDIA Enterprise AI à votre disposition

Accédez à des centaines de logiciels IA optimisés par Nvidia pour maximiser l'efficacité de vos GPU et augmenter votre productivité. Parmi les centaines de logiciels développés par NVIDIA et testés par des leaders de leur industrie, tirez parti de

NVIDIA Nemo pour le réglage fin des LLM,
NVIDIA TAO pour la vision par ordinateur,
NVIDIA TRITON pour l'inférence.

Déployez et mettez à l'échelle votre infrastructure avec Kubernetes

Foire aux questions

Qu'est-ce qui est inclus dans le prix de l'instance ?

1,9 To de Scratch Storage sont inclus dans le prix de l'instance, mais tout volume de stockage Block Storage, que vous provisionnez, est à votre charge. Pour des raisons de redondance et donc de sécurité, nous vous recommandons vivement de provisionner un volume de Block Storage supplémentaire, car le stockage Scratch est un stockage éphémère qui disparaît lorsque vous éteignez la machine. Le Scratch Storage a pour but d'accélérer le transfert de vos ensembles de données vers la GPU.
Comment utiliser Scratch Storage dans ce cas? Suivez le guide !

Quelle est la différence entre H100-1-80G et H100-2-80G ?

Ce sont deux formats de la même instance intégrant la NVIDIA H100 PCIe Tensor Core.

H100-1-80G intègre 1 GPU NVIDIA H100 PCIe Tensor Core, offrant une mémoire GPU de 80 Go.
H100-2-80G intègre 2 GPU NVIDIA H100 PCIe Tensor Core, offrant une mémoire GPU de 2 fois 80 Go, soit un total de 160 Go. Cette instance permet d'accélérer la formation de modèles Transformers plus grands qui exploitent 2 GPU à la fois. Grâce au facteur de forme PCIe, les serveurs de l'instance H100 PCIe GPU sont équipés de 2 GPU. En lançant un format d'instance H100-2-80G, l'utilisateur bénéficie d'un serveur entièrement dédié avec 2 GPU.

Quel est l'impact environnemental de l'instance H100 PCIe ?

NVIDIA a annoncé l'H100 pour permettre aux entreprises de réduire les coûts de déploiement de l'IA, _"offrant les mêmes performances IA avec une efficacité énergétique 3,5 fois supérieure et un coût total de possession 3 fois inférieur, tout en utilisant 5 fois moins de nœuds de serveur par rapport à la génération précédente."
_
Qu'est-ce qui dans le produit peut confirmer cette annonce ?

La gravure plus fine de la puce réduit la surface et donc l'énergie nécessaire pour alimenter la puce.
Grâce à des innovations comme le nouveau format de données FP8 (8 bits), davantage de calculs sont effectués avec la même quantité de consommation, ce qui permet une optimisation du temps et de l'énergie.
De plus, chez Scaleway, nous avons décidé de localiser nos instances H100 PCIe dans le datacenter adiabatique DC5. Avec un PUE (efficacité d'utilisation de l'énergie) de 1,15 (alors que la moyenne est généralement de 1,6), ce datacenter permet d'économiser entre 30 % et 50 % d'électricité par rapport à un centre de données conventionnel.

Comment puis-je utiliser MIG pour tirer le meilleur parti de ma GPU ?

NVIDIA Multi-Instance GPU (MIG) est une technologie introduite par NVIDIA pour améliorer l'utilisation et la flexibilité des GPU, spécialement conçue pour la virtualisation et les environnements multi-tenants. Elle permet à un seul GPU physique d'être divisé en sept instances plus petites, chacune fonctionnant comme une partition MIG indépendante avec ses propres ressources dédiées, telles que la mémoire, les cœurs de calcul et les sorties vidéo.
Lisez la documentation dédiée pour utiliser la technologie MIG sur votre instance GPU.

Comment choisir la bonne GPU pour ma charge de travail ?

De nombreux critères doivent être pris en compte pour choisir la bonne instance GPU :

Exigences de la charge de travail ;
Exigences en matière de performances ;
Type de GPU ;
Mémoire du GPU ;
CPU et RAM ;
Compatibilité des drivers de GPU et des logiciels ;
Capacité de mise à l'échelle.

Pour plus d'informations, consultez la documentation dédiée à ce sujet.

H100 PCIe GPU Instance

Affinez des modèles tels que LLaMA 2

Accélérez jusqu'à 30 fois le traitement de l'inférence

Optimisez la capacité des GPU en fonction de vos besoins

Innovation verte : 50 % d’énergie en moins, 100 % renouvelable

DC5 PAR2 Paris

WAW2 Varsovie

De nombreux cas d’usages

Natural Language Processing

Reconnaissance automatique de la parole

Generative AI

Computer vision

Recommender

Estimer le coût du GPU

Choisissez votre forfait

Estimated cost

Choisissez votre format de GPU

Profitez de la simplicité d'un environnement IA préconfiguré

Optimisez le système d'exploitation de vos GPU

Profitez de votre environnement Jupyter préféré

Choisissez vos AI containers parmi plusieurs registres

Les logiciels NVIDIA Enterprise AI à votre disposition

Déployez et mettez à l'échelle votre infrastructure avec Kubernetes

Foire aux questions