Solutions pour l'IA
Faites évoluer vos projets d'IA de A à Z avec un fournisseur de Cloud souverain et durable européen
Concentrez-vous sur le développement de l'IA oubliez la gestion de l'infrastructure
L'évolution de vos workloads d'IA est un défi permanent
Vos modèles deviennent de plus en plus complexes, mais la gestion de l'infrastructure ne doit pas être un goulot d'étranglement. À mesure que les charges de travail augmentent, votre infrastructure doit suivre sans compromettre les performances ou les résultats.
La gestion de l'infrastructure ralentit votre innovation
Vous passez trop de temps à mettre en place des clusters, à gérer les GPU et à surveiller les ressources - du temps qu'il vaudrait mieux consacrer à affiner des modèles et à améliorer des capacités d'IA.
Les coûts imprévisibles épuisent vos ressources
Le surapprovisionnement pour garantir des performances maximales ou pour faire face à des pics inattendus fait grimper les coûts, ce qui réduit votre budget pour l'innovation et la mise à l'échelle.
De l'infrastructure aux solutions managées, nous avons tout ce qu'il faut
Clusters
Des clusters flexibles pour répondre à l'évolution de vos besoins en matière d'IA
Pourquoi choisir Scaleway pour vos projets d'IA ?
Énergies renouvelables et réduction de 50 % de la consommation d'énergie
DC5 (par2) est l'un des datacenters les plus écologiques d'Europe, avec un PUE de 1,16 (contre 1,55 en moyenne dans l'industrie), il réduit la consommation d'énergie de 30 à 50 % par rapport aux centres de données traditionnels.
Conservez les données sensibles en Europe
Scaleway stocke toutes ses données en Europe, ce qui signifie qu'elle n'est soumise à aucune législation extraterritoriale et qu'elle respecte pleinement les principes du GDPR.
Bénéficiez d'un écosystème informatique cloud complet
Nous offrons une gamme complète de services Cloud: depuis la collecte de données, la création de modèles, le développement d'infrastructures, la livraison aux clients finaux, et tout ce qu'il y a entre les deux.
Clusters
Clusters
Lorsque vous avez besoin de ressources évolutives pour la formation ou le développement de grands modèles, nos clusters offrent la flexibilité nécessaire pour s'adapter à vos demandes, avec ou sans engagement à long terme. Choisissez entre un accès à la demande pour des besoins à court terme ou une solution sur mesure pour un soutien durable et sans risque.
On demand Cluster
Ne vous engagez pas et louez un cluster à la demande pour une semaine afin de permettre à votre équipe de s'entraîner ou de construire de grands modèles de manière efficace. Explorez vos options pour trouver la configuration idéale avant de vous engager.
Custom-built Clusters
Concevez la solution dont vous avez besoin pour soutenir votre développement au cours des prochaines années. Choisissez le GPU, le stockage et la solution d'interconnexion, nous nous occupons du reste. Concentrez-vous sur l'OPEX pendant que nous nous occupons du CAPEX.
GPU Instances
GPU Instances
Vous avez besoin d'un accès occasionnel à de puissantes instances GPU pour la formation ou l'inférence ? Notre gamme d'instances GPU NVIDIA vous offre la flexibilité d'évoluer en fonction de vos besoins, ce qui est parfait pour des charges de travail spécifiques sans investir dans une infrastructure permanente.
H100 PCIe GPU Instance
2,73€/h (~1993€/mois)
Accélérez l'apprentissage et l'inférence de vos modèles grâce à la puce d'IA la plus performante du marché !
RENDER GPU
1,24€/h (~891€/mois)
Des Tesla P100 dédiées pour tous vos besoins en matière d'apprentissage automatique et d'intelligence artificielle.
L4 GPU Instance
0,75€/h (~548€/mois)
Optimisez les coûts de votre infrastructure d'IA avec un GPU d'entrée de gamme polyvalent.
L40S GPU Instance
1,4€/hour (~1022€/mois)
Accélérez la prochaine génération d'applications basées sur l'IA avec l'instance GPU universelle L40S, plus rapide que L4 et moins chère que H100 PCIe.
Model-as-a-Service
Model-as-a-Service
Déployez des modèles sans vous soucier de la gestion de l'infrastructure. Accédez à des endpoints préconfigurés, sans serveur, comprenant les modèles d'IA les plus populaires, facturés par million de tokens ou, à l'heure avec une infrastructure dédiée pour plus de sécurité et une meilleure anticipation des coûts.
Managed Inference
Servez des modèles d'IA générative et répondez aux demandes des consommateurs finaux européens en toute sécurité grâce à une infrastructure dédiée facturée à l'heure.
Generative APIs
Accès à des endpoints préconfigurés, sans serveur, intégrant les modèles d'IA les plus populaires, tous hébergés dans des centres de données européens sécurisés et tarifés par million de tokens.
Des projets réussis grâce à l'infrastructure de Scaleway
Moshi de Kyutai
Moshi, l'assistant vocal révolutionnaire de Kyutai, offre des capacités vocales sans précédent. Entraîné à l'aide du cluster haute performance de Scaleway et servi par nos instances GPU L4, Moshi excelle dans la transmission d'émotions et d'accents avec une compression de codec 300x. Cette configuration a permis à Moshi de traiter 70 émotions et accents différents avec une latence ultra-faible, permettant des conversations fluides et humaines. C'est grâce à cet environnement de haute performance que Kyutai a pu réaliser cette percée.
Mixtral de Mistral AI
Mistral AI, par exemple, a utilisé Nabu pour construire son [modèle Mixtral] (https://mistral.ai/news/mixtral-of-experts/), un modèle de mélange d'experts très efficace. Lors de sa sortie, Mixtral a surpassé les modèles fermés et ouverts existants dans la plupart des benchmarks, offrant des performances supérieures avec moins de paramètres actifs, ce qui en fait une innovation majeure dans le domaine de l'IA. La collaboration avec Scaleway a permis à Mistral d'étendre sa formation de manière efficace, ce qui a permis à Mixtral d'obtenir des résultats révolutionnaires en un temps record.
HPC, quantum computing et IA pour la recherche de médicaments
[Qubit Pharmaceutical utilise la puissance du GPU de Scaleway (https://www.scaleway.com/en/news/major-breakthrough-in-quantum-algorithms-qubit-pharmaceuticals-and-sorbonne-university-drastically-reduce-the-number-of-qubits-needed-to-simulate-molecules/) pour accélérer la recherche médicale de nouveaux médicaments, en utilisant une combinaison de calcul à haute performance (HPC), d'informatique quantique et d'IA. Cette combinaison permet aux équipes de recherche d'obtenir les mêmes résultats avec 3 à 5 fois moins de personnel et 20 fois moins de tests qu'avec les méthodes traditionnelles, démontrant ainsi que la puissance de calcul peut donner un coup de fouet aux soins de santé lorsqu'elle est appliquée correctement.
Benchmarking de Hugging Face
nous avons obtenu des résultats très satisfaisants par rapport à d'autres CSP. Des résultats qui pourraient être grandement améliorés avec un peu plus de réglages ! Nous sommes impatients de tester les 127 nœuds DGX et de voir quelles performances nous obtiendrons » Guillaume Salou, ML Infra Lead chez Hugging Face