Managed Inference

Servez des modèles d'IA générative et répondez à tous les prompts de vos utilisateurs européens en toute sécurité. Une transition simple depuis OpenAI vers un cloud souverain.

Choisissez parmi des modèles prêts à l’emploi

Qu'est-ce qui accélère l'inférence ? L'optimisation du modèle. C'est pourquoi Scaleway fournit une bibliothèque évolutive de modèles optimisés pour nos GPUs. Des modèles de langage et d’embedding.

Profitez de tokens illimités à un prix prédictible

Quelle que soit votre utilisation, vous payez le même prix -prévisible- pour des tokens illimités. Ce prix dépend de l'infrastructure dédiée qui sert votre modèle et qui est facturée à l'heure.

Utilisez un Cloud Européen complétement sécurisé

Maintenez un contrôle complet sur les données : vos prompts et les réponses ne sont pas stockées, ne peuvent être consultées par Scaleway ou par des tiers. Vos données sont exclusivement les vôtres et restent en Europe !

Zones disponibles :
Paris:PAR 2

Modèles de langage et d'embedding open weights

Llama-3-8b-instruct

Llama 3 de Meta est la dernière itération de la famille Llama en libre accès, conçue pour un déploiement et un développement efficaces sur des GPU plus petits. Les modèles Llama sont adaptés aux dialogues dynamiques et à la génération de texte créatif. Conçu avec les dernières avancées en matière d'efficacité et de scalabilité, il excelle dans les tâches de raisonnement complexe et de codage. Son mécanisme avancé de Grouped-Query Attention assure une puissance de traitement inégalée, en faisant l'outil ultime pour les applications de chat et bien plus encore.

Prix prédictible

Choisissez parmi des modèles optimisés prêts à l'emploi et obtenez immédiatement un point d’accès dédié. Vous êtes facturé en fonction de l'utilisation du type de GPU que vous choisissez.



ModelQuantizationGPUPriceApprox. per month
Llama3-8b-instructBF16L4-1-24G€0.93/hour~€679/month
Llama3-70b-instructINT8H100-1-80G€3.40/hour~€2482/month
Mistral-7b-instruct-v0.3BF16L4-1-24G€0.93/hour~€679/month
Mixtral-8x7b-instruct-v0.1INT8H100-1-80G€3.40/hour~€2482/month
Sentence-t5-xxlFP32L4-1-24G€0.93/hour~€679/month



Plus de modèles et conditions tarifaires disponibles sur cette page

Bénéficiez d’un écosystème Cloud européen sécurisé

Virtual Private Cloud

Vos LLMs sont accessibles via une connexion sécurisée grâce à un réseau privé régional résilient.

En savoir plus

Access Management

Nous rendons vos accès compatibles avec la gestion des identités et des accès de Scaleway (IAM), afin que vos déploiements soient conformes aux exigences de votre architecture d'entreprise.

En savoir plus

Cockpit

Identifiez les goulots d'étranglement dans vos déploiements, visualisez les demandes d'inférence en temps réel et faites même état de votre consommation d'énergie grâce à l'intégration de solution d'observabilité entièrement managée

En savoir plus