ScalewayAller à la connexionAller au contenu principalAller au pied de page

Model-as-a-service

Servez des modèles d'IA générative et payez pour une infrastructure dédiée ou pour des millions de tokens.

Generative APIs

Déployez les derniers modèles d'IA, payez au million de token

ModèleTypeTokens en entréeTokens en sortie
llama-3.1-8b-instructGénération de texte0,20€/million tokens0,20€/million tokens
llama-3.1-70b-instructGénération de texte0,90€/million tokens0,90€/million tokens
llama-3.3-70b-instructGénération de texte0,90€/million tokens0,90€/million tokens
mistral-nemo-instruct-2407Génération de texte0,20€/million tokens0,20€/million tokens
qwen2.5-coder-32b-instructGénération de code0,90€/million tokens0,90€/million tokens
pixtral-12b-2409Analyse d'image0,20€/million tokens0,20€/million tokens
bge-multilingual-gemma2Embedding0,20€/million tokensN/A
Mentions légales

Prix HT.
Vous bénéficiez d'un essai gratuit de 1 000 000 tokens. Vous ne paierez qu'à partir de 1 000 001 token.

Managed Inference

Choisissez un modèle prêt à l'emploi et obtenez immédiatement un point d'accès dédié pour son inférence. Vous êtes facturé en fonction de l'utilisation du GPU que vous choisissez.

ModèleGPUPrixEstimation mensuelle
llama-3.1-8b-instructL4-1-24G0,93€/hour~679€/month
llama-3.3-70b-instructH100-2-80G6,68€/hour~4876€/month
llama-3.1-70b-instructH100-1-80G3,40€/hour~2482€/month
H100-2-80G6,68€/hour~4876€/month
llama-3.1-nemotron-70b-instructH100-1-80G3,40€/hour~2482€/month
H100-2-80G6.68€/hour~4876€/month
mistral-7b-instruct-v0.3L4-1-24G0,93€/hour~679€/month
mixtral-8x7b-instruct-v0.1H100-1-80G3,40€/hour~2482€/month
H100-2-80G6,68€/hour~4876€/month
mistral-nemo-instruct-2407H100-1-80G3,40€/hour~2482€/month
pixtral-12b-2409H100-1-80G3,40€/hour~2482€/month
molmo-72b-0924H100-2-80G6,68€/hour~4876€/month
qwen2.5-coder-32b-instructH100-1-80G3,40€/hour~2482€/month
H100-2-80G6,68€/hour~4876€/month
sentence-t5-xxlL4-1-24G0,93€/hour~679€/month
bge-multilingual-gemma2L4-1-24G0,93€/hour~679€/month
Mentions légales

Prix hors taxes
La facturation commence lorsque au moins un point de terminaison dédié est prêt à être utilisé.