ScalewayAller à la connexionAller au contenu principalAller au pied de page

Model-as-a-service

Servez des modèles d'IA générative et payez pour une infrastructure dédiée ou pour des millions de tokens.

Generative APIs

Déployez les derniers modèles d'IA, payez au million de token

ModèleTypeTokens en entréeTokens en sortie
llama-3.1-8b-instructGénération de texte0,20€/million tokens0,20€/million tokens
llama-3.1-70b-instructGénération de texte0,90€/million tokens0,90€/million tokens
llama-3.3-70b-instructGénération de texte0,90€/million tokens0,90€/million tokens
mistral-nemo-instruct-2407Génération de texte0,20€/million tokens0,20€/million tokens
qwen2.5-coder-32b-instructGénération de code0,90€/million tokens0,90€/million tokens
pixtral-12b-2409Analyse d'image0,20€/million tokens0,20€/million tokens
bge-multilingual-gemma2Embedding0,20€/million tokensN/A
deepseek-r1-distill-llama-70bGénération de texte0,90€/million tokens0,90€/million tokens
Mentions légales

Prix HT.
Vous bénéficiez d'un essai gratuit de 1 000 000 tokens. Vous ne paierez qu'à partir de 1 000 001 token.

Managed Inference

Choisissez un modèle prêt à l'emploi et obtenez immédiatement un point d'accès dédié pour son inférence. Vous êtes facturé en fonction de l'utilisation du GPU que vous choisissez.

ModèleGPUPrixEstimation mensuelle
llama-3.1-8b-instructL4-1-24G0,93€/heure~679€/mois
L40S-1-48G1,72€/heure~1256€/mois
H100-1-80G3,40€/heure~2482€/mois
H100-2-80G6,68€/heure~4876€/mois
llama-3.3-70b-instructH100-2-80G6,68€/heure~4876€/mois
llama-3.1-70b-instructH100-1-80G3,40€/heure~2482€/mois
H100-2-80G6,68€/heure~4876€/mois
llama-3.1-nemotron-70b-instructH100-1-80G3,40€/heure~2482€/mois
H100-2-80G6,68€/heure~4876€/mois
mistral-7b-instruct-v0.3L4-1-24G0,93€/heure~679€/mois
L40S-1-48G1,72€/heure~1256€/mois
H100-1-80G3,40€/heure~2482€/mois
H100-2-80G6,68€/heure~4876€/mois
mixtral-8x7b-instruct-v0.1H100-1-80G3,40€/heure~2482€/mois
H100-2-80G6,68€/heure~4876€/mois
mistral-nemo-instruct-2407L40S-1-48G1,72€/heure~1256€/mois
H100-1-80G3,40€/heure~2482€/mois
H100-2-80G6,68€/heure~4876€/mois
pixtral-12b-2409L40S-1-48G1,72€/heure~1256€/mois
H100-1-80G3,40€/heure~2482€/mois
H100-2-80G6,68€/heure~4876€/mois
molmo-72b-0924H100-2-80G6,68€/heure~4876€/mois
qwen2.5-coder-32b-instructH100-1-80G3,40€/heure~2482€/mois
H100-2-80G6,68€/heure~4876€/mois
bge-multilingual-gemma2L4-1-24G0,93€/heure~679€/mois
L40S-1-48G1,72€/heure~1256€/mois
sentence-t5-xxlL4-1-24G0,93€/heure~679€/mois
Mentions légales

Prix hors taxes
La facturation commence lorsque au moins un point de terminaison dédié est prêt à être utilisé.