Deployment Tarifs

Servez des modèles d'IA générative et répondez aux demandes des consommateurs finaux européens en toute sécurité

Managed Inference

Choisissez un modèle prêt à l'emploi et obtenez immédiatement un point d'accès dédié pour son inférence. Vous êtes facturé en fonction de l'utilisation du GPU que vous choisissez.

ModèleQuantizationGPUPrixApprox. par mois
Llama3-8b-instructBF16L4-1-24G€0.93/heure~€679/mois
Llama3-70b-instructINT8H100-1-80G€3.40/heure~€2482/mois
Mistral-7b-instruct-v0.3BF16L4-1-24G€0.93/heure~€679/mois
Mixtral-8x7b-instruct-v0.1INT8H100-1-80G€3.40/heure~€2482/mois
Mixtral-8x7b-instruct-v0.1FP16H100-2-80G€6.68/heure~€4876/mois
Wizardlm-70B-V1.0FP8H100-1-80G€3.40/heure~€2482/mois
Wizardlm-70B-V1.0FP16H100-2-80G€6.68/heure~€4876/mois
Sentence-t5-xxlFP32L4-1-24G€0.93/heure~€679/mois