Deployment Tarifs
Servez des modèles d'IA générative et répondez aux demandes des consommateurs finaux européens en toute sécurité
Managed Inference
Choisissez un modèle prêt à l'emploi et obtenez immédiatement un point d'accès dédié pour son inférence. Vous êtes facturé en fonction de l'utilisation du GPU que vous choisissez.
Modèle | Quantization | GPU | Prix | Approx. par mois |
---|---|---|---|---|
Llama3-8b-instruct | BF16 | L4-1-24G | €0.93/heure | ~€679/mois |
Llama3-70b-instruct | INT8 | H100-1-80G | €3.40/heure | ~€2482/mois |
Mistral-7b-instruct-v0.3 | BF16 | L4-1-24G | €0.93/heure | ~€679/mois |
Mixtral-8x7b-instruct-v0.1 | INT8 | H100-1-80G | €3.40/heure | ~€2482/mois |
Mixtral-8x7b-instruct-v0.1 | FP16 | H100-2-80G | €6.68/heure | ~€4876/mois |
Wizardlm-70B-V1.0 | FP8 | H100-1-80G | €3.40/heure | ~€2482/mois |
Wizardlm-70B-V1.0 | FP16 | H100-2-80G | €6.68/heure | ~€4876/mois |
Sentence-t5-xxl | FP32 | L4-1-24G | €0.93/heure | ~€679/mois |