Tarifs solutions d'Inférence d'IA

Modèle	Type	Tokens en entrée	Tokens en sortie
gemma-3-27b-it	Génération de texte & analyse d'image	0,25€^{/million tokens}	0,50€^{/million tokens}
mistral-small-3.1-24b-instruct-2503	Génération de texte & analyse d'image	0,15€^{/million tokens}	€0,35€^{/million tokens}
llama-3.1-8b-instruct	Génération de texte	0,20€^{/million tokens}	0,20€^{/million tokens}
llama-3.1-70b-instruct	Génération de texte	0,90€^{/million tokens}	0,90€^{/million tokens}
llama-3.3-70b-instruct	Génération de texte	0,90€^{/million tokens}	0,90€^{/million tokens}
mistral-nemo-instruct-2407	Génération de texte	0,20€^{/million tokens}	0,20€^{/million tokens}
qwen2.5-coder-32b-instruct	Génération de code	0,90€^{/million tokens}	0,90€^{/million tokens}
pixtral-12b-2409	Analyse d'image	0,20€^{/million tokens}	0,20€^{/million tokens}
bge-multilingual-gemma2	Embedding	0,10€^{/million tokens}	N/A
deepseek-r1-distill-llama-70b	Génération de texte	0,90€^{/million tokens}	0,90€^{/million tokens}

Modèle

Type

Tokens en entrée

Tokens en sortie

gemma-3-27b-it

Génération de texte & analyse d'image

0,25€^{/million tokens}

0,50€^{/million tokens}

mistral-small-3.1-24b-instruct-2503

Génération de texte & analyse d'image

0,15€^{/million tokens}

€0,35€^{/million tokens}

llama-3.1-8b-instruct

Génération de texte

0,20€^{/million tokens}

llama-3.1-70b-instruct

Génération de texte

0,90€^{/million tokens}

llama-3.3-70b-instruct

Génération de texte

0,90€^{/million tokens}

mistral-nemo-instruct-2407

Génération de texte

0,20€^{/million tokens}

qwen2.5-coder-32b-instruct

Génération de code

0,90€^{/million tokens}

pixtral-12b-2409

Analyse d'image

0,20€^{/million tokens}

bge-multilingual-gemma2

Embedding

0,10€^{/million tokens}

N/A

deepseek-r1-distill-llama-70b

Génération de texte

0,90€^{/million tokens}

Managed Inference

Choisissez un modèle prêt à l'emploi et obtenez immédiatement un point d'accès dédié pour son inférence. Vous êtes facturé en fonction de l'utilisation du GPU que vous choisissez.

Modèle	GPU	Prix	Estimation mensuelle
llama-3.1-8b-instruct	L4-1-24G	0,93€^/heure	~679€^/mois
	L40S-1-48G	1,72€^/heure	~1256€^/mois
	H100-1-80G	3,40€^/heure	~2482€^/mois
	H100-2-80G	6,68€^/heure	~4876€^/mois
llama-3.3-70b-instruct	H100-2-80G	6,68€^/heure	~4876€^/mois
llama-3.1-70b-instruct	H100-1-80G	3,40€^/heure	~2482€^/mois
llama-3.1-70b-instruct	H100-2-80G	6,68€^/heure	~4876€^/mois
llama-3.1-nemotron-70b-instruct	H100-1-80G	3,40€^/heure	~2482€^/mois
llama-3.1-nemotron-70b-instruct	H100-2-80G	6,68€^/heure	~4876€^/mois
mistral-7b-instruct-v0.3	L4-1-24G	0,93€^/heure	~679€^/mois
	L40S-1-48G	1,72€^/heure	~1256€^/mois
	H100-1-80G	3,40€^/heure	~2482€^/mois
	H100-2-80G	6,68€^/heure	~4876€^/mois
mixtral-8x7b-instruct-v0.1	H100-1-80G	3,40€^/heure	~2482€^/mois
mixtral-8x7b-instruct-v0.1	H100-2-80G	6,68€^/heure	~4876€^/mois
mistral-nemo-instruct-2407	L40S-1-48G	1,72€^/heure	~1256€^/mois
	H100-1-80G	3,40€^/heure	~2482€^/mois
	H100-2-80G	6,68€^/heure	~4876€^/mois
pixtral-12b-2409	L40S-1-48G	1,72€^/heure	~1256€^/mois
	H100-1-80G	3,40€^/heure	~2482€^/mois
	H100-2-80G	6,68€^/heure	~4876€^/mois
molmo-72b-0924	H100-2-80G	6,68€^/heure	~4876€^/mois
qwen2.5-coder-32b-instruct	H100-1-80G	3,40€^/heure	~2482€^/mois
qwen2.5-coder-32b-instruct	H100-2-80G	6,68€^/heure	~4876€^/mois
bge-multilingual-gemma2	L4-1-24G	0,93€^/heure	~679€^/mois
bge-multilingual-gemma2	L40S-1-48G	1,72€^/heure	~1256€^/mois
sentence-t5-xxl	L4-1-24G	0,93€^/heure	~679€^/mois

Mentions légales

Prix hors taxes
La facturation commence lorsque au moins un point de terminaison dédié est prêt à être utilisé.

Aller à la page produit Créez votre compte

Model-as-a-service

Generative APIs

Managed Inference