Configurez le cout en credits par 1 000 tokens (entree/sortie) pour chaque modele LLM
Formule : credits = (input_tokens / 1000 x taux_IN) + (output_tokens / 1000 x taux_OUT) + marge%
Si le resultat est inferieur au minimum, le minimum est applique.
Priorite : Les tarifs tenant priment sur les tarifs plateforme. Si aucun tarif n'est configure, le systeme utilise le prix USD du fournisseur x multiplicateur.
Modeles locaux (Ollama/vLLM) : Configurez les taux a 0 pour un usage gratuit.