La révolution du coût d’inférence : 0,15 $/M tokens change tout
Il y a deux ans, faire tourner un modèle de langage de qualité coûtait 15 $ par million de tokens. Aujourd’hui, tu peux obtenir une sortie comparable pour 0,15 $. C’est une réduction de…