Comment lire un benchmark
Un benchmark est un examen standardisé. Tous les modèles reçoivent des questions ou des tâches similaires, puis on compare leurs réponses. C'est utile pour repérer les modèles forts, mais ce n'est pas une garantie sur votre cas réel.