janvier 2026

Le Steering, ou comment comment modifier le comportement d’un LLM sans fine-tuning

16 janvier 2026 - Posté en Sans catégorie par Géraldine Geoffroy

Code accessible ici Le Steering, ou Activation steering, consiste à orienter la sortie d’un LLM (la prédiction du token suivant) en manipulant directement les représentations intermédiaires calculées par le modèle au moment de l’inférence dans le but d’activer certains sous-espaces plutôt que d’autres. Traditionnellement les techniques utilisées pour contrôler le comportement [...] Suite...