Comment apprendre l'EAD à un LLM : fine-tuning (3/3)

- Posté en Sans catégorie par
Disclaimer: la démarche présentée dans ce billet ne constitue pas un exemple complet et abouti de personnalisation d'un LLM. Si le modèle fine-tuné obtenu donne des résultats plutôt satisfaisants, il est largement améliorable, et un "vrai" processus de post-training dans le but d'obtenir un modèle fine-tuné viable en production devrait inclure à minima deux étapes supplémentaires : [...] Suite...

Techniques de prompts

- Posté en Sans catégorie par
La notion de prompt est clairement associée pour le grand public aux modèles de langage depuis l’ouverture de ChatGPT, mais désigne en fait une amorce tout à fait courante consistant à poser une question et/ou donner une instruction que ce soit dans la “vraie vie” ou dans un contexte de programmation informatique. Appliqué aux LLMs, le prompt engineering, élevé au rang de [...] Suite...

Comment exécuter localement un LLM (1/2)?

- Posté en Sans catégorie par
Ces deux billets proposent une shortlist non-exhaustive et tout à fait personnelle des outils et librairies open source à disposition permettent d'exploiter les LLM en local (sur son PC ou sur son serveur) afin de s'abstraire des UI disponibles en ligne type ChatGPT, Gemini, Claude ou LeChat, plus ou moins gratuites et plus ou moins utilisables si l'on veut faire de l'inférence sur des [...] Suite...

Une brève introduction aux LLMs (1/2)

- Posté en Sans catégorie par
Modèle d'apprentissage machine = algorithme + données En IA classique, l’appellation modèle désigne un algorithme entraîné sur des données dans le but de réaliser un objectif prédictif bien spécifique en fonction du jeux de données source. Les types de prédiction peuvent être de différents ordres (régression, classification, clusterisation), les algorithmes à disposition sont [...] Suite...
"> ');