Bases des modèles conversationnels I : principes de fonctionnement

11 juin 2023 / Arnaud Stévins / 29 Comments

1. Modèles de Langage

Les Modèles de Langage se focalisent sur le traitement des langages humains. On parle aujourd’hui de « Grands » Modèles de Langage (GML) vu la taille énorme tant des jeux de données d’entraînement (des copies de l’ensemble de l’Internet!) que du nombre de paramètres internes du modèle. Ils peuvent être unilingues ou multilingues en fonction des données d’entraînement fournies mais la tendance actuelle est au multilinguisme: ChatGPT « converse » en 95 langues.

Les (Grands) Modèles de Langage fonctionnent de la manière suivante :

ils ont pour principe de chercher à prédire le prochain mot d’une séquence de mots fournie par l’utilisateur.
Cette prédiction se fait sous la forme d’une distribution de probabilité qui couvre l’ensemble des mots possibles (disons le dictionnaire).
Plusieurs mécanismes sont possibles pour choisir le mot gagnant. Une approche déterministe consiste à choisir systématiquement le mot avec la probabilité la plus élevée. Une approche stochastique constituera à tirer au hasard dans la distribution de probabilité. Le type d’approche dépend du modèle et peut parfois être modifié par l’utilisateur.
le mot prédit est alors ajouté à la séquence et le modèle est exécuté à nouveau avec la séquence complétée avec le mot généré, pour prédire le mot suivant.
Ce mécanisme est exécuté répétitivement autant de fois que nécessaire jusqu’à l’occurence d’un mot spécial qui signifie la fin du texte (pensez au « STOP » des télégrammes).

Vous trouverez ci-dessous une illustration simple de ce mécanisme pour la séquence initiale « J’ai une voiture… » que le modèle complétera en trois étapes en « J’ai une voiture depuis hier. ».

L’ explication ci-dessus est conceptuellement correcte, mais les modèles actuels contiennent une astuce supplémentaire : ils ne prédisent pas des mots mais des tokens qui sont des parties de mots. Ils ressemblent plutôt à des syllabes que des mots. C’est notamment ce qui permet le multilinguisme. Nous y reviendrons dans un article ultérieur. Mais c’est un detail technique qui ne doit pas nous distraire du principe expliqué ci-dessus.

Les grands modèles de langage sont aussi des généralistes au niveau du type de narration; ils ne privilégient pas le dialogue sur d’autres formes discursives. En d’autres termes, ils ne répondront pas nécessairement à une question par une réponse. Ils sont donc tout à fait capables de ne pas répondre à la question voire de répondre par une autre question si cela leur semble plus plausible.

Tournons-nous maintenant vers les modèles de langage spécialisés en question-réponse et conversationnels, qui adressent précisément ce point.

2. Modèles de langages question/réponse et conversationnels

Les modèles Question/réponse sont des modèles dérivés ayant reçu un entraînement complémentaire qui les pousse à fournir une réponse lorsqu’une question est posée, en utilisant la base de connaissance intégrée dans le modèle lors de l’entraînement généraliste. Ceci rend ce genre de modèle beaucoup plus approprié pour une interaction avec des êtres humains.

Les modèles conversationnels sont un raffinement supplémentaire consiste à entraîner le modèle à tenir compte de l’ensemble d’un dialogue passé avec l’utilisateur -soit potentiellement plusieurs questions-réponses- lors de l’élaboration de la réponse.

Pour prendre le cas concret d’OpenAI, Les modèles GPT2,3 et 4 sont des modèles généralistes de puissance expressive croissante; InstructGPT est un modèle Question/Réponse dérive de GPT et ChatGPT est un modèle conversationnel dérivé d’ InstructGPT.

3. Véracité et hallucinations

Lors de l’entraînement complémentaire, les développeurs du système vont également tenter de privilégier les réponses véridiques, honnêtes et inoffensives. Mais ce n’est pas si simple que cela en a l’air. Le but du système est de compléter la séquence de la manière la plus plausible selon son propre modèle, ce comportement se rapproche plus du baratin que de l’honnêteté.

Ces modèles sont donc de brillants baratineurs et l’utilisateur sera bien averti de TOUJOURS revalider et vérifier le texte généré. Ne faites pas comme cet avocat aux USA qui a remis une plaidoierie générée par ChatGPT sans la relire, qui contenait toute une jurisprudence inventée de toutes pièces par notre espiègle serviteur informatique.

On dit dans le jargon de l’IA que le modèle hallucine. Une hallucination est une déclaration du modèle qui semble plausible mais s’avère être fausse.

4. Apprentissage spécialisé

Les modèles de langage étant à la base entraînés sur un corpus de texte généraliste, il peut être intéressant de leur fournir un entraînement complémentaire dans un domaine spécifique si vous avez une application précise en tête. Par exemple un entraînement sur les codes de loi pour une application juridique ou des ouvrage médicaux de référence pour une application dans le secteur de la santé, afin d’enrichir la puissance expressive du modèle dans la direction recherchée.

Cela reste un exercice relativement complexe qui va demander de faire appel à des experts : un corpus spécialisé de texte va devoir être identifié, prétraité puis les paramètres du modèle modifiés sur base de l’entraînement sur ce jeu de données, suivi d’une phase de test et de validation. L’ avantage de cette approche est que la connaissance du modèle est définitivement enrichie. Les interactions futures entre un utilisateur et le modèle sur le sujet seront plus fructueuses.

Une solution plus rudimentaire consiste à fournir un petit nombre d’exemples (de questions et réponses correctes) dans le texte de la question initiale afin d’ orienter le modèle dans la bonne direction pendant l’exécution. On appelle cela l’apprentissage dans le contexte (in-context learning). Il s’agit d’une des techniques de prompting que nous verrons dans le prochain article.

Modèles de langage

29 Comments

binance open account
1 janvier 2026 at 23h33

Can you be more specific about the content of your article? After reading it, I still have some doubts. Hope you can help me.
M~a gii thiu binance
12 janvier 2026 at 23h49

Your article helped me a lot, is there any more related content? Thanks!
0055betapp
13 janvier 2026 at 22h43

Yo! 0055betapp is where it’s at for a quick flutter. Easy to use, and I had a decent win last week. Check it out! 0055betapp
lkiwin
13 janvier 2026 at 22h43

Lkiwin’s my go-to for some chill gaming. It’s not going to make you rich, but it’s a bit of fun after work. Got a few bonuses too, which is always a plus. Check it out! lkiwin
betrupeesapp
13 janvier 2026 at 22h43

Been using Betrupeesapp for a while now. The app is actually pretty decent, loads quickly and easy to navigate. Definitely recommend giving it a look! betrupeesapp
pokerbaaziplay
16 janvier 2026 at 23h01

PokerBaaziPlay is where it’s at for poker in India! Easy to navigate, good user interface, and feels super secure. Been playing here for a while and haven’t had any issues. If you’re serious about your poker game, give it a shot! You can play here: pokerbaaziplay
dpbossnetresult
16 janvier 2026 at 23h01

Need your Satta Matka results quick? DPBossNetResult seems up to date. UI is OK and Results seem on the money. Here’s the resource: dpbossnetresult
ez777c
16 janvier 2026 at 23h02

Hey guys, i’m digging EZ777c! Pretty user-friendly, good for a quick game when you’re on the go . Take a peek for yourself!: ez777c
binance
19 janvier 2026 at 13h42

Can you be more specific about the content of your article? After reading it, I still have some doubts. Hope you can help me. https://accounts.binance.com/register-person?ref=IXBIAFVY
binance sign up
21 janvier 2026 at 20h32

Your point of view caught my eye and was very interesting. Thanks. I have a question for you.
创建Binance账户
1 février 2026 at 2h43

Thank you for your sharing. I am worried that I lack creative ideas. It is your article that makes me full of hope. Thank you. But, I have a question, can you help me?
create binance account
9 février 2026 at 12h44

I don’t think the title of your article matches the content lol. Just kidding, mainly because I had some doubts after reading the article.
binance sign up
10 février 2026 at 0h05

Thanks for shening. I read many of your blog posts, cool, your blog is very good.
Binance推荐码
10 février 2026 at 19h12

Can you be more specific about the content of your article? After reading it, I still have some doubts. Hope you can help me. https://accounts.binance.info/pt-BR/register-person?ref=GJY4VW8W
gametixiugo88
12 février 2026 at 7h54

For a bit of fun, I found gametixiugo88.com. I would go back for a test run, maybe sign up to use it more! Take a look gametixiugo88
v888online
12 février 2026 at 7h54

Wanting to dabble a little during lunch, and I found v888online. Not stunning, but it works! Try it out v888online
pg888login
12 février 2026 at 7h54

Signed up for pg888login and the process was super smooth. No hassle, got straight into the action. Give it a go and see for yourself. Get started here: pg888login
Anonyme
13 février 2026 at 2h55

Your article helped me a lot, is there any more related content? Thanks!
Bonus de parrainage Binance
13 février 2026 at 8h45

Thanks for sharing. I read many of your blog posts, cool, your blog is very good.
бнанс акаунт
16 février 2026 at 11h27

I don’t think the title of your article matches the content lol. Just kidding, mainly because I had some doubts after reading the article.
Μπνου αναφορ Binance
18 février 2026 at 0h33

Can you be more specific about the content of your article? After reading it, I still have some doubts. Hope you can help me.
бнанс код
19 février 2026 at 7h03

Thanks for sharing. I read many of your blog posts, cool, your blog is very good.
binance h"anvisning
21 février 2026 at 13h37

Thanks for sharing. I read many of your blog posts, cool, your blog is very good.
😈 Balance +1,824680 BTC. Log In -> yandex.com/poll/MHjpsbzYiRKpBEU48DzHgH?hs=ae8fe684e65ae63e81fcbcfffc868c84& 😈
2 mars 2026 at 4h38

jsrwfr
binance Registrera
6 mars 2026 at 14h14

I don’t think the title of your article matches the content lol. Just kidding, mainly because I had some doubts after reading the article.
b"asta binance h"anvisningskod
8 mars 2026 at 14h37

Can you be more specific about the content of your article? After reading it, I still have some doubts. Hope you can help me.
binance US-registrera
14 mars 2026 at 18h28

Can you be more specific about the content of your article? After reading it, I still have some doubts. Hope you can help me.
免费Binance账户
15 mars 2026 at 1h59

Can you be more specific about the content of your article? After reading it, I still have some doubts. Hope you can help me.
注册免费账户
18 mars 2026 at 16h52

Your article helped me a lot, is there any more related content? Thanks!

Bases des modèles conversationnels I : principes de fonctionnement

1. Modèles de Langage

2. Modèles de langages question/réponse et conversationnels

3. Véracité et hallucinations

4. Apprentissage spécialisé

29 Comments

Laisser un commentaire

Articles récents

Commentaires récents

Archives

Catégories