Module 1: Classification Visuelle

Phase d'observation

Observez ces exemples. Les MARD et les ZAN ont des caractéristiques distinctes.

Module 1: Classification Visuelle

Phase de test

Classifiez ces images en MARD ou ZAN :

Module 1: Classification Visuelle

Explication

Avez-vous trouvé la règle "homme/femme" ? D'autres associations étaient possibles cheveux longs / cheveux courts, avec barbe / sans barbe, etc. Plusieurs règles peuvent fonctionner pour la même classification !

Vous avez associé les entrées (ici les photos) à la sortie (ici le mot zan ou le mot mard).
Comme vous à l'instant, les LLM (Large Language Models) déterminent une "formule" qui associe des entrées (du texte) à une sortie (le prochain mot).
Si cette formule est correcte, elle donnera de bonnes prédictions sur de nouvelles entrées.

Mais vous avez probablement utilisé des concepts visuels de haut niveau comme la longueur des cheveux, la présence de barbe, ou d'autres caractéristiques morphologiques.

Les LLM, eux, n'ont pas accès à ces concepts au début de leur apprentissage. Ils partent directement des pixels de l'image et doivent apprendre à reconnaître les patterns à travers des millions d'exemples.

Module 2: Pattern Textuel

Phase d'observation

Observez ces transformations mot → lettre :

Entrée: Mot Sortie : Lettre
LOGIQUEG
ABRICOTT
LOVEV
OBLIGERB
PAYSP
COMMUNM

Module 2: Pattern Textuel

Phase de test

Trouvez la lettre correspondante pour chaque mot :

Module 2: Pattern Textuel

Explication

La règle était : prendre la lettre après le "O", ou la première lettre si le mot ne contient pas de "O".

Ce type de tâche est plus abstrait que la classification visuelle. Vous avez cherché une règle logique en analysant les exemples.

Un LLM, lui, ajuste des milliards de paramètres de manière à réduire de plus en plus ses erreurs de prédictions.

Module 3: Transformation Numérique

Phase d'observation

Observez ces transformations nombre → résultat :

Entrée : Nombre Sortie : Nombre
0714
4310
1613
1817
2614
1511

Module 3: Transformation Numérique

Phase de test

Trouvez le résultat pour chaque nombre :

Module 3: Transformation Numérique

Explication - Visualisation du réseau neuronal

La formule était : 1 × dizaines + 2 × unités

Exemple : 14 → 1×1 + 2×4 = 9

⚠️ Un vrai LLM est bien plus complexe !

  • Votre formule avait en quelque sorte deux paramètres, les LLM ont quant à eux des milliards de paramètres à régler !
  • En entrée, on leur fournit des listes de millions de nombres et en sortie, une liste de milliers de nombres doit être associée.

Conclusion

Cette activité vous permet d'appréhender ce qui se passe "dans la tête d'une IA". Mais vous devez être conscients des différences :

Nous (humain)

→ Cherchons une règle logique

→ Utilisons des concepts de haut niveau

→ Comprenons le "pourquoi"

→ Généralisons avec peu d'exemples

Un LLM (IA)

→ Ajuste des milliards de nombres

→ Minimise l'erreur mathématique

→ Obtient une formule qui intègre des "patterns"

→ Ne part pas avec des concepts de haut niveau

Les LLM sont des machines à prédire extraordinairement sophistiquées.

Sources