LE CHAOSTRON.

(Un progrès décisif en neuronique)


Le concept du Chaostron s'est développé à partir d'observations des mécanismes d'apprentissage des animaux en situation de stress.

En 1948, Antoine Boudu a étudié le comportement du chat en milieu aquatique. Typiquement, un chat confiné dans une cage complètement immergée dans l'eau témoigne d'abord d'une période d'activité désordonnée, apparemment aléatoire, qui met en jeu une grande activité musculaire. Ce type de comportement disparait, quelquefois très rapidement, quand l'animal découvre qu'en réduisant sa dépense d'énergie, il peut cesser son activité respiratoire. Incontestablement, un apprentissage a lieu puisque la répétition du stimulus ne provoque pas la réapparition de comportement (inadapté) initial.

Jean-Claude Pino-d'Hère a rapporté des faits étonamment similaires dans son travail monumental sur le dépit religieux des chimpanzés. Bien qu'en désaccord avec Pino-d'Hère sur certaines de ses conclusions, nous nous accordons sur l'essentiel: en situation de stress, une phase initiale d'apprentissage par essais et erreurs précède la découverte de la solution, solution qui est atteinte quelquefois brutalement, dans sa forme complète et définitive.

Ce principe est à la base du Chaostron. Les auteurs soutiennent fermement que le succés d'un processus d'apprentissage automatique réside dans la génération préalable de réponses aléatoires de la part de la machine. Nous pensons que l'échec des expériences précédentes est dû à deux problèmes: un, la difficulté d'obtenir un degré de hasard suffisant dans la structure de la machine, et, deux, la difficulté de construire un dispositif suffisamment grand pour que son fonctionnement ne soit significativement influencé par aucun de ses composants en particulier.

Nous sommes profondément reconnaissants au Docteur Ravishanagandra pour sa suggestion qui nous a permis de nous affranchir de ces difficultés. Pour la conception du Chaostron, nous sommes partis de 14000 plans de câblage rachetés à CII-Honeywell-Bull, nous les avons coupés en carrés de deux centimètres de côté, consciensieusement secoués dans un grand sac, puis fait coller en feuilles de taille convenable par un manipulateur aveugle. Des contrôles sévères ont été effectués pendant l'assemblage et des tests statistiques ont permis de détecter l'apparition d'indésirables régularités.

Malheureusement, nous n'avons pu encore mener à bien le câblage du Chaostron. Nous pensons cependant qu'il devrait être possible d'estimer l'efficacité du Chaostron bien avant son achèvement grâce à une simulation sur un calculateur numérique ultra-rapide. Ce procédé a eu l'avantage supplémentaire d'éveiller l'intérêt des délégués de la Mission Inter-Ministérielle à l'Informatique (MIMI) qui a vu dans le Chaostron une solution originale pour gérer le trafic du réseau téléphonique. La Direction Générale des Télécommunications, en contrepartie, ont eu la générosité d'offrir du temps de leurs ordinateurs pour la simulation du Chaostron.

Pour exécuter la simulation, le choix de l'ordinateur s'est porté sur le CRAY-1, machine qui non seulement opère à des vitesses très élevées, mais de plus accepte en entrée des programmes codés en PADBOL, langage qui ressemble de près au Français administratif. Nous avons trouvé très important d'utiliser, pour le programme de simulation, un langage source qui contiendrait autant d'ambiguités que le langage naturel, afin qu'une précision exagérée des spécifications d'entrée ne puisse pas orienter accidentellement la machine vers la solution souhaitée.

En réalité, il n'a pas été possible d'obtenir un CRAY-1 pour ce projet, et donc nous avons mené l'expérience en simulant le CRAY-1 qui simulait le Chaostron sur un Apple II. Tous les essais furent menés avec un protocole similaire: on présente à l'ordinateur une séquence de cercles, de carrés et de croix figurés sur des cartes perforées, et on lui demande d'imprimer, après avoir examiné chaque stimulus, un des mots "cercle", "carré" ou "croix". Aucun renforcement n'était apporté par l'expérimentateur, car nous avions peur qu'un tel renforcement ne fausse le processus d'apprentissage, et donc infirme la validité des conclusions que nous en tirerions.

Les premiers essais ont été effectués avec les stimuli d'entrée représentés sur cartes perforées par des perforations disposées selon les formes géométriques désirées. A titre de référence, un essai a été fait sans charger de programme dans la machine, afin de s'assurer que la vitesse d'apprentissage de la machine seule était suffisamment faible pour ne pas interférer avec les essais suivants. Pour cet essai, la mémoire de la machine a été remise à zéro, et les cartes contenant les figures ont été placées dans le lecteur de cartes, puis on a appuyé sur le bouton "départ" du lecteur de cartes. Après trois heures, la machine n'avait pas imprimé sa réponse à la première figure présentée; de toute évidence, la vitesse d'apprentissage dans ces conditions est très faible (de l'ordre de 10E-6 concepts par méga-an).

Puis nous avons continué avec la série principale des essais au cours desquels un programme aléatoire était chargé dans l'ordinateur avant chaque jeu de cartes. Nous avons effectué au total 133 essais au hasard dans une séquence désordonnée. Même dans cette série d'essais, la machine a mis un temps bizzarement long avant de répondre à nos sollicitations; dans la plupart des cas, nous avons du mettre fin à l'essai avant même l'arrivée de la première réponse. Cependant, au cours de l'essai 73, l'ordinateur répondit:

***/ $ AX$, )U ,,,,,

au premier stimulus (un carré); pendant l'essai 114, il répondit

666666666666666666666666666666666666666

à chaque stimulus, et dans l'essai 131, l'ordinateur éjecta deux fois le papier de l'imprimante.

Malheureusement, des difficultés budgétaires nous forcèrent à abandonner cette approche après 133 essais, malgré l'apparence prometteuse des premiers résultats. Notre conclusion, par la force des choses, est donc basée sur un échantillon plus petit que ce que nous aurions souhaité. Cependant, certains points sont clairs:

1) Le modèle du renforcement corrélatif de l'apprentissage de Debeux et col. est infirmé par nos résultats. Aucun système tri-phasique ne pourrait fonctionner avec un degré d'organisation dépassant celui que nous avons utilisé au cours des simulations. Même un tel degré de structuration s'est traduit par une réponse extrêmement lente à des stimuli somme toute simples.

2) Il semble évident que, pour comprendre la capacité d'apprentissage des machines, il faudra resynthétiser en termes opérationnels du canevas conceptuel proposé par Liebwald-Schurstein-Higgins que les traces mémorielles sont rafraîchies par incréments stochastiques d'associations sur des circuits idiométriques partagés par les éléments fonctionnels couplés au stimulus.

3) Non seulement les machines sont capables d'apprendre, mais en plus elles peuvent le faire dans des conditions considérablement difficiles. En fait, il apparaît que même les machines les plus simples ont un certain degré du "curiosité" innée (où par "curiosité" nous n'entendons pas, bien sûr, que des jugements de catégorie anthropomorphiques doivent être appliqués à des machines, mais tout simplement que les machines ont la volonté d'apprendre).

Toute notre reconnaissance et nos remerciements vont à Monsieur Puffadé, pour son assistance lors de la conception du Chaostron, et à Monsieur Vyssotsky la simulation manuelle de l'Apple II simulant le Cray-1 simulant le Chaostron pour terminer l'essai 133 après l'épuisement du budget.


[Retour au sommaire]