Transcript
APPROCHE PSYCHOPHYSIOLOGIQUE
DES INTERACTIONS HOMME-MACHINE
L’opérateur humain n’est pas seulement une entité abstraite, un agent cognitif désincarné, mais un sujet concret socialement situé dont les processus mentaux sont assujettis à un certain nombre de contraintes neuro-psycho-physiologiques.
LES MODALITES DU TRAITEMENT DE L’INFORMATION VISUELLE ET AUDITIVE
La perception visuelle est évidemment conditionnée par un certain nombre de facteurs physiques liés à la nature du stimulus lumineux et aux caractéristiques du système visuel humain. Nous n’envisagerons pas ici les premières bien que les notions de luminosité, de contraste, de saturation, de contour, de texture, de fréquence spatiale (voir annexe) devraient être connues de tout utilisateur d’un programme de traitement d’image un peu sophistiqué (toutes ces notions sont fort bien documentées in Bagot, 1996). Si donc, nous n’en dirons pas davantage à leur propos, il importe, en revanche, d’insister sur quelques caractéristiques de l’organisation des systèmes visuel et auditif.
La distribution des récepteurs rétiniens
On sait qu’il existe deux types de récepteurs rétiniens : les cônes et les bâtonnets. Seuls les premiers permettent la perception des couleurs mais leur seuil de sensibilité est plus élevé que celui des bâtonnets qui eux sont plus sensibles mais ne permettent de percevoir que des nuances de gris. En termes de luminance la sensibilité des cônes est de six à dix fois moindre que celle des bâtonnets. De plus, ces deux types de récepteurs sont répartis différemment sur la rétine : les cônes sont principalement localisés au centre (notamment au niveau de la fovéa) et les bâtonnets à la périphérie. La fovéa est une petite dépression circulaire d’environ 1,5 mm de diamètre (correspondant à 5 degrés d’angle visuel). La partie la plus profonde de cette dépression d’un diamètre de 0,3 à 0,6 mm (soit 1 à 2 degrés d’angle visuel) est particulièrement adaptée à une vision précise et détaillée. C’est pourquoi nous déplaçons sans cesse la direction du regard afin que l’image des objets se projette au centre de la fovéa. Au-delà de la fovéa commence la surface de la rétine dite périphérique.
La sensibilité différentielle des récepteurs : seuil absolu et seuil différentiel
L’œil perçoit les radiations de longueur d’onde comprise entre 400 nanomètres (violet) et 700 nanomètres (rouge). C’est le spectre de la lumière visible. Mais l’oeil n’est pas également sensible à toutes les longueurs d’onde et cela dépend de l’intensité lumineuse ou des conditions d’éclairement. Dans les situations courantes (lumière naturelle du jour, éclairage artificiel) on parle de vision photopique. Dans la pénombre, au crépuscule on parle de vision mésopique (faible éclairement) et dans la quasi obscurité (nuit noire) on parle de vision scotopique. En vision photopique le maximum de sensibilité est décalé vers le rouge alors qu’en vision mésopique et plus encore scotopique la sensibilité maximale est dans le bleu (plus courtes longueurs d’onde). Ce déplacement de la courbe de sensibilité de la rétine quand on passe de la vision photopique (vision diurne) à la vision scotopique (vision nocturne) ou mésopique (faible éclairement) est connu sous le nom de « phénomène de Purkinje » (le physiologiste tchèque qui l’a décrit). Pour les très faibles éclairements l’œil est donc plus sensible aux courtes longueurs d’ondes. Ainsi, dans les vitraux, les rouges dominent en plein jour alors que les bleus restent visibles longtemps après le coucher du soleil. Même si la plupart du temps les présentations sont faites à l’écran en condition largement photopique, il ne faut pas oublier que l’abaissement de l’intensité lumineuse consécutif à certains choix de couleurs ou de style de fond d’écran peut entraîner un changement significatif de la perception des éléments présentés.
Les seuils de sensibilité varient également en fonction de l’excentricité rétinienne, les plus élevés étant observés au centre de la fovéa (moindre sensibilité des cônes). Hors de la fovéa les seuils s’abaissent quand augmente l’excentricité rétinienne pour atteindre un minimum à 20°. Lorsque les autres facteurs sont maintenus constants, le seuil diminue également lorsque la durée de présentation augmente. Il diminue de même lorsque la taille angulaire du stimulus lumineux augmente. L’intensité liminaire d’une source lumineuse dépend donc du nombre de quanta émis par unité de durée et de surface. En clair, plus la source est petite et plus sa durée est brève plus il faut d’intensité pour la percevoir.
Quant à la sensibilité au mouvement, elle dépend de la vitesse et de l’amplitude du déplacement : elle augmente avec la durée de présentation et avec l’excentricité rétinienne (la détection d’un déplacement est meilleure en vision périphérique), elle diminue quand la luminance augmente.
Hémichamps visuels et hémisphères cérébraux
On sait que chaque moitié du corps est en relation croisée avec les hémisphères cérébraux qui sont reliés par plusieurs commissures inter-hémisphériques dont la principale est constituée par le corps calleux qui compte, chez l'homme adulte, environ 200 millions de fibres (voir Lambert, 1998). Ces fibres relient les aires corticales homologues des deux hémisphères. Ainsi, la main droite est commandée par l'hémisphère gauche et la sensibilité générale de la moitié gauche du corps se projette dans l'hémisphère droit. Il en va de même pour les muscles du visage dont chaque moitié est contrôlée par l’hémisphère opposé dit controlatéral (voir infra).
Or, il n'en va pas de même pour les voies visuelles. Ce n'est pas l'oeil gauche qui projette dans l'hémisphère droit mais l'hémichamp gauche et inversement l’hémichamp droit projette dans l’hémisphère gauche. Chaque hémisphère reçoit l'information en provenance de l'hémichamp opposé indépendamment de l'oeil considéré. Les deux hémichamps sont définis par le plan contenant l'axe optique de l'oeil passant par la fovéa. Quant à la commande de la direction du regard, elle est globalement croisée, c'est-à-dire qu'un déplacement des globes oculaires vers la droite est sous le contrôle de l'hémisphère gauche et réciproquement. Certains ont prétendu voir dans l'asymétrie de l'orientation du regard un reflet de la dominance hémisphérique. Ainsi une activité cognitive contrôlée par un hémisphère aurait tendance à déclencher des mouvements des yeux du côté opposé. Les sujets sollicitant davantage leur hémisphère gauche « analytique et verbal » auraient tendance à diriger spontanément leur regard vers la droite (voir infra). On pourrait envisager d’adapter la présentation des données en renforçant tantôt l’approche textuelle (formelle), tantôt l’approche figurale (iconique), à partir de l’analyse de mouvements spontanés du regard de l’apprenant (voir infra).
Toute stimulation apparaissant dans le champ visuel gauche (cvg) est donc adressée à l’hémisphère droit (HD), et toute stimulation apparaissant dans le champ visuel droit (cvd) est adressée à l’hémisphère gauche (HG). La stimulation unilatérale (dite stimulation en champ visuel divisé) permet ainsi d’adresser un message initialement à un seul hémisphère, à condition que cette stimulation respecte deux contraintes. La première est spatiale : la stimulation doit se faire hors de la zone fovéale (qui a une projection bi-hémisphérique), c’est-à-dire à au moins deux degrés d’angle visuel à droite ou à gauche du point de fixation. La seconde contrainte est temporelle : la stimulation doit avoir une durée inférieure au temps de déclenchement d’une saccade oculaire (durée inférieure à 200ms, voir infra). La technique permet de vérifier que la détection des stimuli linguistiques est meilleure lorsqu’ils sont présentés dans l’hémichamp droit (hémisphère gauche) alors que l’on constate l’inverse pour les stimuli non linguistiques.
La perception des couleurs
On sait que l’on peut obtenir n’importe quelle couleur par addition de trois couleurs primaires . On parle de synthèses colorées mais il convient de distinguer la synthèse additive, (bleu, vert, rouge) réalisée à partir de plusieurs sources lumineuses et la synthèse soustractive (bleu, jaune, rouge), celle des peintres, réalisée avec une source de lumière unique et constante (lumière ambiante). On comprend que pour imprimer sur papier l’image couleur d’un écran d’ordinateur, il faut passer d’un système de synthèse à l’autre, ce qui n’est pas toujours sans déboires. En synthèse additive, l’addition des trois lumières primaires en proportion égale donne du blanc. La synthèse additive est d’application quotidienne et universelle puisque tous les écrans de télévision et les moniteurs vidéo utilisent cette synthèse.
Percevoir c’est identifier
Percevoir un objet c’est l’identifier, en reconnaître les caractéristiques spécifiques, le rattacher à une catégorie, pouvoir le nommer. Cette perception est conditionnée par le traitement des différents attributs du stimulus visuel (forme, couleur, position, etc.). Elle met en jeu des processus de haut niveau impliquant diverses structures cérébrales dont le dysfonctionnement est à l’origine des agnosies. Dans le cas d‘une agnosie visuelle, le patient voit bien l’objet mais ne le reconnaît pas. Les modalités de la détection des attributs pertinents et la synchronisation de leurs traitements font actuellement l’objet de recherches prometteuses.
On doit aux psychologues de la Gestalt l’établissement des lois de l’organisation perceptive (similitude, proximité, destin commun, continuité, prégnance, signification) et des principes assurant la ségrégation figure-fond qui dépend notamment de l’orientation, de la symétrie, de la taille, de la convexité et de la signification de l’image. Certains auteurs postulent l’existence de primitives visuelles c’est-à-dire de formes canoniques élémentaires à la base de la perception comme la courbure, l’inclinaison ou la fermeture d’une ligne. Selon Biederman (voir Biederman et Kaloczat, 1997), les primitives seraient des volumes géométriques élémentaires qu’il a appelés des « géons » (contraction de geometric ions). La constance de la taille et la constance de la forme dépendent directement de la perception de la profondeur qui repose elle-même sur des indices à la fois monoculaires (point de fuite, taille apparente, gradient de texture, ombres, accomodation) et binoculaires (convergence des yeux, disparité rétinienne).
On voit donc que non seulement la taille et la couleur d’une figure ou d’un mot sont importants pour leur saisie et leur traitement mais également leur position relative sur la rétine (centrale ou périphérique) lors d’une fixation oculaire (voir infra). On retiendra ici l’importance du contraste de luminance, de la fréquence spatiale (voir annexe), de la centralité (ou excentricité) rétinienne et de la ségrégation des hémichamps dans le traitement central de l’information visuelle. Comme nous l’envisagerons plus loin ce traitement est également directement dépendant des processus attentionnels (voir infra) et des stratégies oculomotrices (voir infra).
Voies auditives et hémisphères cérébraux
Contrairement à la rétine qui se projette par moitié sur chaque hémisphère, chaque oreille envoie de l’information aux deux hémisphères. Certaines données physiologiques montrent cependant que les voies ipsilatérales (du même côté) sont plus faibles, moins nombreuses et ont des vitesses de conduction plus lentes que les fibres controlatérales (du côté opposé). Ainsi donc, les messages saisis par l'oreille gauche sont essentiellement traités par l'hémisphère droit et réciproquement. Il s’ensuit que, chez le sujet standard, l’oreille droite est généralement plus sensible aux sons linguistiques (traitement à dominante hémisphère gauche), alors que l’oreille gauche est davantage sensible aux sons non-linguistiques (bruits de la nature, musique) dont le traitement est à dominante hémisphère droit. Lorsque deux items sont présentés simultanément, un à chaque oreille (situation dite d’écoute dichotique), la voie ipsilatérale (du même côté) est inhibée ou supprimée. En conséquence, l’information présentée à chaque oreille projette d’abord, voire exclusivement, sur l’hémisphère controlatéral (opposé). En condition d’écoute dichotique le stimulus sonore présenté à l’oreille droite est traité directement par l’hémisphère gauche alors que celui arrivant à l’oreille gauche sera d’abord traité par l’hémisphère droit avant de transiter éventuellement par le corps calleux pour être secondairement traité par l’hémisphère gauche. La technique de l’écoute dichotique permet notamment de mettre en évidence les phénomènes d’attention sélective (voir infra).
Comme nous ne pouvons traiter consciemment que l’information d’un seul canal à la fois (le canal dominant étant généralement celui de l’oreille droite-hémisphère gauche) il pourrait être utile de tenir compte de cette spécificité du traitement des signaux acoustiques dans la présentation des données sonores (linguistiques et non) ou lors de la mise au point de certains environnements sonores virtuels.
Spécialisation hémisphérique et gestion de l’espace
Les lobes temporaux sont directement impliqués dans la mémoire spatiale mais chacun semble y jouer un rôle spécifique. La mémoire proprement topographique (représentation globale d'un lieu, cognitive map) est plutôt le fait de l'hémisphère droit puisque les lésions postérieures de cet hémisphère provoquent une agnosie spatiale. Les capacités d'orientation séquentielle et verbalisée seraient davantage le fait de l'hémisphère gauche analytique (« tourner au feu à droite, prendre la troisième à gauche, entrer à côté du boulanger... »). Ainsi un déplacement habituel dans une ville connue est principalement géré par l'hémisphère droit alors qu'un déplacement inhabituel ou dans une ville inconnue sera plutôt géré par l'hémisphère gauche.
Dans les tests de reconstitution 3D d'une figure 2D présentée dans l'un ou l'autre hémichamp (comme un cube ou un tronc de pyramide) l'hémisphère droit qui manipule globalement les représentations est plus rapide et plus performant que l'hémisphère gauche qui résout logiquement le problème en comptant les côtés de la figure et en comparant les longueurs. Avec les cubes de Kohs il en va de même. De sa main gauche, un patient commissurotomisé réalise des figures qui ont une harmonie globale et reflètent la forme du modèle. Au contraire les figures réalisées par sa main droite s'attachent à reproduire un détail ou un concept du modèle.
Le test de temps de réaction composite confirme la spécificité de chaque hémisphère. Des noms de couleurs sont présentés dans chaque hémichamp en lettres de couleur différente de celle indiquée (par exemple vert en lettres rouges). Il s'agit de répondre soit à la couleur des caractères, soit au nom (de couleur). Les temps de réaction de la main droite (hémisphère gauche) sont inférieurs à ceux de la main gauche pour le critère sémantique et inversement pour le critère figuratif (effet Stroop).
Si on demande à un patient droitier de dessiner un cube en perspective avec chacune de ses mains avant une callosotomie6, le dessin de la main droite est évidemment meilleur que celui de la main gauche. Après l'opération c'est exactement le contraire : la main gauche (hémisphère droit), bien que malhabile, dessine un vrai cube en perspective alors que la main droite (hémisphère gauche) est incapable de rendre cette perspective et ne peut dessiner que les caractéristiques logiques de la figure.
Dans la mesure où l’hémisphère droit a une gestion plus globale et plus rapide des formes géométriques et dans la mesure où lui sont adressées directement les informations provenant de l’hémichamp visuel gauche, il peut être judicieux de disposer certains types de figures plutôt à gauche de l’écran ou, plus précisément, à gauche des éléments textuels.
LANGAGE ET SPECIALISATION HEMISPHERIQUE
Spécificité et coopération
L’étude des patients aphasiques et aujourd’hui les techniques d’imagerie cérébrale ont permis de montrer une implication particulière de l’hémisphère gauche dans la gestion du langage, pour la majorité des humains (quelle que soit la culture et même pour la majorité des gauchers). Inversement, l’hémisphère droit paraît « dominant » pour le traitement des informations visuo-spatiales. Cela ne signifie pas cependant que le langage soit une fonction exclusive de l’hémisphère gauche. Ce dernier intervient également dans la gestion de l’espace et l’hémisphère droit est impliqué dans la gestion du langage mais chacun différemment. L’hémisphère gauche gère davantage les aspects phonologiques et syntaxiques du langage et l’hémisphère droit les aspects prosodiques et émotionnels. De même pour le traitement des données visuo-spatiales l’hémisphère droit opère de façon globale et parallèle alors que l’hémisphère gauche opère de façon analytique et séquentielle. Il est donc excessif de dire que l’hémisphère gauche est « verbal » et l’hémisphère droit, « spatial ». Chacun participe à l’ensemble des fonctions mais de manière spécifique, le cerveau gauche étant particulièrement impliqué dans le traitement des relations catégorielles (qui sont facilement désignées par un ou deux mots) et le cerveau droit paraîssant meilleur dans le traitement des relations de type « coordonnées » (voir Springer et Deutsch, 2000).
Le traitement cognitif des signes linguistiques
Les techniques d’imagerie fonctionnelle ont permis de mettre en évidence différents niveaux de traitement des signes linguistiques et de montrer notamment qu’un mot ne se réduit pas à une chaîne de caractères et qu’un récit n’est pas qu’un assemblage de mots. L’activation cérébrale est plus importante lorsqu’il s’agit de regarder des mots que lorsqu’il s’agit de regarder un point de fixation. Mais le traitement des mots eux-mêmes ne se réduit pas à celui d’une chaîne de caractères. Une chaîne de faux caractères active principalement le lobe occipital droit (traitement purement visuo-spatial). Une chaîne de lettres n’active que très faiblement le cortex occipital alors que des pseudo-mots activent largement le cortex occipal gauche. Les vrais mots activent également le cortex occipital gauche mais de façon plus limitée (il s’agit seulement ici de regarder – passivement - les mots).
D’autres résultats montrent que l’activation cérébrale est différente selon qu’il s’agit pour le sujet de regarder passivement des mots, de les écouter, de les prononcer ou de générer des verbes. La vision passive des mots active de façon plus importante une aire située tout au long de la surface interne de l’hémisphère gauche. Entendre des mots active un groupe d’aires dans les lobes temporaux des deux hémisphères. Prononcer des mots à haute voix active de façon plus importante les aires bilatérales du cortex moteur, le cortex insulaire, l’aire motrice supplémentaire (AMS) et le cervelet moyen. Générer des verbes donne lieu à une activation plus complexe intéressant le cortex frontal gauche, le gyrus cingulaire antérieur, le lobe temporal postérieur et le cervelet droit.
En outre, lorsqu’un sujet francophone entend une histoire en tamoul qu’il ne comprend pas, seul le cortex auditif est activé bilatéralement. Lorsqu’il écoute une liste de mots en français, qu’il comprend, une partie importante du cortex frontal gauche devient active. Enfin, lorsqu’il comprend une histoire en français, un nombre important d’aires cérébrales s’activent dans les régions temporales et frontales de l’hémisphère gauche.
Par ailleurs, l’examen de patients cérébrolésés dans la région temporale a permis de mettre en évidence un déficit sélectif de la dénomination des personnes, des animaux et des outils. Les lésions du pôle temporal affectent particulièrement la dénomination des personnes, les lésions inféro-temporales celle des animaux et les lésions temporales postérieures la dénomination des outils. Ces résultats sont confirmés par l’examen de l’activation cérébrale de sujets neurologiquement sains durant la démonination des mêmes catégories linguistiques. La dénomination de personnes active principalement le pôle temporal, celle d’animaux la portion moyenne des gyrus temporaux inférieurs et la dénomination d’outils active préférentiellement les portions postérieures du gyrus temporal inférieur.
Ces résultats apportent un éclairage nouveau au problème de la segmentation des données textuelles : présenter, par exemple, une consigne mot à mot n’implique pas le même type de traitement que la présentation de phrases complètes isolées ou groupées en paragraphes. De plus, le fait que l’activation cérébrale soit différente selon le niveau d’implication du sujet (regarder, écouter, générer) et selon la nature de l’élément désigné doit inciter à ne pas laisser l’apprenant en situation de lecture ou d’écoute passives mais à le faire participer activement au décodage (au « reformatage ») de l’information qui lui est transmise.
Incidence de la culture sur la spécialisation hémisphérique
Chez le sujet occidental standard les sons non verbaux ainsi que les voyelles sont gérés principalement par l'hémisphère droit alors que les sons linguistiques, en particulier les consonnes, et le calcul sont gérés préférentiellement par l'hémisphère gauche. Il n’en va pas de même pour les Japonais chez qui l'ensemble des sons du langage (voyelles et consonnes) et des sons naturels est géré, avec le calcul, par l'hémisphère gauche. Ce dernier intègre ainsi le logos, le pathos et la nature. Chez les Japonais l'émotion et les fonctions logiques fondées sur le langage sont gérées par le cerveau verbal. Au contraire les non Japonais ont un hémisphère droit dominant pour les fonctions et les sons liés à l'émotion. Il semblerait donc que la latéralité de l’expression des émotions s'acquiert, au moins en partie, par la langue maternelle.
Les langues à tons comme le chinois, qui confèrent une signification à l'aspect mélodique des mots, semblent également aller de pair avec une organisation cérébrale différente de celle décrite pour les langues occidentales. L'hémisphère droit (auquel on associe la perception des mélodies) y joue certainement un rôle plus important puisque l'aphasie croisée n'est pas rare chez les locuteurs des langues à tons. En fait, on ne constate pas chez les Chinois une réelle prévalence de l'hémisphère droit pour le langage oral mais plutôt une moindre exclusivité de l'hémisphère gauche. En revanche, pour ce qui est du langage écrit, il semble bien que l'hémisphère droit soit davantage impliqué qu'il ne l'est chez le sujet standard, ceci pouvant être directement rapporté au fait que les caractères chinois sont plus proches du dessin que l'écriture alphabétique. De plus, il semble que les lésions de l'hémisphère droit, chez les Chinois, perturbent davantage la reconnaissance des caractères isolés que la gestion des phrases. On peut rapprocher ceci du fait que pour beaucoup de spécialistes, la reconnaissance d'un caractère chinois s'apparente fortement à celle d'un visage et l'on sait le rôle joué par l'hémisphère droit dans ce type de reconnaissance (voir infra).
Les écritures idéographiques sont susceptibles de conférer aux rapports cerveau-langage une organisation particulière. Le japonais, par exemple, peut s’écrire selon deux codes différents : un code syllabique semblable au nôtre (le mode kana) et un code idéographique (le mode kanji). Les techniques d'imagerie fonctionnelle montrent que quel que soit le système d'écriture, l'hémisphère gauche est plus actif mais l'usage des kanjis implique une activité cérébrale globale deux à trois fois plus élevée que celle des kanas. Ces résultats montrent également que les kanjis sollicitent, en plus des aires habituelles de l'hémisphère gauche, diverses zones pariétales et temporales de l'hémisphère droit. Lorsque les idéogrammes constituent le seul code écrit, leur traitement lexical semble toujours principalement lié à l'hémisphère gauche « verbal » mais leur reconnaissance figurale et leur interprétation sémantique mobilisent davantage l'hémisphère droit.
L’implication relative des hémisphères concernant le langage dépend également du niveau d'alphabétisation. Chez les sujets alphabétisés la supériorité de l'hémisphère gauche n'est que relative. Il existe une certaine « spatialisation » du verbal par l'écriture et la lecture qui implique davantage l’hémisphère droit. Au contraire chez les sujets analphabètes on constate une supériorité absolue de l'oreille droite (hémisphère gauche) pour les sons verbaux, témoignant ainsi d'une spécificité hémisphérique gauche plus marquée. Même si les analphabètes ne constituent pas actuellement un public prioritaire pour le e-learning, la spécificité de leur organisation cérébrale mérite d’être prise en compte dans l’élaboration des programmes de « e-alphabétisation ».
Comme nous l’avons déjà souligné, l’ensemble de ces données plaide en faveur d’une approche ethno-différentielle des objets pédagogiques « exportés » (à vocation universelle), même lorsqu’ils sont rédigés dans une langue occidentale comme le français ou l’anglais.
Performances logiques et calcul
L'hémisphère gauche est davantage impliqué dans le calcul (arithmétique et algèbre) alors que l'hémisphère droit est plus performant pour la gestion globale des formes géométriques. Cependant s'il s'agit de figures géométriques abstraites correspondant à des concepts (triangle, ellipse) c'est l'hémisphère gauche qui reste le plus performant. On peut également souligner que la reconnaissance des chiffres en lettres mobilise exclusivement l’hémisphère gauche alors que les chiffres arabes sont appréhendés par les deux hémisphères
Dans une épreuve d'appariement de figures présentées dans l'un ou l'autre hémichamp, l'hémisphère gauche associe les éléments selon leur fonction (similitude logique) alors que l'hémisphère droit les associe selon leur forme (similitude spatiale). Il s’ensuit que lors d’une fixation oculaire les éléments périphériques à gauche du point de fixation auront tendance à être perçus et catégorisés selon leur apparence (hémisphère droit) alors que ceux situés à droite le seront davantage selon des critères formels et seront plus facilement verbalisables (hémisphère gauche).
En résumé, l'hémisphère gauche, spécialisé dans les fonctions liées au langage apparaît davantage analytique et séquentiel, alors que l'hémisphère droit « visuo-spatial » traite l'information davantage « en parallèle » et donc de façon plus synthétique et globale.
GESTION DES EMOTIONS ET SPECIALISATION HEMISPHERIQUE
Expression des émotions
Nous avons vu précédemment que la prosodie émotionnelle est directement sous le contrôle de l’hémisphère droit, quelle que soit la tonalité affective du discours. Or, l’expression faciale d’une émotion paraît plus marquée dans l’hémiface gauche commandée par l’hémisphère droit. Au demeurant, là encore, il convient de nuancer le rôle privilégiée accordé à cet hémisphère dans le traitement des mimiques faciales. En effet, lorsqu’on demande à des sujets soit d’exprimer librement leur émotion véritable devant une scène difficile, soit de simuler une expression différente (par exemple la joie ou la gaité), seule l’expression volontaire d’émotions simulées se traduit par une forte asymétrie en faveur de l’hémisphère droit (expression plus marquée de l’hémiface gauche). Il semblerait donc que l’expression émotionnelle volontaire soit effectivement commandée par l’hémisphère droit alors que les expressions spontanées auraient une commande davantage symétrique (contrôle diffus et non latéralisé).
Les mécanismes neuronaux commandant les muscles du visage ne sont pas les mêmes dans le cas d'un « vrai » sourire induit par une émotion et dans le cas d'un sourire volontaire non lié à une émotion. Ainsi, le sourire suscité par une joie réelle est réalisé par la contraction involontaire simultanée de deux muscles : le grand zigomatique et l'orbiculaire palbébral inférieur. Ce dernier ne pouvant être commandé que de façon involontaire, un sourire affecté ne mobilise que le zigomatique. En bref, le sourire des yeux est plus franc que celui des lèvres. Bien plus, le cerveau ne peut pas être induit en erreur par des configurations musculaires qui n'ont pas été engendrées naturellement. De récents résultats d'électrophysiologie montrent que les sourires commandés de façon volontaire ne sont pas accompagnés des mêmes types d'ondes cérébrales que les sourires spontanés.
Perception des émotions
Il semble également que la perception des émotions d’autrui, qu’elles soient positives ou négatives, implique davantage l’hémisphère droit : des lésions de ce dernier rendent plus difficile que des lésions de l’hémisphère gauche l’identification des expressions émotionnelles du visage. Le sujet standard est plus touché par l’expression de la partie gauche du visage qui lui fait face, correspondant à l’hémiface droite de ce visage, que par celle de la partie droite du même visage et cela indépendamment de la tonalité de l’émotion exprimée. La reconnaissance de visages chimériques gais-tristes a permis de confirmer ce biais hémisphérique droit de l’observateur (attention portée à la partie gauche du visage qui fait face, correspondant à l’hémiface droite de ce dernier) existant chez les sujets droitiers. La chimère présentant à gauche, en perception directe, une hémiface triste, est reconnue comme triste, celle présentant une hémiface souriante est perçue comme gaie. Chez le sujet déprimé il existe une perte de ce biais hémifacial gauche (du visage observé vu de face), liée vraisemblablement à un excès d’évitement de l’hémisphère droit, tandis que, chez les maniaques, le biais hémifacial gauche est accentué peut-être à la suite d’une moindre inhibition exercée par l’hémisphère droit (lui-même moins actif).
On constate en outre que 90% des observateurs estiment qu'une photo réalisée à partir de deux hémifaces « droite » (partie gauche du visage examiné) est plus conforme au modèle que deux hémivisages « gauche ». Il existe d'ailleurs une tendance naturelle à explorer davantage notre champ visuel gauche, c'est-à-dire la partie droite du visage qui nous fait face. Ainsi, cette partie droite du visage, gouvernée par l'hémisphère gauche, apparaît davantage comme le masque « public » ou « officiel » de notre personnalité. A l'inverse, l'hémivisage gauche, gouverné par l'hémisphère droit davantage lié à la vie émotionnelle, apparaît comme la partie privée ou intime de l'image que nous donnons aux autres.
Hémisphères cérébraux et tonalité émotionnelle
De nombreuses observations de patients cérébrolésés suggèrent que les deux hémisphères sont différentiellement impliqués dans l’activité émotionnelle. Alors que les lésions de l’hémisphère gauche produisent souvent une réaction de type catastrophique (anxiété, pleurs), des lésions équivalentes de l’hémisphère droit se traduisent par une indifférence affective voire même une jovialité inappropriée. De plus, selon certains cliniciens, quand on utilise l'électrochoc dans le traitement de la dépression, on obtient de meilleurs résultats lorsque les électrodes sont placées sur l'hémisphère droit. Il semble donc que l'hémisphère droit gère plutôt les émotions négatives (pessimisme, culpabilité, colère, agressivité, instabilité émotionnelle) et le gauche les émotions positives (euphorie, exaltation, sentiment d'innocence). Ainsi, l'évocation d'un thème triste entraînerait plutôt un mouvement du regard vers la gauche. Un spectacle agréable ou un visage avenant entraînent un accroissement spécifique de l'activité cérébrale du lobe frontal gauche, alors que c'est le droit qui s'active lorsque le spectacle ou le visage sont désagréables. On peut ainsi considérer que placer quelqu'un à sa droite, c'est lui faire l'honneur de le percevoir dans le champ visuel et acoustique de l'hémisphère gauche beaucoup plus facile à satisfaire! Dans la mesure où, comme nous l’avons déjà signal, on peut voir dans la dissymétrie de l'orientation du regard un reflet de la dominance hémisphérique, cette dissymétrie pourrait également informer sur l’humeur : les sujets sollicitant davantage leur hémisphère gauche (associé aux émotions positives) auraient tendance à diriger spontanément leur regard vers la droite et réciproquement les sujets sollicitant davantage leur hémisphère droit (associé aux émotions négatives) auraient tendance à diriger spontanément leur regard vers la gauche.
Approche-évitement
Divers résultats en électroencéphalographie suggèrent en effet que la région frontale gauche serait impliquée dans l’expression de l’humeur positive alors que la région frontale droite serait associée à l’humeur dépressive. Cette différence gauche-droite peut être interprétée en termes d’approche-évitement. Dans cette perspective le système frontal gauche serait lié à l’approche et à l’engagement dans l’action alors que le système frontal droit serait impliqué dans la fuite et l’évitement. L’humeur dépressive pourrait ainsi être associée à un déficit du système dopaminergique qui, dans l’hémisphère gauche, conditionne les conduites de type agoniste.
Ces données pourraient inspirer les concepteurs d’avatars de type anthropomorphe. Elles devraient également être prises en compte dans le mode présentation des informations selon leur tonalité affective propre (positive ou négative) et éventuellemnt selon la tonalité émotionnelle que l’on veut évoquer chez l’usager.
L’ATTENTION DIRIGEE ET LA CONSCIENCE IMPLICITE
L'attention est définie comme « l'activité par laquelle un sujet augmente son efficience à l'égard de certains contenus psychologiques (perception, intellection, souvenir) » (Grand Larousse de la psychologie). Pour maintenir un niveau attentionnel optimum, voire guider l’attention de l’apprenant, il convient de s’interroger sur ses mécanismes sous-jascents. Il existe notamment un lien étroit entre l’attention dirigée et la fixation oculaire dont nous traiterons dans une prochaine section.
Filtrage sélectif ou limitation de capacité?
Dans une problématique du traitement de l'information, l'attention est souvent assimilée à un filtre à capacité limitée. Un premier système - sensoriel - coderait en parallèle toutes les informations entrantes. Un second système - perceptif - assurerait l'identification de ces informations, mais sa capacité de traitement serait limitée. Il devrait donc opérer une sélection parmi les informations lui parvenant à chaque instant. Un tel filtrage attentionnel pourrait être activé de deux manières : soit par des facteurs de préparation ou d'attente qui « accordent » le filtre à certaines informations, soit du fait de la « nouveauté » du stimulus ou de sa non-concordance avec le stimulus attendu. Pour certains auteurs, l'information non-pertinente ne serait pas éliminée mais seulement atténuée. Ainsi, les effets dits « subliminaux » (voir 4.2.) ne seraient pas la conséquence d'un abaissement des seuils sensoriels mais d'un filtrage gradué améliorant le rapport signal/bruit. La position d'un tel filtre dans la chaîne de traitement de l'information n'est pas clairement identifiée. Le fait que les informations situées hors du champ de l'attention puissent néanmoins faire l'objet d'un traitement rend peu plausible l'idée d'un filtrage précoce (au niveau sensoriel ou perceptif) et renforce au contraire l'hypothèse d'un filtrage tardif (au niveau représentationnel ou décisionnel).
D'autres métaphores paraissent mieux adaptées que celle du filtre. L'attention a également été comparée à un réservoir de capacité limitée contenant toutes nos ressources attentionnelles. Selon la nature de la tâche, des ressources différentes sont attribuées au traitement. On constate que dans une situation d'écoute dichotique où des messages différents sont envoyés aux deux oreilles (revoir supra), plus le message pertinent est complexe et requiert d'attention moins le sujet est conscient du second message. En fait ce résultat est variable selon l'oreille à laquelle est adressé le message pertinent. L'attention peut en fait intervenir à n'importe quelle étape du traitement sur la base de règles d'économies visant à minimiser le coût du traitement. La question de savoir s'il existe un « réservoir » unique ou différents « réservoirs » spécialisés ne peut être tranchée. De fait, si l'attention est sélective elle peut être également partagée entre plusieurs tâches.
La flexibilité des ressources attentionnelles a conduit certains auteurs à proposer une distinction entre processus automatiques et processus contrôlés. Les processus automatiques fonctionnant en parallèle ne requièrent que peu ou pas d'attention. Ils mobilisent peu la mémoire de travail. Au contraire, les processus séquentiellement contrôlés (sériels) supposent une forte mobilisation attentionnelle.
Conscience explicite / conscience implicite
Au demeurant, l’attention consciente n’est pas seule (ni même peut-être principalement) impliquée dans la gestion des processus cognitifs. En effet, beaucoup de réponses neuronales se développent sans conduire à aucune expérience consciente. Il existe de nombreuses données attestant de l’existence de traitements très élaborés exécutés à l’insu de la conscience réfléchie.
Voir sans percevoir
Les images dont on n'a pas conscience sont néanmoins perçues par l'organisme. Un stimulus en deçà du seuil perceptif (dont l’intensité ou la durée sont inférieures au seuil absolu) bien que déclaré non perçu par le sujet, peut être pris en compte au niveau infraconscient et influencer de manière déterminante les perceptions et conduites consécutives. On parle de perception sous-liminaire (infraliminaires ou subliminales) ou encore de subception. Ainsi, un mot ou une image présentés de manière subliminale peuvent faciliter ou perturber la perception d’un autre mot ou d’une autre image présentés consécutivement ou après un bref délai : on parle d’amorçage figural, lexical ou sémantique. Dans une tache de décision lexicale11 la reconnaissance du mot cible est facilitée si le mot amorce fait lui-même partie du lexique de la langue : on parle donc d’amorçage lexical. Par ailleurs, on constate que le mot « table » est plus rapidement discriminé précédé du mot « chaise » que précédé de « lion » (tous deux présentés de manière subliminale) mais le mot « tigre » est lui mieux discriminé précédé de « lion » que précédé de « chaise ». On parle alors d’amorçage sémantique. Un mot amorce facilite la discrimination d’un mot-cible sémantiquement relié (quel que soit l’hémichamp visuel). Cette facilitation sémantique est conservée pour la lecture à haute voix et la décision lexicale.
Le sujet « voit sans percevoir » le mot amorce. Le premier stimulus, bien que furtif, n’en est pas moins traité cognitivement et affectivement comme en témoigne le déclenchement de réponses électrodermales (RED) par certains stimulus à forte valeur émotionnelle dont le sujet (conscient) déclare pourtant ne rien savoir. En outre, malgré une telle absence de discrimination consciente, les potentiels évoqués corticaux (précoces et tardifs) corrèlent fidèlement les stimulus infraliminaires ce qui signifie que ces stimulus sont effectivement traités à haut niveau par le système (sub)cognitif.
Le masquage rétrograde
La mise sous tension d’une diode pendant seulement 5 msec suffit à produire une perception consciente de l’événement. En revanche, si dans un délai de quelques dizaines de millisecondes après l’allumage de la diode, on active pendant 50 msec quatre autres diodes placées autour de la première, les sujets ne rapportent que la seconde expérience perceptive et disent ne plus voir la diode centrale s’allumer. On parle ici de masquage rétrograde puisqu’un événement second semble pouvoir interférer avec la perception d’un événement premier correctement perçu lorsqu’il est présenté seul. Pourtant, si l’on demande aux sujets de presser un bouton dès que la diode centrale s’allume, leur temps de réaction confirme qu’il répondent bien à l’allumage de la diode centrale et non à celui des diodes périphériques comme ils en ont l’impression. Les sujets détectent donc correctement le stimulus sans le percevoir consciemment.
Comprendre sans entendre
La technique de l'écoute dichotique permet d'envoyer simultanément aux sujets deux messages auditifs différents (revoir supra). Il leur est demandé d'être attentifs à l'un de ces messages. Chacun d'entre nous a une oreille dominante (généralement la droite) pour les sons linguistiques. Le message entendu sur le canal dominant est facilement répété mais les sujets ne peuvent généralement pas dire grand-chose de ce qui s'est passé en même temps sur l'autre canal. Ils peuvent indiquer qu'ils ont entendu une seconde voix, dire éventuellement que c'était un homme ou une femme et savoir si la voix s'exprimait dans leur langue maternelle mais sont incapables de préciser ce qui a été dit. Dans l'expérience de Lackner et Garrett (1973) ont fait entendre, sur le canal principal, des phrases ambiguës du genre « Le vol n'a duré que dix minutes ». Si l'on ne fait rien entendre sur le canal secondaire (ou quelque chose qui n'a absolument rien à voir) les sujets interprètent aléatoirement ces phrases ambiguës. Mais si en même temps on leur fait entendre sur le canal secondaire une phrase suggérant une interprétation telle que « Un cambriolage a eu lieu » ou « L'avion a eu une panne », ils optent majoritairement pour l'interprétation suggérée bien qu'ils soient incapables de répéter ce qui a été dit sur le canal secondaire. Le message reçu par le canal secondaire doit donc être traité jusqu'au niveau sémantique et être compris bien qu'il ne soit pas consciemment perçu. Il y a dans cette expérience quelque chose de troublant : l'hémisphère gauche est - semble-t-il - capable de rendre compte de certaines informations gérées par l'hémisphère droit sans pouvoir explicitement dire lesquelles alors que l'hémisphère droit serait capable de comprendre un message dont il ne peut explicitement rendre compte!.
Lecture inconsciente
Il a été également montré que la présentation subliminale (43 millisecondes) d’un mot signifiant un chiffre (mot amorce) peut faciliter le traitement d’un second mot (mot cible) signifiant également un chiffre dont il s’agit de décider (en appuyant sur un bouton) s’il est supérieur à une valeur donnée (cinq). Le temps de réaction varie en fonction de la valeur du mot amorce dont le contenu échappe pourtant à l’observateur. Lorsque la valeur du mot cible est supérieure à cinq, les sujets répondent plus rapidement si la valeur du mot amorce est également supérieure à cinq. L’examen EEG et l’imagerie métabolique montrent que le message subliminal modifie l’activité du cerveau y compris dans les zones motrices activées pour appuyer sur le bouton. Bien que le premier chiffre n’arrive pas à la conscience de l’observateur son influence dépasse donc les seules zones perceptives du cerveau. Ceci démontre l’existence d’un traitement inconscient d’opérations cognitives complexes et de la réponse motrice appropriée (Dehaene et al., 1998).
Détection implicite des expressions émotionnelles
Un visage menaçant entouré de visages neutres est détecté plus rapidement (1500 millisecondes en moyenne) qu'un visage amical présenté dans les mêmes conditions (1600 millisecondes). La détection du visage hargneux est encore plus rapide chez les personnes qui sont mal à l'aise en société. Dans une autre expérience on projette, sur un écran d'ordinateur, un visage menaçant (dans la moitié gauche de l'écran) et un visage neutre (dans la moitié droite). La présentation est trop brève pour que la personne testée ait conscience de ce qu'elle voit. Les visages sont rapidement remplacés par des images constituées de fragments de visages. Seule cette image masquante est perçue consciemment. Puis on fait apparaître un nouveau stimulus, un triangle rouge. On demande au sujet d'appuyer le plus rapidement possible sur une touche donnée (disons « rouge ») si le triangle est projeté à la place de l'image de gauche ou sur une autre touche (« verte ») s'il est projeté à la place de l'image de droite. Les sujets appuient plus vite sur la touche qui correspond à l'emplacement du visage agressif que sur la touche qui correspond à l'emplacement du visage neutre. On en déduit que le visage agressif, même masqué, capte davantage l'attention bien qu'il ne soit pas davantage reconnu consciemment que le visage neutre.
Ces données illustrent parfaitement l’importance des processus subcognitifs préconscients dans l’élaboration des savoirs « conscients ». Les différentes techniques d’amorçage, judicieusement utilisées, pourraient faciliter l’acquisition de savoir-faire, guider certains cheminements cognitifs ou encore contribuer à « suggérer » une attitude ou un état affectif, voire à « forcer » certaines associations. Mais on débouche alors sur d’importants problèmes déontologiques : jusqu’où peut-on aller dans la transmission d’informations ou la création d’habitudes à l’insu du sujet conscient ?
LA SIMULATION DE L’ACTION : LES NEURONES MIROIRS
On pense généralement que l’observation ne suffit pas à l’acquisition de savoir-faire et il y a là matière à critiquer un type de formation dont l’essentiel passe par la simulation. Or la découverte récente des « neurones miroirs » a profondément remis en question cet a priori. Il y a là quelque chose de particulièrement important pour notre propos (voir Fadiga et al., 2000).
Effet de la signification d’une action sur l’activité du cerveau
L’une des découvertes les plus excitantes de la neurophysiologie des deux dernières décades est celle de neurones dans le cortex frontal, localisés dans des zones considérées comme motrices, qui répondent aussi à des stimuli visuels. Les neurones qui présentent cette propriété appartiennent principalement à la région oculomotrice mais aussi aux régions motrices dites F4 et F5 dont les réponses visuelles sont apparentées aux effecteurs associés à ces mêmes régions. L’aire F5 (partie antérieure du cortex prémoteur ventral) est associée aux mouvements de la main et de la bouche. Les neurones de cette région ne sont actifs que pour des actions orientées comme la préhension, la manipulation, la saisie, indépendamment du segment moteur utilisé (la main gauche, la main droite ou la bouche). Il est évident que la description du comportement neuronal en termes de mouvements élémentaires n’est pas approprié. La plupart de ces neurones donnent des réponses sélectives aux différents types de préhension. Parmi les neurones de cette région F5 beaucoup répondent aussi à des stimuli visuels : certains sont actifs seulement lorsque le singe observe des objets préhensibles (neurones canoniques) et d’autres lorsque l’animal observe un autre individu réaliser une action devant lui (neurones miroirs). Les neurones canoniques sont sélectionnés par l’observation de certains objets (« manipulables ») alors que les neurones miroirs sont sélectionnés par la perception de l’action elle-même. Des enregistrements dans le cortex prémoteur montrent, en effet, que les mêmes neurones qui déchargent lors de l’exécution d’un mouvement de préhension de la main s’activent également lorsque l’animal observe le même mouvement exécuté cette fois par l’expérimentateur ou un congénère. Ces neurones constituent une classe particulière de cellules visuo-motrices : ce sont bien à la fois des neurones moteurs et des neurones perceptifs. C’est la raison pour laquelle on les a nommés « neurones miroirs ». Action et perception apparaissent ainsi comme une seule et même opération.
Observer une action c’est déjà l’exécuter
Plusieurs expériences apportent la preuve de l’existence de neurones miroirs chez l’homme. Ainsi, l’observation d’un mouvement de la main induit une augmentation des potentiels moteurs évoqués par stimulation magnétique transcrânienne appliquée au niveau de la représentation motrice de la main. La facilitation produite par la stimulation magnétique transcrânienne pendant l’observation du mouvement est identique à celle produite par la même stimulation au cours d’un mouvement réel de la main ce qui signifie que l’observation du mouvement active effectivement le cortex prémoteur.
Par ailleurs, le temps de réaction pour saisir un objet en réponse à un signal préparatoire diminue lorsque l’orientation de ce signal est identique à celle de l’objet devant être saisi (essais congruents). De plus, le cortex prémoteur s’active au cours de la simple observation d’outils comparée à celle de figures sans signification. Cette activation prémotrice est encore plus marquée lorsque les sujets nomment silencieusement les outils. Ce résultat indique que même en l’absence de réponse motrice ou d’instructions d’utilisation des outils observés, une implication du cortex prémoteur est détectée (simulation de l’action).
Une autre preuve expérimentale de l’existence de neurones miroirs chez l’homme est fournie par le fait que l’observation de la manipulation d’un objet affecte significativement l’activité rythmique du cortex précentral qui est normalement supprimée au cours de l’exécution motrice. L’observation de l’action entraîne une désynchronisation du cortex moteur primaire même en l’absence de mouvement effectif. D’autres résultats confirment que l’observation de mouvements humains désynchronise l’activité électroencéphalographique au niveau du cortex précentral, ce qui n’est pas le cas avec des objets ou des animaux en mouvement. On constate également que des films d’actions simples mimés par un acteur active la région prémotrice du cortex frontal comme précédemment chez le singe. En d’autres termes, observer une action c’est déjà l’exécuter.
Signification de l’action et langage
Si on demande à un sujet d’observer, sur un écran vidéo, des mouvements de la main qui ont ou n’ont pas de sens pour lui (ouvrir une bouteille, tirer un trait, coudre un bouton, ou bien observer des signes du langage des sourds-muets) et soit de les imiter, soit de reconnaître le mouvement, les images cérébrales diffèrent selon que ce mouvement est perçu comme possédant ou non un sens.
Il existe donc une répartition spécifique des activations selon la nature du mouvement observé (signifiant ou non signifiant). Les résultats indiquent par ailleurs que l’aire de Broca (que l’on sait particulièrement impliquée dans la production du langage) s’active également pendant la manipulation d’objets complexes. Tous ces résultats montrent l’existence d’un lien direct entre les programmes moteurs et les stimuli visuels qui leur sont associés. Il s’agit là d’une sorte de codage de l’action potentielle, de la représentation de l’idée d’une action précise. D’autres résultats confirment l’existence d’étroites relations entre les structures neuronales impliquées dans la production du langage et celles impliquées dans le contrôle moteur. Il existe bien une forme d’équivalence entre produire, verbaliser, imaginer, observer une action. Ces résultats confirment le lien entre perception, action et imitation. Ainsi, le temps pour imaginer mentalement un mouvement est identique au temps nécessaire à son exécution. Le mouvement imaginé est contraint par les mêmes lois physiques et physiologiques que celles qui sont appliquées au contrôle moteur. On peut voir là l’un des fondement de la communication inter-individuelle par le geste et peut-être même de la fonction linguistique (catégorisation sémantique des objets selon qu’ils sont manipulables ou non). Générer mentalement des verbes d’action, observer une action, planifier une action, simuler une action activent en commun les mêmes régions dont le cortex prémoteur (et/ou précentral) et la région de Broca associée à la production verbale.
Action et imitation
Les mouvements biologiques font l’objet d’un traitement spécifique. La nature contrôlée du mouvement dirigé vers un but traduit une intention. Notre perception d’un mouvement biologique obéit à certaines lois qui font que l’observation d’un mouvement impossible est visuellement remplacé par un mouvement biologiquement plausible. Ainsi, l’interprétation des mouvements produits par d’autres individus dépend, non pas des données brutes de la perception, mais de la représentation que nous avons de ce que doit être une action produite par un organisme vivant.
Pour que l’imitation soit réussie il faut que l’action exécutée corresponde non seulement à l’action observée mais également à son contenu. L’imitation est fondée sur la simulation de l’état mental de l’acteur plus que sur la simple reproduction du geste observé. Un enfant a qui l’on demande d’imiter un geste raté exécute le geste abouti et non le geste raté.
Ainsi, observer une action, serait déjà l’exécuter. L’importance de ce résultat se passe de commentaire. Nous insisterons néanmoins sur la fait qu’une simulation bien réalisée ou une séquence filmée bien choisie, si elles ne sauraient suffir à l’acquisition d’un savoir-faire, peuvent certainement faciliter cette acquisition.
MOUVEMENTS DE YEUX ET PROCESSUS COGNITIFS
Parmi les activités motrices facilement objectivables et fortement reliées au fonctionnement cognitif, les saccades oculaires présentent un grand intérêt. L'électro-oculographie (EOG) est la traduction électrique du déplacement conjugué des globes oculaires. Sous réserve de l'immobilité approximative de la tête, le couplage des déplacements horizontaux et verticaux permet de reconstituer les régions de fixation oculaire lors de l'exploration d'une image, de mettre en évidence les tendances spontanées de la direction du regard en situation d'interlocution ou encore de suivre le décours de la lecture d'un texte. L'analyse de la tendance spontanée de la direction du regard est parfois même considérée comme pouvant fournir une indication sur l'humeur (revoir supra) et le style cognitif du sujet.
Les différents types de mouvements oculaires
Les saccades
La saccade est le changement de direction du regard produit par le système oculomoteur lorsque l’oeil se déplace par un saut brusque dont la vitesse est proportionnelle à l’amplitude du déplacement angulaire (vitesse qui peut atteindre 800°/sec.). C’est le mouvement le plus rapide que nous puissions produire. Chaque saccade qui ne dure que 20 à 150 msec est composée d’un mouvement bref suivi par un ajustement plus lent du déplacement de l’oeil qui peut lui-même être suivi par une saccade de correction. Pour un déplacement angulaire donné, la durée de la saccade est constante (10° # 40ms / 20° # 60ms / 30° # 80ms / 40° # 100ms). Son temps de latence, pour des stimulations visuelles, est de l’ordre de 200ms. Contrairement à l’impression subjective qu‘il peut en avoir, le sujet ne peut pas influencer la vitesse de la saccade, qu’elle soit déclenchée volontairement ou non, mais cette vitesse peut cependant varier en fonction du niveau de vigilance.
La poursuite
La poursuite désigne le mouvement des yeux qui accompagne, à la même vitesse angulaire, le déplacement d’un objet (vitesse maximum : 35°/sec). C’est un mouvement continu qui n’apparaît qu’en présence d’un stimulus mobile (par exemple, un pendule). En l’absence d’une telle stimulation (pas de feed-back correcteur) ou lorsque celle-ci seulement est imaginée, le mouvement de l’œil redevient saccadé bien que le sujet puisse avoir l’impression d’exécuter un mouvement continu (par exemple, visualisation mentale du pendule). Des perturbations de la poursuite oculaire sont observées chez des patients porteurs de divers types de lésions du système nerveux (notamment des noyaux du tronc cérébral en rapport avec l’équilibre et la posture, fortement associés au contrôle oculomoteur) et chez les schizophrènes (Muir et al. 1992).
Les stratégies de fixation oculaire
Il existe un lien direct entre les stratégies de fixation oculaire, notamment la durée des pauses et les processus cognitifs. Pour des durées égales ou supérieures à 250 millisecondes on estime que l’élément fixé (un mot, une portion de texte ou d’image) fait l’objet d’un traitement cognitif conscient (explicite). Entre 100 et 200 millisecondes, l’élément fixé est perçu (détecté) mais son traitement reste implicite (infra-, pré-, ou sub-conscient, revoir supra). Si le temps de fixation est inférieur à 100 millisecondes, on admet qu’il s’agit d’une saccade « relais » permettant au regard de prendre appui, pour aller plus loin dans le texte, sur un élément graphique qui n’est pas traité sémantiquement mais qui peut cependant interférer avec le traitement explicite (comme un espace, un signe de ponctuation ou certains caractères spéciaux).
Mouvements du regard et exploration cognitive
Si on demande à un sujet de regarder un visage de femme, le trajet oculomoteur (la séquence des saccades) réalisé pour explorer ce visage sera complètement différent selon qu’on lui demande si cette femme est riche, triste, bien coiffée ou si elle a les oreilles décollées. De même quand on regarde un paysage, les trajets oculomoteurs sont différents selon qu’on analyse la scène pour voir s’il y a des animaux, des arbres ou si le ciel est clair. Explorer un visage ou une scène de l’environnement exigent donc des décisions cognitives complexes et l’on comprend que la saccade soit un modèle intéressant pour l’étude de la sélection motrice et de processus de décision.
On pourrait s’inspirer de ce constat pour induire chez l’usager différents types de « parcours » ou de « trajets cognitifs », selon ce que l’on cherche à lui faire observer, comprendre, retenir, en lui adressant différents types de consignes.
La dynamique de la lecture et l’accès au sens des mots
Il existe deux manières de passer du mot écrit au mot parlé : soit de manière globale par les systèmes lexicaux, soit de manière analytique (alphabétique) par l’utilisation de la correspondance graphème-phonème. Pour les mots familiers la compréhension est directe et globale alors que pour les mots inconnus ou les non-mots la stratégie grapho-phonémique est activée avant la stratégie globale (passage réciproque de l’analytique au global). Un schéma à deux voies (voie lexicale et voie phonologique) vaut également pour l’écriture.
On peut résumer comme suit la succession des événements à partir de la fixation d’un mot par un lecteur expérimenté. La réception du signal visuel (activation du cortex visuel primaire) a lieu au bout de 100ms, l’attention exécutive (activation de l’aire cingulaire du lobe frontal) est stimulée à 200ms, la mise en jeu du lexique donnant un sens au mot à 250ms et le mouvement de l’oeil (saccade oculaire) vers le mot suivant au bout de 275ms. Cet enchaînement est suffisamment rapide pour que les mouvements de l’oeil pendant la lecture soient fondés sur le sens donné au mot précédent. Ainsi, le sens du mot fixé influence l’intervalle de temps précédant le mouvement suivant.
Des recherches sur la lecture ont montré que l’exploration oculaire d’un mot est affectée par la distribution de l’information dans ce mot, en particulier par le degré d’informativité des lettres initiales et finales. Pour les mots longs la durée de l’exploration oculaire dépend de l’information dérivée des lettres initiales. Il a été également montré que, dans un registre de clarté où l’attention est faiblement sollicitée, il y a peu de saccades rétrogrades (de retours en arrière) et le regard se pose au milieu du mot. Dans un régime d’austérité, il y a davantage de saccades et le regard se pose en début de mot. Il existe donc des styles moteurs de visualisation textuelle : quand il y a des récurrences sémantiques suffisantes, le balayage est régulier et centré mais dès qu’il y a rupture de sens d’autres procédures motrices se manifestent (voir Doré et Beauvillain, 1995).
A travers ces exemples on mesure l’importance du choix du vocabulaire, de la fréquence des mots utilisés, de leur structure syllabique, de la répartition des termes techniques ou peu courants, etc.
L’importance du regard dans la communication
Le regard est l’un des principaux moyens de communication non verbale, avec l’expression faciale, la posture, la proximité (proxémie) et la tonalité vocale. L’intensité des émotions transmises par le regard s’exprime surtout dans les contacts visuels réciproques qui constituent le mode communication interpersonnelle dans lequel les composantes affective et émotionnelle sont les plus marquées. En moyenne, des interlocuteurs se regardent pendant 60 % de la durée totale de l’interaction mais les différences individuelles sont considérables. Quelques individus regardent continûment alors que d’autres ne regardent leur interlocuteur que pendant 8 % de l’interaction. Tous regardent davantage leur partenaire lorsqu’ils écoutent que lorsqu’ils parlent. Le regard réciproque ne représente qu’un tiers du temps, en séquences fragmentées. Le contact visuel est difficilement maintenu, voire évité. Les femmes regardent davantage, en particulier lorsqu’elles parlent à d’autres femmes et les extravertis regardent plus que les introvertis. Les schizophrènes (surtout chroniques) et les déprimés regardent moins les autres. Quant aux enfants autistes, ils regardent rarement leur vis-à-vis.
Le langage des yeux
On connaît l’importance du regard dans le comportement de cour. On sait, en outre, que la pupille se dilate lorsque le sujet est sexuellement excité par ce qu’il voit. Les hommes préfèrent ainsi des photos retouchées de visages de femmes dont on a agrandi le diamètre pupillaire. Capter le regard c’est entrer en contact. Or, ce contact peut être perçu comme une menace ou le signe d’une malédiction lancée par le « mauvais œil ». Les yeux exophtalmés engendrent la peur, ce qui n’est pas le cas des individus atteints de strabisme convergent ou dont les yeux sont de couleurs différentes. L’idée selon laquelle des rayons seraient émis par les yeux reste une croyance tenace, susceptible d’expliquer pourquoi un grand nombre de personnes sont persuadées être capables de dire à coup sûr si on les regarde dans le dos.
Plus une personne regarde une autre, plus cette dernière a l’impression d’être appréciée. Les longs regards sont préférés aux regards fréquents mais brefs. Les regards accentués sont censés émaner de personnes plus sincères et plus crédibles. Il a été montré, en effet, que l’on regarde moins son interlocuteur lorsqu’on ne dit pas la vérité ou lorsque l’énoncé est hésitant. Les regards détournés sont plus nombreux chez les personnes nerveuses (anxieuses) et peu sûres d’elles. La durée des regards dépend, en outre, du contenu de l’échange verbal : on regarde moins son interlocuteur lorsqu’on aborde des sujets personnels ou un thème difficile. On détourne également davantage le regard en écoutant une question ou au moment de prendre la parole et le sens du déplacement des yeux (gauche - droite) pourrait refléter la dominance hémisphérique du sujet (revoir supra En effet, l’émetteur ne regarde pas des points précis de son champ visuel lorsqu’il détourne son regard pendant une hésitation. La dynamique des regards contribue aussi à réguler les tours de parole : on fixe davantage son interlocuteur en fin d’énoncé comme pour lui signifier qu’il va devoir prendre un relais.
Regard et posture
La parole et le mouvement sont intimement liés. Parmi les mouvements qui accompagnent la communication verbale, ceux de la tête, en particulier les mouvements latéraux, sont particulièrement significatifs. Les femmes ont une mobilité latérale de la tête presque deux fois supérieure à celle des hommes. Les mouvements latéraux dirigés vers autrui sont interprétés comme un signe de confiance alors que l’inclinaison à l’opposé du partenaire est associée à la méfiance et au retrait (évitement). Dans la peinture classique, on n’observe aucune flexion de la tête chez les personnages évoquant le pouvoir. En revanche, les tableaux de Vierge à l’Enfant ou les tableaux d’amour romantique, accentuent la flexion latérale réciproque de la tête de tous les protagonistes de la scène. La position verticale de la tête est associée à des qualificatifs comme fier, réservé, arrogant alors que la position inclinée évoque davantage l’humilité, la bienveillance, la douceur. La flexion latérale est associée à l’attachement et à la sociabilité alors que son absence évoque une personnalité égocentrique, puissante et asociale.
La direction de l’inclinaison de la tête par rapport aux autres personnes est également un facteur critique. Une expérience menée à partir de copies modifiées de divers tableaux célèbres dont Mona Lisa montre que les personnages qui inclinent la tête dans la direction d’un partenaire ou dans la direction de l’orientation des yeux sont décrits comme étant rêveurs, amicaux, humbles, sympathiques alors que ceux dont l’inclinaison de la tête est en sens opposé sont décrits comme fiers, tendus, antipathiques, arrogants. Au demeurant, une différence très significative est apparue entre les hommes et les femmes quant à la manière de juger les images de femmes ne présentant pas de flexion latérale de la tête : les hommes les jugent inamicales et antipathiques alors que les femmes les trouvent plutôt sympathiques et compatissantes.
La dynamique du regard assure donc la régulation de l’échange interlocutoire en fournissant notamment un indice majeur des intentions de l’interlocuteur. C’est un élément important du contexte de la communication verbale qu’il convient de prendre en compte dans les échanges virtuels, en particulier dans la conception d’avatars. On peut également s’interroger sur la nécessité de trouver un substitut au fait de se savoir regardé (et regardant). On pourrait imaginer une modulation et un ajustement de la présentation des données en fonction de certaines caractéristiques de la posture de la tête et de la dynamique du regard de l’apprenant, extraites d’une analyse en temps réel de son image fournie par une webcam..
LE CERVEAU COMME INTERFACE HOMME-MACHINE
On sait qu'il existe des activités électriques cérébrales associées à des événements physiques ou mentaux : les potentiels évoqués ou Event Related Potentials (E.R.P.) qui peuvent être exogènes ou endogènes. Après traitement en temps réel et amplification convenable, de tels potentiels peuvent être utilisés dans la commande et le contrôle de systèmes asservis.
Spécialisation hémisphérique et gestion de l'erreur
L'étude porte ici sur la cohérence des réponses évoquées par les différents événements associés à une réponse motrice complexe précédée d'un stimulus préparatoire suivi d'un stimulus impératif. On ne constate aucune différence significative dans la distribution des potentiels associés à la commande motrice proprement dite, que la réponse soit ou non correcte. Il existe par contre d'importantes disparités entre les E.R.P. enregistrés pendant la période d'élaboration de la réponse.
La structure de la covariance des E.R.P. pendant cette période d'élaboration est même prédictive du succès ou de l'échec de la réponse. Le succès est associé à une activation du cortex frontal gauche significativement supérieure à celle de l'hémisphère droit alors qu'un échec est précédé d'une activation corticale différente. La participation de l'hémisphère controlatéral est de l'ordre de 25%. L'activation de l'hémisphère gauche pour un succès de la main droite est, en outre, supérieure à celle de l'hémisphère droit pour un succès de la main gauche. Inversement, une erreur de la main droite correspond à une insuffisante activation de l'hémisphère gauche (le droit étant silencieux) alors qu'au contraire une erreur de la main gauche va de pair avec une activation indifférenciée des deux hémisphères.
L'activation de la région frontale gauche est donc associée au succès, non seulement de la main droite mais également à celui de la main gauche. Les erreurs commises par la main droite semblent résulter de l'insuffisance du travail préparatoire (notamment de l'hémisphère gauche) alors que l'hyperactivité de l'hémisphère droit associée aux erreurs commises par la main gauche témoigne d'un travail préparatoire confus et erroné (Gevins et al.). Il serait donc possible de « corriger » la réponse du sujet avant même qu’il ne l’ait donnée !!!
« Penser » une action pour l’exécuter
Dès lors qu’il existe une activité électrique spécifique de l’intention d’agir qui précède le déclenchement de la programmation motrice proprement dite (potentiel pré-moteur) et dès lors qu’il est possible d’enregistrer cette activité, soit en surface (vertex), soit directement au niveau de son générateur cortical (AMS), il est possible d’utiliser cette activité, après lui avoir fait subir les transformations appropriées, pour commander divers dispositif et en particulier certaines fonctionnalités de l’ordinateur. On a pu, en outre, entraîner des rats à activer un distributeur de boisson à partir du potentiel pré-moteur. On a d’abord enregistré l’activité des neurones précédant l’appui sur le levier du distributeur. Ce signal spécifique est ensuite couplé directement au robot distributeur. Ainsi, dès que le rat ébauche le mouvement d’appui, le dispositif est actionné et les rats apprennent rapidement qu’ils n’ont plus besoin d’exécuter ce mouvement pour obtenir à boire mais qu’ils leur suffit « d’y penser »
D’autres types de dispositifs sont utilisés, chez l’homme, basés sur le principe du bio-feed-back qui permet au sujet de percevoir les changements de certaines activités organiques normalement involontaires et d’en modifier implicitement le décours. On parvient ainsi à réguler le rythme cardiaque (ECG), la tension musculaire (EMG), la résistance électrique de la peau (RED) ou l’activité électrique cérébrale (EEG). On peut, de cette manière, entraîner des patients à modifier volontairement leurs ondes cérébrales pendant un temps prédéfini pour modifier l’état d’un dispositif quelconque (par exemple le déplacement d’un spot sur un écran).
Le carrousel de Gray-Walter
Le neurochirurgien britannique Gray-Walter soumis des patients porteurs d’électrodes implantées temporairement dans le cortex moteur à l’expérience suivante. Il s’agissait simplement, pour le sujet, de regarder une série de diapositives en pressant le bouton de contrôle pour faire avancer à sa guise le panier de photos. Cependant, à l’insu du patient, le bouton de contrôle n’actionnait rien du tout : ce qui faisait avancer les diapositives était en fait le signal amplifié qui était capté par l’électrode implantée dans le cortex moteur juste avant que le sujet ne presse le bouton (potentiel pré-moteur). Les patients étaient très troublés par l’effet ressenti, parce qu’il leur semblait que le projecteur de diapositives anticipait leurs décisions et qu’ils ne pouvaient s’empêcher d’appuyer quand même sur le bouton, tout en craignant que le projecteur n’avance deux fois. En fait, cette impossibilité d’exercer leur veto ne contredit en rien l’interprétation de Libet (voir note 15) dans la mesure où il s’agit ici non pas du potentiel de préparation motrice, qui lui peut être « volontairement » interrompu, mais du potentiel pré-moteur qui déclenche nécessairement le mouvement. On voit ici encore, comment il est possible d’asservir un automate à des signaux électrophysiologiques qui anticipent l’acte moteur proprement dit, rendant ainsi la commande indépendante de la réalisation effective de la réponse motrice.
Conscience visuelle et motricité
Il n'est pas rare que certaines actions exécutées en réponse à un événement visuel soit totalement dissociée de l'expérience consciente du même événement. Nous répondons d'abord et nous devenons conscients après. C'est par exemple le cas lorsque, en voiture, nous sommes obligés de changer brusquement de trajectoire devant un obstacle soudain. Nous prenons conscience de celui-ci après l'avoir évité et nous avons peur rétrospectivement.
Lorsqu'on demande à un sujet de toucher le plus rapidement possible, dès qu'il s'allume, un objet placé devant lui, il lui faut en moyenne 330 msec pour initier ce mouvement. Si on lui demande d'indiquer par un signal vocal le moment où il est conscient que l'objet s'allume, il lui faut en moyenne 380 msec. Que se passe-t-il si on lui demande de faire les deux à la fois? Sans surprise le début du mouvement du bras vers l'objet précède la réponse vocale de 50 msec. Cette différence ne nous est pas perceptible : nous avons l'impression que le mouvement de la main coïncide avec notre perception de l'illumination de l'objet. On place maintenant le sujet face à trois objets séparés d'environ 10 cm et on procède comme précédemment. L'objet central est le plus souvent seul éclairé mais de temps en temps l'éclairage saute brutalement vers l'un des deux autres objets et ceci exactement au moment où commence le mouvement de la main vers l'objet central.. Le sujet va donc devoir changer la trajectoire de son mouvement et produire un second signal vocal pour indiquer qu'il est conscient du changement de cible. Le premier signe de correction de la trajectoire de la main apparaît environ 100 msec après le changement d'éclairage alors que le signal vocal traduisant la prise de conscience de ce même événement apparaît environ 300 msec après le début du changement de trajectoire. Le sujet rapporte alors qu'il a l'impression de voir la lumière sauter vers la fin de son mouvement, proche du moment où il va se saisir de l'objet et quelquefois même après qu'il s'en soit saisi!
Dans les circonstances habituelles le temps nécessaire à la prise de conscience d'un événement visuel (tel qu'inféré à partir de la réponse vocale) est compatible avec la durée du temps nécessaire à l'élaboration d'une réponse motrice. Ainsi, nous sommes conscient de l'objet à atteindre à peu près au moment où commence le mouvement vers lui, ce qui garantit la consistance de nos actions et de notre expérience subjective, consistance qui ne semble pas affectée par un décalage de 50 msec. En revanche, lorsque cette différence s'accroît, la consistance disparaît. Peut-être la durée des temps de réaction est-elle ajustée pour permettre à notre expérience subjective d'être en phase avec nos actions? Quoiqu'il en soit, une forme de conscience implicite (d'inconscient cognitif) semble précéder la conscience explicite qui, elle, n'est pas immédiate mais soumises aux contraintes neuronales imposées par le traitement parallèle de l'information sensori-motrice (Jeannerod et Castiello).
Retenons ici que le moment où le sujet a conscience d’exécuter un mouvement et le moment du déclenchement de l’exécution effective de ce mouvement ne sont pas contemporains. Ainsi, dans certaines situations, l’initiation (« inconsciente ») d’un mouvement peut être une commande plus efficace que le signal résultant de la réponse motrice explicite.
La question des implants cérébraux
Il existe certains signaux électriques caractéristiques de la préparation à l'action, voire de l'intention d'agir, précédant l'acte moteur de quelques centaines de millisecondes. Le recueil et l'amplification de cette activité, via l'implantation d'électrodes spéciales dans la région cérébrale concernée, peut permettre à un patient paralysé de commander divers dispositifs, voire de communiquer en sélectionnant des lettres une à une sur un écran. Inversement, des implants dans l'oreille interne (implants cochléaires), ou encore agissant sur le système visuel et récemment sur la commande motrice, sont susceptibles de rétablir, au moins partiellement, la fonction perturbée. Mais certains voient déjà dans l'interfaçage direct du cerveau et de l'ordinateur, le moyen de fabriquer un "homme augmenté". Pour les uns se sera un guerrier capable d'entendre le moindre son à des kilomètres, de voir la nuit, de percevoir les rayons infrarouges ou ultraviolets et de piloter n'importe quel appareil en le brancher directement sur son système (neuro)informatique. D'autres s'imaginent munis de toutes sortes de capteurs vivant en symbiose avec les réseaux informatiques planétaires. Après les pacemakers, les implants cochléaires, les hanches en plastique et les seins en silicone, il serait temps de passer aux neurones en silicium, aux yeux artificiels et aux microprocesseurs greffés sur le système nerveux.
EXEMPLES D’APPLICATION
Interaction entre les stimuli verbaux et imagés
L’utilisation de plus en plus courante des pictogrammes est basée sur l’idée selon laquelle la transmission de messages sous formes graphiques serait plus efficace du fait que les utilisateurs peuvent comprendre les concepts et les interactions communiqués par les pictogrammes d’un seul « coup d’œil» (traitement global de type hémisphère droit). Au demeurant, la littérature montre que l’ajout de détails verbaux améliore les performances des sujets aux tests de compréhension des pictogrammes. Dans ces conditions, la mémorisation des formes visuelles complexes semblent particulièrement résister à la dégradation (Laughery et Wolgater, 1989). Les stimuli verbaux et imagés utiliseraient deux systèmes de codage impliquant différemment les deux hémisphères (Wikens, 1992). La mobilisation des deux hémisphères, via un double codage, améliorerait la performance mnésique (Paivio, 1975).
La présentation de pictogrammes associés à leur étiquette verbale est un moyen efficace d’entraîner les utilisateurs : la combinaison d’une information verbale et imagée améliore les processus de rétention. En revanche, l’ajout d’information verbale sous forme d’une phrase explicative ne facilite pas la mémorisation, alors que l’ajout d’une simple étiquette verbale améliore significativement la compréhension des pictogrammes jugés difficiles. Lorsque de tels pictogrammes sont utilisés dans des applications informatiques, la possibilité d’obtenir l’étiquette verbale du pictogramme avec un clic de souris (fenêtre pop-up) ou lors du passage de la souris sur le pictogramme (roll-over) facilite significativement la compréhension des utilisateurs. Il ne semble pas nécessaire que cette étiquette reste affichée en permanence mais l’utilisateur doit pouvoir y accéder. En revanche, la réplication écrite sur l’écran d’un commentaire oral induit un effet de redondance préjudiciable à l’apprentissage, la meilleure condition étant le commentaire à l’oral plutôt qu’à l’écrit pour ne pas saturer le canal visuel (Wolgater et Sojourner, 1997)..
Image mentale et raisonnement
Compte-tenu de ce qui précède, une autre question mérite également l’attention des concepteurs d’objets pédagogiques : celle de l’interaction entre image mentale et raisonnement déductif. Les résultats publiés sont relativement contradictoires : certains montrent que la formation d’une image mentale du matériel favorise le raisonnement alors que d’autres n’indiquent aucun effet. Une telle discordance peut provenir d’un manque de contrôle du matériel utilisé dans les tâches expérimentales. Il est, en effet, important de faire la distinction entre « représentation visuelle » (image) et « représentation spatiale » (modèle mental). On peut construire un modèle mental de la relation entre des éléments (le stylo est au-dessus du verre) sans pour autant former une image mentale de ces éléments. Une telle image mentale contient des détails non pertinents pour le raisonnement d’inférence : elle peut même gêner le processus de raisonnement contrairement à un modèle mental plus abstrait (Knauff et Johson-Laird, 2002).
On sait par ailleurs que des questions à contenu verbal conceptuel évoquent davantage de mouvements oculaires spontanés que des questions à contenu visuo-spatial et ceci même en l’absence de réponse explicite du sujet. Une moindre activité oculaire pourrait faciliter la représentation mentale en diminuant les interférences avec l’environnement visuel. Au contraire, les relations qui favorisent une représentation imagée donnent lieu à des temps de réponse significativement plus longs.
On voit donc que le contenu des assertions peut affecter le processus d’inférence, tout particulièrement si ce contenu favorise la formation d’une image mentale plutôt que celle d’un modèle mental abstrait, le processus de raisonnement est gêné et ralenti. L’image contient trop de détails qui interfèrent avec la réflexion. On peut avoir à prévenir l’apprenant contre la formation intempestive d’images trop précises (déjà en n’en fournissant pas) et à encourager la construction de modèles plus abstraits de la situation par la simple mise en relation spatiale d’éléments abstraits (les initiales des objets à manipuler logiquement, par exemple, plutôt que des images plus précises).
Problèmes posés par l’usage « d’agents pédagogiques animés »
Parmi les éléments susceptibles de contribuer à l’optimisation des systèmes d’aide à l’apprentissage figurent désormais les « agents pédagogiques animés », c’est-à-dire des personnages (humains ou non) dont le rôle consiste à orienter l’apprenant dans son exploration du système de façon à améliorer l’apprentissage. Selon le modèle de compréhension multimédia de Mayer (2001), les informations verbales et graphiques sont traitées par deux systèmes séparés aboutissant à deux modèles mentaux différents, l’un visuel, l’autre verbal, mais la compréhension complète des instructions nécessite la construction de connexions référentielles entre les éléments correspondants dans les deux modèles (ce qui implique des ressources supplémentaires). Moreno et Mayer (1999) ont montré qu’un effet de partage de l’attention pouvait se produire dans la mesure où l’agent pédagogique présenté visuellement détournait l’attention du matériel graphique de l’instruction, même si son commentaire était oral (voir également Kayuga et al., 1999).
La présence d’agent pédagogique animé ne nuit pas à l’apprentissage mais ne l’améliore pas non plus même si l’agent pointe les éléments du graphique qui sont commentés. En d’autres termes, il semble inutile de prévoir un agent pédagogique si son rôle est uniquement de délivrer un commentaire (agent non interactif). Un graphique statique avec emphase visuelle des éléments (par exemple colorisation particulière) en synchronisation avec le commentaire oral, peut être aussi efficace qu’une animation. Il est donc inutile de prévoir une animation coûteuse en ressources temporelles et graphiques lorsque la compréhension du matériel ne l’exige pas (Craig et al., 2002).
Stratégies oculaires d’exploration d’une page Web
Une étude réalisée par la laboratoire CLIPS (Communication Langagière et Interaction Personne Système) de Grenoble montre que la trajectoire du regard lors de l’examen d’une page web conditionne largement le temps nécessaire pour accéder à l’information recherchée (et l’on sait que le temps de recherche est un paramètre crucial sur Internet). Une autre étude, réalisée par Novadis, montre l’impact de la mise en page sur le déplacement du regard des internautes. Il en ressort que 50% des fixations se portent sur les titres et que les experts, contrairement aux novices, ne s’arrêtent pas sur les images car ils savent, qu’en général, les images ne sont pas porteuses d’information significative (sauf si elles définissent un lien). Chez les experts, les images sont donc traitées principalement en vision périphérique. Cette étude montre, en outre, que la disposition des blocs a un effet prépondérant sur l’organisation des mouvements oculaires.
On a pu ainsi évaluer objectivement la pertinence de l’organisation des pages et de leur contenu informationnel, la validité du graphisme retenu, l’adéquation de chaque zone de la page à l’objectif fixé. Il en ressort qu’il convient de travailler davantage le texte, dont les titres doivent être très explicites, que les images, même si cela semble aller à l’encontre de la tendance graphique actuelle.
Les premières études ont porté sur la compréhension de pages fixes. Elles se poursuivent avec la prise en compte du déroulement des pages, des clics sur les liens et du trajet du regard. On peut désormais reconstituer le voyage des yeux dans l’ensemble d’un site et identifier ainsi ses points forts mais aussi les régions ignorées du regard (les angles morts du virtuel). On peut ainsi montrer aux concepteurs, en toute objectivité, les défauts de leurs sites.
Annexe
FREQUENCES SPATIALES ET SENSIBILITE AU CONTRASTE
La forme géométrique de la stimulation lumineuse est également susceptible d’affecter la perception visuelle. Parmi ces formes un stimulus particulièrement intéressant pour étudier cet effet, est le réseau formé d’une succession de bandes de même orientation dont les luminances alternées produisent l’aspect d’une grille. Selon le type de modulation de la luminance on parle de réseau « carré » (changement brusque de luminance d’une bande à l’autre) ou « sinusoïdal » (changement progressif de la luminance selon une fonction sinus). Le réseau se caractérise donc par une certaine fréquence spatiale en nombre de cycles par degré d’angle (un cycle correspondant à une alternance clair-foncé). Lorsque la modulation est étalée, les bandes sont larges et la fréquence spatiale est basse. A l’inverse lorsque la modulation est serrée, les bandes sont plus fines et la fréquence spatiale est élevée. On conçoit facilement que toute image plane peut être considérée comme une certaine distribution spatiale de luminance. En appliquant une généralisation du théorème de Fourier on démontre que toute image est équivalente à la superposition d’un ensemble de réseaux sinusoïdaux s’étendant dans toutes les directions de l’espace. On constate alors que toute image est constituée de composantes de fréquences spatiales basses associées à ses parties larges et peu détaillées, de composantes de fréquences spatiales élevées associées aux fins détails de l’image et de composantes de fréquences spatiales intermédiaires. En d’autres termes, et comme pour les stimuli sonores, une stimulation visuelle peut se décrire de deux façons : soit par la fonction L(x,y) représentant la valeur de la luminance en différents points de l’image, soit par sa composition en fréquences spatiales dans les différentes directions de l’espace. La fonction de sensibilité au contraste spatial définit la sensibilité du système visuel à des facteurs spatiaux. La sensibilité au contraste dépend de la fréquence spatiale : elle est maximum pour les fréquences spatiales intermédiaires (entre 1 et 10 cycles par degré, optimum entre 3 et 5) et chute pour les fréquences spatiales basses et élevées. La limite d’acuité pour ce type de stimulus (réseau) est de l’ordre de 30 secondes d’angle visuel (bandes de 1mm vues à 7 mètres de distance). L’acuité est considérée comme« normale » (10/10) lorsqu’on distingue des lettres d’une hauteur de 5 minutes d’angle visuel à une distance de 5 mètres. La sensibilité au contraste est quelque peu différente pour des réseaux en mouvement (courbe décalées vers les basses fréquences spatiales). Elle varie également avec la luminance et l’excentricité rétinienne (le seuil d’acuité augmente avec la réduction de l’éclairement et l’optimum se déplace vers les plus basses fréquences spatiales et il en va de même pour l’excentricité rétinienne.
Il existe en outre un traitement différentiel des fréquences spatiales au niveau des hémisphères cérébraux : l’hémisphère droit semble gérer préférentiellement les basses fréquences spatiales (traitement plus global) alors que l’hémisphère gauche paraît plus sensible aux fréquences spatiales élevées (traitement plus analytique).