Des gains inattendus chez les humains et les singes augmentent la prise de risque


Comment les humains prennent-ils des décisions lorsque les résultats sont incertains ? Une façon possible serait de calculer la valeur attendue de chaque option en multipliant chaque montant de résultat possible par sa probabilité, puis en choisissant l’option avec la valeur attendue la plus élevée. Bien que cette stratégie maximiserait le gain en termes d’attentes, ce n’est pas ce que les gens ont tendance à faire. En particulier, les gens semblent être irrationnellement influencés par les résultats passés de leurs décisions lorsqu’ils font des choix ultérieurs.

Des chercheurs de l’Université de Tsukuba ont développé et validé un modèle (« théorie des perspectives dynamiques ») qui intègre le modèle le plus populaire en économie comportementale pour décrire la prise de décision dans l’incertitude – la théorie des perspectives, et un modèle bien établi d’apprentissage des neurosciences — Théorie de l’apprentissage par renforcement. Ce modèle décrit plus précisément les décisions que les gens et les singes ont prises face au risque que la théorie des perspectives ou la théorie de l’apprentissage par renforcement seule.

Plus précisément, les chercheurs ont demandé à 70 personnes de choisir à plusieurs reprises entre deux loteries dans lesquelles elles pourraient gagner une récompense avec une certaine probabilité. Les loteries variaient dans la taille de la récompense, la probabilité de la recevoir et le niveau de risque encouru. Les résultats ont montré qu’immédiatement après avoir connu un résultat supérieur à la valeur attendue de l’option sélectionnée, les participants se comportaient comme si la probabilité de gagner à la prochaine loterie augmentait. L’auteur principal de l’étude, le professeur adjoint Hiroshi Yamada, déclare « Ce comportement est surprenant car les probabilités de gain étaient clairement décrites aux participants (les participants n’avaient pas à les apprendre par expérience) et ces probabilités étaient également complètement indépendantes des résultats précédents. » En utilisant leur modèle de théorie des perspectives dynamiques, les chercheurs ont pu déterminer que le changement de comportement est motivé par un changement dans la perception des probabilités plutôt que par un changement dans l’évaluation des récompenses.

Yamada dit également : « Un tel apprentissage à partir d’événements inattendus sous-tend la théorie de l’apprentissage par renforcement et est un algorithme bien connu qui se produit lorsque les gens ont besoin d’apprendre les récompenses de l’expérience. Il est intéressant que cela se produise même si l’apprentissage n’est pas nécessaire. »

Dans des expériences similaires avec des singes macaques, dont le cerveau ressemble beaucoup à celui des humains, les mêmes résultats ont été observés. Les chercheurs ont commenté que la similitude dans le comportement des humains et des singes était remarquable dans cette étude.

Sur la base des résultats de cette recherche, on s’attend à ce que l’étude du cerveau du singe conduise à une compréhension des mécanismes cérébraux impliqués dans la perception des récompenses et de la probabilité que nous utilisons tous pour prendre des décisions risquées, ainsi que la joie nous ressentons quand nous réussissons.

Cette étude a été soutenue par JSPS KAKENHI Grant Numbers JP:15H05374 et 21H02797, Takeda Science Foundation, Council for Addiction Behavior Studies, Narishige Neuroscience Research Foundation, Moonshot R&D JPMJMS2294 (HY) et ARC DP190100489 (AT).

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*