Szokásaink rabságában - avagy miért nehéz változtatni?
Napjaink négy meghatározó, népegészségügyi szempontból rendkívüli kihívást jelentő krónikus, nem fertőző betegségei a cardiovascularis megbetegedések, a diabetes mellitus (cukorbetegség), a krónikus légúti gyulladásos betegségek (különösen az asthma bronchiale és a COPD), valamint a daganatos megbetegedések.
Ezek hátterében az Egészségügyi Világszervezet négy alapvető magatartás-mintázatot azonosított, melyek az egészségtelen táplálkozás, a mozgásszegény életmód, a dohányzás és a túlzott alkoholfogyasztás.
A jelenség általánosságát jelzi, hogy valószínűleg minden olvasó fel tud idézni egy, vagy akár több olyan családtagot, barátot, munkatársat, akiknél ezek a magatartási formák kialakultak. A problémakör legmeghatározóbb sajátossága, hogy bár az illető tisztában van életmódjának káros következményeivel, meg tudja fogalmazni, hogy mit kellene másképp csinálnia ahhoz, hogy kedvező változások induljanak el, továbbá belátja ezek szükségességét, mégsem tesz semmit. Újra és újra át lehet vele beszélni a helyzetét, a fenyegető egészségkárosodások körét, belátja és egyet is ért, de végül minden káros tevékenysége folytatódik (továbbra sem mozog, rágyújt, megissza még azt a két-három felest pluszban, és lecsúszik még néhány falat kalóriabomba). Inkább szedi a vérnyomáscsökkentőket, a koleszterincsökkentőket, a puffadásgátlókat, az emésztést segítő tablettákat. Megmagyarázza például magának és környezetének, hogy mennyire elfoglalt, ezért nem tud rendszeresen mozogni sem.
Mi az oka annak, hogy józan, az élet számos terén megfelelően teljesítő emberek nem fogynak le, nem teszik le a cigarettát, az italt, nem mozognak rendszeresen? Miért nem változtatnak az életmódjukon még akkor sem, ha már megjelennek azok a rizikóbetegségek (hipertónia, hiperlipidémia, inzulin-rezisztenica), melyek folyamatosan csökkentik az életminőséget, előrevetítve a szomorú jövőt? Kutatócsoportunk korábbi eredményei alapján felvetettettük, hogy ennek a jelenségnek a hátterében a kognitív folyamatoknál mélyebb, ősibb agyi működések állhat. Ez a mesocorticolimbikus rendszer működéséhez kapcsolódó motiváció, illetve a megerősítéses tanulási folyamatok diszfunkciója.
A megerősítéses tanulás olyan tanulási forma, melynek során a tanulást a jutalom irányítja
A tanulás célja, hogy a környezetben fellelhető jutalmat minél hamarabb felismerjük, azaz a tanulás során a jutalmat előre jelző neurobiológiai szignál ahhoz a jelhez fog kapcsolódni, ami legkorábban jelzi előre a várható jutalmat. Van, amikor a jutalmat két jelenség időbeni, térbeni együtt járása jelzi előre, és van, amikor bizonyos cselekvések eredményezik egy-egy helyzet kedvezőbb kimenetelét. Bár ez így elég absztraktnak tűnik, tulajdonképpen nincs másról szó, mint Pavlov kutyájáról, amelynél a csengő és a táplálék egyidejű adagolása vezetett a nyálelválasztáshoz úgy, hogy a feltételes reflex kialakulása után már a csengő önmagában is nyálelválasztást okozott, hiszen a tanulás során megbízhatóan jelezte azt, hogy az állat ételhez jut. A másik forma, az ún. operáns kondicionálás klasszikus példája, amikor a tanulás során az állat két gomb közül választhat. Az egyik megnyomásával egy általa kedvelt táplálékot kap, a másikkal vagy nem kap semmit, vagy valamilyen kellemetlenségben részesül. A tanulási folyamat során, az ismétlések során egyre nagyobb gyakorisággal választja az állat azt a gombot, ami a számára ízletes táplálékadagolást szabályozza. Ezek a jelenségek nálunk, embereknél is alapvetően meghatározzák a viselkedést. Gondoljunk például arra, amikor valami örömet okoz, és azon kapjuk magunkat, hogy egyre gyakrabban tesszük ezt meg.
A megerősítéses tanulás két különböző, azonban egymással több ponton is összekapcsolódó mechanizmuson keresztül valósul meg, ezek a modell-független és a modell-alapú megerősítéses tanulás. A modell-független tanulási forma során az agy a környezettel való interakciója során bizonyos szabályszerűségeket azonosít. Amikor ezen szabályokból nem következő, vagyis váratlan jutalomban részesül, az agy ún. jutalom-becslési hibát képez, melynek hátterében agyi dopamin-felszabadulás áll. A dopamin-felszabadulás központi idegrendszeri jutalmazó hatása jól ismert, ezen alapszik a kábítószerek hatásának minden jelenleg elfogadott elmélete is. Ezzel szemben a modell-alapú megerősítéses tanulás lényege az agy által felépített környezeti modell. Ez a modell teszi lehetővé, hogy egy adott helyzetben a korábbi tapasztalataink alapján bizonyos jelenségek, cselekmények kimenetelét megjósoljuk. Ezt a modellt agyunk egész életünk során építi, finomítgatja azzal a céllal, hogy minél pontosabban tudjunk a világban tájékozódni.
Ennek a modellnek munkacsoportunk elmélete, a megerősítéses tanulás proaktív elmélete szerint az ún. agyi alaphálózat a biológiai alapja. Ismert, hogy az agyi alaphálózat nyugalmi állapotban válik aktívvá, működésével magyarázható több jelenség is, mint az álmodozás, az empátia, a mentalizáció, a sztereotipizálás és a sémák kialakulása. Elméletünk szerint az agyi alaphálózat a környezettel kapcsolatos ismereteket úgy dolgozza fel, hogy egy-egy helyzettel kapcsolatosan tárolja a környezeti szignált és a szignál kontextusát (többek között a kapcsolódó időbeni és térbeni információkat, valamint az adott helyzet jutalmazó értékét). Amikor egy bizonyos eseménnyel (szignál) vagy körülménnyel találkozunk, agyunk értékeli azt és meghatározza a modellben ehhez leginkább hasonlító, már ismert mintát, melynek ismert a jutalmazó értéke. Ezek a jutalommal kapcsolatos információk járulnak hozzá végül is a döntéseinkhez.
A két rendszer szorosan együttműködik
A modell-független megerősítéses tanulás dopaminerg neuronjai például átszövik a modell-alapú rendszer meghatározó struktúráit. Fordított irányú kapcsolat is megfigyelhető , a modell-alapú rendszer glutaminerg pályái a modell-független rendszer struktúráit innerválják.
A gépi tanulás elméletét segítségül hívva pontosabban megismerhető a két rendszer működése, ugyanis, bár eltérő stratégiával, de ugyanazon algoritmusok mentén határozza meg a két rendszer a környezeti ingerek, illetve az egyéni cselekvések jutalmazó értékét. A modell-független tanulás megvalósulásának központi eleme a jutalom becslési hiba. Ennek megfelelően a dopaminerg rendszer által kódolt modell-független tanulás akkor megy végbe, ha a várt és a tapasztalt jutalom között eltérés jelentkezik. Ez az eltérés-indukálta dopaminerg szignál befolyásolni fogja a modell-alapú világmodellt is.
A modell-alapú tanulás szerint egy állapot értékét az adott állapotban realizálható azonnali jutalom és az abból az állapotból elérhető további állapotokban realizálható, időben diszkontált jutalmak összege adja. Azaz, nem csak az a fontos, hogy milyen azonnali jutalomban részesülünk, hanem az is, hogy ez az új állapot milyen további jutalmak kapuját nyitja meg. Fontos azonban, hogy mindannyiunk agya másképp súlyozza az időben később megkapott jutalmat. Van, akinél a diszkont ráta alacsony, ezeknél az embereknél a később megkapott jutalom értéktelenebb. Vannak ugyanakkor olyan egyének, akiknél a diszkont ráta magas, ők kvázi előre tudnak örülni későbbi jutalmaknak, ami jelentősen megkönnyíti számukra az ezek eléréséhez szükséges utat.
Miért nehéz tehát változtatni a viselkedésünkön?
Azért, mert a minket körülvevő világot agyunk eltérő értékkel bíró állapotok sokaságaként kódolja, mely állapotok értékének meghatározásában alapvető azok azonnali jutalmazó értéke. Amikor tehát valamely egészségmagatartási forma módosításával kapcsolatosan kell meghozni egy-egy döntést, a döntés azonnali jutalma sokat nyom a latban. Gondoljunk bele, hogy mennyivel egyszerűbb reggel a másik oldalunkra fordulni ahelyett, hogy edzőcipőt húznánk, vagy milyen jól esik még egy szelet sütemény egy nehéz nap után. Ehhez képest a mozgással, a kalóriatudatos életmóddal elérhető későbbi kívánatos egészségi állapotot nem az azonnali értékén kapjuk meg, hanem diszkontálva (vagyis csökkentve). Ez az érték ráadásul annál alacsonyabb, minél alacsonyabb a diszkont rátánk.
A viselkedés változásához az is fontos, hogy az ember élete során hogyan építi a világmodelljét. Ahhoz, hogy befolyásolni tudják az életünket, az új viselkedési mintázatoknak el kell érniük egy kritikus szintet, gyakoriságot, hogy egy-egy szignál-kontextus társuláshoz megváltozott (pl. nagyobb) jutalom (illetve érték) társuljon. Ez, tekintve, hogy a modell frissülése az egyes kimenetelek gyakoriságán alapul, időben elhúzódó, vagyis következetes változást igényel. Ezt a legegyszerűbben (de persze nem a legkönnyebb módon) tudatosan, kognitív erőfeszítések árán lehet biztosítani. Emellett természetesen számolni kell azzal, hogy ezek a folyamatok elsősorban subcorticalisan, a limbikus rendszer szintjén zajlanak, amelyek nem befolyásolhatóak könnyen akaratlagosan.
Összegezve elmondható, hogy az egészségmagatartás változását lehetővé tevő folyamatok befolyásolhatóak, ez azonban elhúzódó, nehéz folyamat, mivel egyfelől egy komplex, egy élet tapasztalatát tükröző világmodellnek kell módosulnia, másfelől pedig azért, mert ez a kognitív szint alatt meghúzódó limbikus szint módosulását igényli.
(Szerző: Dr. Zsuga Judit - Az Emberi Erőforrások Minisztériuma ÚNKP-18-4-DE-452 kódszámú Új Nemzeti Kiválóság Programjának támogatásával készült)