martedì 10 novembre 2009

Reinforcement learning, parte prima: la ricompensa

Ho partecipato di recente a un convegno in Turchia, al quale era presente, tra gli altri, Allan Collins, il guru della nicotina.
Quando si parla di fumo si va subito alla dipendenza, al consumo di droghe, a come smettere. Ed ecco la prospettiva offerta dal luminare.

La nicotina è un composto agonista dell'aceticolina, un neurotrasmettitore presente nel sistema nervoso centrale e periferico. Normalmente l'aceticolina liberata da un neurone trasmittente si lega al recettore presente sulla superficie del neurone ricevente e scatena una certa risposta, a seconda delle proprietà del recettore. Quando é presente la nicotina, questa si lega al recettore al posto dell'aceticolina, attivandolo: perciò è detta "agonista".

Esistono recettori diversi per lo stesso neurotrasmettitore. Nel caso dell'aceticolina c'é un recettore chiamato "nicotinico", perchè vi si lega la nicotina, e uno chiamato "muscarinico", perché vi si lega la Muscarina. Quest'ultimo non ci interessa al momento.
Il recettore nicotinico é un canale, cioè una proteina con una cavità che, qualora "aperta" dalla giusta chiave, permette il passaggio di molecole responsabili della trasmissione del messaggio.
Il panorama é ancor più vario: ogni canale è costituito da piú subunità, che vengono assemblate per costruire il canale. Il nostro organismo è in grado di fabbricare subunità diverse anche per lo stesso canale, combinandole poi variamente per ottenere canali con proprietà leggermente diverse.

Quando si fuma si attivano indiscriminatamente tutti i canali nicotinici. Alcuni sono responsabili del benessere dato dal fumo per via del loro collegamento con neuroni dopaminergici. Altri canali agiscono nel sistema nervoso periferico procurando dolori di stomaco e altre sensazioni sgradevoli. Quello che in ultima analisi il fumatore ricerca é una po' di dopamina in piú, e per farlo si accolla il rischio di cancro, il sapore amaro della nicotina, le sgradevoli sensazioni intestinali.
Questo è un comportamento appreso: nessuno "nasce fumato".
Si apprende grazie a un particolare circuito che sfrutta la dopamina. Semplificando, una certa azione guida a un rilascio di dopamina nel cervello, e da ciò l'organismo "capisce" che l'azione che ha preceduto il rilascio di dopamina è una cosa buona, ed è bene prendere l'abitudine di compiere questa azione. È un tipo di condizionamento operante. Detto con un esempio, il mio andare in pizzeria é ricompensato da una buona pizza (cibo, rinforzo primario), mi sento bene e ci voglio tornare. Mi costa denaro, quindi devo lavorare per tornare in pizzeria. Lavorando ottengo i soldi necessari a procurarmi la pizza: col tempo il recarsi in pizzeria perde di significato e sposto l'azione decisiva sul lavoro e la ricompensa sul denaro (rinforzo secondario).

Così ragionava Allan Collins: perchè devo fumare e procurarmi inconvenienti per una spremutina di dopamina? Non esiste un farmaco più specifico, che si attacchi solo ai recettori responsabili delle sensazioni positive? Ma certo. Il concetto non é la nicotina, ma la ricompensa. Ebbene, ci sono altre ricompense: il sesso, ad esempio, fornisce col piacere un rinforzo primario. Col tempo questo rinforzo primario può essere parzialmente o interamente sostituito da un bacio, dal parlare con la persona amata, dal vedere la persona amata.

L'amore è il farmaco piú specifico per procurarci il benessere.

4 commenti:

Anonimo ha detto...

Condivido in pieno, e il fatto che io abbia avuto la fortuna di osservare meccanismi analoghi con un approccio diverso mi sembra un ulteriore conferma della buona direzione in cui stanno dirigendosi gli studi di cui parli tu. Spero di leggere quanto prima la seconda parte di questo post.

Sovrappensiero (non trovo il quadernino in cui mi segno le pw di accesso) :-P

Bluebeardburns ha detto...

Sovrappensiero, che vuoi dire con "buona direzione"? Così sembra che sia lì come un precettore che osserva i progressi del suo indisciplinato allievo, in attesa che giunga, con l'esperienza e lo studio, alle conclusioni a cui il maestro è giunto da tempo :p

Scherzi a parte, anche a me fa sempre piacere conoscere e ascoltare scienziati che si prodigano per costruire una visione d'insieme. Purtroppo spesso un approccio che tenda a includere le osservazioni di natura non sperimentale è apertamente osteggiato.

Secondo me anche gli operatori delle scienze umane hanno la loro parte di torto...

e c'amma fa'! :D


ciao ciao

Anonimo ha detto...

No no ma figurati. La direzione è "buona", nel senso che produrrà solo del gran bene, perchè mi sembra prefigurare soluzioni estremamente concrete a problemi molto gravi. Mi sto iniziando a occupare dei nuovi trattamenti per le vecchie e nuove dipendenze, con particolare attenzione per l'offerta di interventi proposta dal servizio pubblico, cioè un settore in cui i soldi sono pochi, gli utenti tanti, le responsabilità ancor di più, perchè rispondi del tuo operato agli utenti stessi e alla società. In questo settore, a maggior ragione, prima si riduce il margine di errore dell'operatore, prima si risolvono i problemi, e con minor spesa e maggiori pprobabilità di includere chi rischia di esser tagliato fuori dal servizio per mancanza di risorse. Non posso che definire, quindi, "buona" tale prospettiva, e lo dicevo con estrema soddisfazione (continuo a sperare di "salvare il mondo" e questo mi sembra un passettino in più) ed ammirazione, davvero, nient'altro.

(non ho ancora ritrovato il quadernino)

Anonimo ha detto...

Quanto agli errori degli operatori delle scienze umane, io - supponendo di trattare ovviamente con personale adeguatamente formato - insisterei sul margine di incertezza. Penso che ogni metodo, qualitativo o quantitativo che sia, abbia i suoi tempi, e suoi margini di incertezza. E due approcci che operano sullo stesso settore dovrebbero ciclicamente integrarsi per velocizzare la riduzione di tale incertezza. Il metodo quantitativo, mettendo a disposizione le proprie evidenze empiriche che possono servire per scartare alcune ipotesi lasciate "in sospeso", o la cui verifica pone dei problemi di varia natura. Il qualitativo, fornendo degli spunti di riflessione da cui partire per approfondire alcune ricerche, o avviarne di nuove. Traducendo nella pratica quanto ho detto, se fossi un operatore intenzionato a fare un corso di aggiornamento, e venissi a conoscenza di quanto tu ora scrivi, cercherei un corso con l'approccio ovviamente alla mia portata in quanto a competenze richieste, ma il più coerente possibile con le riflessioni emerse dal convegno turco. Questa è una mera semplificazione, ma spero renda l'idea del mio "sogno di integrazione" interdisciplinare e "multiapproccio" (ih ih ih... che neologismo cacofonico!vedrò come "rinominarlo" alla prossima!).

(Sempre io, senza il quaderno...)