venerdì 15 gennaio 2010

Reinforcement learning, parte seconda: la punizione

Abbiamo già visto in precedenza qualche aspetto della ricompensa, e come sia possibile modificare i comportamenti appresi, e parliamo in particolare di abitudini, cambiando ricompensa. Questo è un meccanismo molto potente, ancorchè inconscio. Ed è un meccanismo basilare per l'educazione. Ci si domanda spesso, in questo contesto, quale sia il valore della punizione. Se, infatti, la ricompensa è il feedback positivo che ci insegna a ripetere comportamenti che ci procurano soddisfazione, la punizione certifica, per il cervello, che è sconveniente ripetere l'azione.

Faccio subito una precisazione: bisogna distinguere, sebbene in natura siano mescolati, l'apprendimento per feedback negativo da quello di natura emotiva. L'apprendimento per feedback negativo non è che l'altra faccia del rinforzo positivo: facendo numerosi errori pian piano impariamo ad aggiustare il tiro. Abbiamo bisogno, per questo, di diverse occasioni di errore. L'apprendimento emotivo, invece, necessita di una singola occasione: mangio cibo avariato, sto male, eviterò in futuro di mangiarne ancora. Trasferito sul piano educativo, questo meccanismo può regolare il comportamento tramite la paura. Un padre assesta un ceffone a un bambino: questi a tutta prima è sorpreso e spaventato. Il meccanismo della paura è legato al concetto di deterrente, ossia non commetto un crimine per evitare un futuro sgradevole. Nell'apprendimento tramite punizione, invece, l'episodio è ripetuto e si fa esperienza delle conseguenze negative.
Questo distinguo è importante, perchè non si fraintenda quanto segue.

Allan Collins nella sua lezione parlava di una sperimentazione in atto sui recettori niconitici, che ha in sè la grande promessa di rendere più facile l'interruzione del fumo. Abbiamo detto che ci sono recettori responsabili del piacere conseguente al fumo, e ce ne sono altri responsabili di conseguenze negative sull'apparato digerente. Ebbene, pare siano allo studio farmaci specifici per bloccare i recettori positivi, così da renderli insensibili alla nicotina, intaccando poco o nulla quelli negativi! Dopo la somministrazione del farmaco il soggetto è invitato a... fumare! Non traendo più rinforzo positivo dal fumo, ma sperimentandone solo gli inconvenienti, il soggetto pian piano perde il vizio.
Benchè i risultati siano migliori di quelli ottenuti tramite applicazioni cutanee di nicotina (cerotti), lo zoccolo duro dei fumatori non smette, probabilmente perchè resta un'associazione psicologica molto forte tra i gesti compiuti nell'atto di fumare e la ricompensa, o per altre caratteristiche individuali. Per fortuna è così: la complessità umana non si lascia ridurre a una manciata di molecole!

Il maccanismo della punizione è utilizzabile anche per imparare, come avviene quando uno gioca a freccette e mancando ripetutamente il bersaglio affina la mira. Ma quello per cui è probabilmente insostibuile è disimparare.

Chi desidera approfondire l'argomento può consultare, tra gli altri, gli articoli di Michael J. Frank.

Nessun commento: