venerdì 23 ottobre 2009

Connessionismo. Un'introduzione

Per la comprensione della mente umana o anche solo di suoi singoli aspetti sono state utilizzate nel tempo diverse metafore, ed in particolare una nuova metafora, quella del computer, ha preso sempre più piede negli ultimi anni nell'ambito dello studio dei processi psicologici; essa s'è affermata contemporaneamente al diffondersi del cognitivismo come nuovo paradigma di ricerca in psicologia e con la visione dell'uomo come elaboratore di informazioni che questo ha spesso portato con sé. Il computer, anch'esso elaboratore di informazioni, grazie alla sua ormai "classica" distinzione tra hardware e software offre diversi spunti che sembrano aiutarci a capire qualcosa di più dell'uomo diviso tra mente e corpo, o tra mente e cervello. Però, nonostante il progressivo prevalere da Cartesio in poi della distinzione mente-corpo, e nonostante la tradizione ormai secolare che questa idea può vantare, è possibile ritrovare voci critiche, fuori dal coro, che ci mettono in guardia contro l'applicazione troppo semplicistica di questo dualismo (si pensi alla psicologia o alla medicina psicosomatica o, per rimanere in un ambito più vicino alle neuroscienze, alle idee sviluppate ad esempio da Antonio Damasio, 1994); ed in effetti è possibile ritrovare metafore alternative a quella del computer che permettono di andare oltre l'idea di un sistema cognitivo da studiare come cosa totalmente diversa rispetto alle reti cerebrali da cui esso è sostanziato. Ad esempio i primi computer svolgevano le varie funzioni logiche per cui erano stati sviluppati per mezzo della stessa struttura fisica che li costituiva (von Neumann, 1966); leggendo lo stesso von Neumann si scopre come sia stato in buona misura per un motivo opportunistico, e cioè a causa dell'inaffidabilità dei materiali di cui i primi calcolatori erano costituiti, che man mano si è arrivati all'espediente della distinzione tra hardware, inteso come struttura fisica di un computer, e software, inteso in maniera ampia come le varie funzionalità che un dato hardware è in grado di gestire.

C'è un paradigma di studio in particolare che ci permette di salvaguardare l'importante legame che è possibile intravedere tra la struttura delle nostre reti neuronali cerebrali ed il funzionamento della nostra mente: si tratta del paradigma connessionista, che ha il suo "manifesto" nel libro di Rumelhart & McClelland (1986) "Parallel distributed processing: explorations in the microstructure of cognition". Tramite questo paradigma è possibile in qualche modo giovarsi del rigore e della precisione formale propri dei modelli matematici, essere contemporaneamente attenti al lato psicologico dei fenomeni oggetto di studio (percezione, memoria, linguaggio, ragionamento, etc.), e infine recepire le indicazioni provenienti da vari studi più propriamente "biologici", di tipo neuropsicologico e di neuroimmagine.

Secondo questo paradigma l'elaborazione delle informazioni avviene nel nostro sistema cognitivo in modo parallelo, distribuito ed interattivo. I modelli connessionisti (o “reti neurali”) sono composti da unità (“neuroni virtuali”) aventi ognuna un certo valore d'attivazione (consistente in un semplice numero reale), e collegate tra loro da connessioni pesate (e cioè in qualche modo regolabili) di tipo eccitatorio o inibitorio (cioè esse rispettivamente possono aumentare o diminuire l'attivazione del neurone a cui si connettono). Quando un certo input, stimolo, è somministrato ad un sotto-insieme delle unità che compongono la rete, l'attivazione che questo input determina in esse si propaga per mezzo delle varie connessioni lungo tutta la rete, arrivando a determinare una certa attivazione finale nel sottoinsieme di unità di output (di uscita) della rete; questa attivazione finale dipende oltre che dalle connessioni esistenti anche dalla loro maggiore o minore forza. Per far sì che ad un certo numero di input corrisponda un determinato numero di ben precisi output si può fare affidamento su una serie di algoritmi creati appositamente per allenare secondo diversi criteri una rete neurale, oppure si possono anche settare le varie connessioni manualmente, a seconda del fenomeno che si desidera simulare e degli scopi per cui la rete viene costruita.

Le potenzialità di questo paradigma consistono soprattutto nella sua capacità di superare l'ottica di una divisione troppo netta tra mente e cervello, e negli spunti che esso offre a favore di una visione complessa e di interazione dei fenomeni oggetto di indagine. Ad esempio l'approccio connessionista getta una nuova luce sulla contrapposizione storica tra empirismo e innatismo, dal momento che i suoi modelli sono costituiti da un'ossatura innata su cui si innestano diversi processi per mezzo dei quali avviene un vero e proprio apprendimento su base empirica (il “training” di preparazione a cui vengono sottoposte le reti). Ancora, questo approccio porta nuovi contributi alla altrettanto storica contrapposizione tra elementismo e approccio molare, globale, in quanto i modelli connessionisti sostituiscono l'elaborazione localizzata dei simboli con operazioni distribuite, operazioni che danno luogo all'emergenza di proprietà globali.

In letteratura sono ormai noti diversi vantaggi e svantaggi dell'approccio connessionista rispetto all'approccio teorico simbolico classico di simulazione e teorizzazione dei processi cognitivi. Per quanto riguarda i vantaggi, le reti neurali sono robuste e flessibili: la distruzione di alcune unità di una rete neurale o la presenza di un input ambiguo causano un decadimento solo parziale delle prestazioni della rete; al contrario un modello realizzato secondo un approccio puramente simbolico che venga danneggiato o testato con input ambigui di solito fallisce completamente il suo obiettivo. Ancora, le reti neurali hanno delle capacità spontanee di generalizzazione assenti nei modelli classici, per cui ad esempio in compiti di categorizzazione riescono a gestire meglio le eccezioni e gli stimoli nuovi. Tra gli svantaggi bisogna certamente considerare invece che i modelli attuali non considerano molte delle differenze tra i diversi tipi di neuroni cerebrali, e non sono in grado ad esempio di simulare una importante proprietà dell'apprendimento umano: mentre le reti necessitano di lunghi cicli di apprendimento per arrivare a eseguire correttamente i loro compiti, all'uomo e a molti animali basta spesso fare esperienza una sola volta di un dato pericolo per apprendere ad esempio una risposta di evitamento.






Ulteriori riferimenti biliografici:
Damasio, A. R. (1994). Descartes' Error: Emotion, Reason, and the Human Brain. New York: Putnam Publishing
Garson, J. (pubblicato 2007, consultato Settembre 2008). Disponibile su http://plato.stanford.edu/entries/connectionism/
von Neumann, J. (1966). Theory of self-reproducing automata. Ed. by Arthur W. Burks. USA: University of Illinois.

lunedì 12 ottobre 2009

Livelli di apprendimento

Uno degli argomenti più importanti delle neuroscienze è l'apprendimento; è una sfida fondamentale capire quali sono gli algoritmi che permettono l'apprendimento. E, ovviamente, se tali sono veri algoritmi nel senso turinghiano del termine.

Oovviamente non ci riferiamo solamente all'apprendimento scolastico, o, in generale, in ambito umano. Ci riferiamo, invece, ad un concetto molto più ampio. Adesso andremo ad esaminare alcuni livelli a cui può avvenire l'apprendimento.

Piccola premessa: queste sono solo le mie personali opinioni in proposito, e non intendo dire nulla di definitivo, o anche solo di autenticamente scientifico, sulla questione.

Apprendimento esplicito eteronomo: con questo indico l'apprendimento che sono in grado di portare a termine esseri viventi se addestrati. In questo rientrano gran parte dell'educazione umana, ma anche l'addestramento di cani e cavalli da parte dell'uomo; l'educazione alla caccia negli animali. La trasmissione, insomma, di comportamenti non-innati fra individui diversi. La cultura, in senso lato, se volete.

Apprendimento implicito autonomo: ogni essere vivente, se esposto ad una pressione ambientale, modifica il suo comportamento per adattarsi all'ambiente. Questo vale sia per animali dotati di facoltà intellettive mediamente superiori, diciamo mammiferi ed uccelli, sia per animali dotati di facoltà inferiori, come i pesci o gli insetti. Vi faccio due esempi che mi hanno colpito molto.

Allo zoo di Stoccarda ci sono molte zone per animali delimitate da fossati, piuttosto che da gabbie. In tali fossati vivono carpe. Se vi avvicinate per osservare gli animali proiettando un ombra sul fossatto, osserverete che le carpe vengono a galla aprendo la bocca. Evidentemente hanno appreso che spesso e volentieri i visitatori lanciano loro da mangiare.

Ad un livello ancora più primitivo: il C. Elegans memorizza durante i primi stadi del suo sviluppo la temperatura a cui è stato cresciuto, e tende a muoversi sempre verso temperature simili.

L'esempio di C. Elegans è decisamente estremo! Infatti il nostro nematode dispone di poche centinaia di neuroni; quindi vediamo come il comportamento di movimento deve essere in qualche maniera codificato all'interno di questa piccola rete neurale, tramite le sue connessioni con i neuroni sensoriali. Questo ci porta all'apprendimento di livello più basso.

Apprendimento parametrico: questo è quello che realizzano le reti neurali; un certo output della rete neurale viene premiato o meno con una ricompensa (virtuale) e, a seconda di questa ricompensa, vengono rinforzate o modificate le connesioni, in maniera tale che la rete tenda ad ottimizzare la ricompensa che ottiene. Questo è il principio del reinforcement learning. Ovviamente, per questo tipo di apprendimento è necessaria un'istanza superiore che elargisca la ricompensa.

Quali sono le grande sfide delle neuroscienze? Vediamone alcune:

- capire quali sono i meccanismi esatti dell'apprendimento parametrico;
- cosa sono le istanze ricompensanti dei vari circuiti;
- capire quali e quanti sono i livelli dell'apprendimento implicito e come sono legati fra loro;
- capire come è possibile l'emergenza dell'apprendimento esplicito ad un livello più alto.

Capite la difficoltà dell'impresa?