09 dicembre 2020

Il survival bias

Il survival bias è un errore logico che si commette nel momento in cui, esaminando i dati riguardanti un determinato processo di selezione (in senso ampio) ci si concentra su quelli riguardanti persone o cose che hanno superato il processo, trascurando l'analisi dei casi di insuccesso.

Tale errore può essere notato di frequente nelle discussioni sui social network riguardo la pericolosità di una certa malattia (come il morbillo o l'influenza), ritenuta dalla maggior parte dei commentatori innocua in quanto da loro superata senza danni rilevanti. Il problema sta, evidentemente, nel fatto che coloro che sono purtroppo deceduti a causa di essa non hanno la possibilità di contribuire con la loro voce al dibattito. 

Il survival bias, a parte il suo intrinseco interesse in quanto fallacia logica, ha conseguenze potenzialmente molto dannose in ambito scolastico o accademico, sia per quanto riguarda il processo di formazione che quello di reclutamento. Esempi tipici sono i seguenti.
  • Una certa scuola/università X annovera, fra i suoi diplomati/laureati, un alto numero di individui che raggiungono posizioni di prestigio in ambito lavorativo. Pertanto, si sarebbe tentati di dedurre che X è un'istituzione di eccellenza. Tuttavia, questa deduzione si basa esclusivamente sull'analisi delle carriere di coloro che hanno avuto successo, ignorando quelle di coloro che hanno fallito. Altre spiegazioni sono in realtà possibili: magari X è una istituzione molto numerosa, e quindi statisticamente ci saranno parecchi studenti brillanti; oppure è una istituzione molto costosa, alla quale riescono ad accedere solo studenti socialmente privilegiati, e quindi aventi già in partenza migliori possibilità di successo. Nulla si può concludere senza analizzare le carriere di tutti gli studenti, compresi coloro che non sono riusciti a diplomarsi/laurearsi.
  • Una certa branca Y della disciplina X ha molto più successo delle altre, e coloro che la studiano ricoprono posizioni di prestigio in ambito accademico, e hanno a disposizione fondi di ricerca e posti da bandire. Si sarebbe tentati di concludere che Y è, fra tutte, la branca di X scientificamente più rilevante e meritevole di essere finanziata e studiata ma, di nuovo, questa deduzione non tiene conto di coloro che studiano una branca differente Z, magari ugualmente valida ma che non riesce ad emergere in quanto marginalizzata dallo strapotere di Y. Di fatto, giudicare Y migliore di Z solo perché è mainstream e ha più visibilità, senza entrare nel merito dei risultati raggiunti, può alla lunga appiattire pericolosamente il dibattito scientifico nell'ambito della disciplina X.
Un aneddoto, molto citato in Ricerca Operativa, che mostra come il survivor bias possa portare a deduzioni apparentemente ineccepibili, ma in realtà totalmente errate, è quello legato alla figura. Si tratta di un aereo statunitense della Seconda Guerra Mondiale, dove i segni in rosso indicano in quali punti la fusoliera e le ali risultavano danneggiate dall'artiglieria nemica quando l'aereo rientrava alla base per riparazioni. 

Come proteggere maggiormente gli aerei? Ingenuamente, si sarebbe tentati di rafforzare le zone dove c'è maggiore concentrazione di punti rossi; tuttavia, come fece notare il gruppo di ricerca guidato dal matematico Abraham Wald, la strategia ottimale è fare esattamente l'opposto. 

Infatti, gli aerei colpiti nelle zone senza punti rossi, al contrario degli altri, non erano riusciti a rientrare, in quanto un danno in quelle zone era troppo grave e causava l'abbattimento del velivolo. Paradossalmente, le aree rosse erano addirittura quelle meno problematiche, dato che un areo colpito solo lì aveva buone possibilità di riportare il pilota alla base.




Nessun commento:

Posta un commento