Un paradosso statistico: l’effetto Will Rogers

Adoro i paradossi. Adoro quando la mente sembra certa di qualcosa ma la logica è di tutt’altro avviso. A ben vedere, spesso non si tratta di veri e propri paradossi, quanto semplicemente di effetti controintuitivi.

Il più famoso è forse il paradosso del compleanno (ne abbiamo parlato in questo articolo) ma in statistica ce ne sono tanti altri. Oggi vorrei parlare dell’effetto Will Rogers. In verità, anche di questo ne abbiamo già accennato in un precedente articolo, parlando di sopravvivenza ai tumori e dei cosiddetti “bias” che possono distorcere la lettura dei dati.

Ma chi diavolo è Will Rogers?

Si potrebbe pensare ad uno statistico. E invece no! Will Rogers era un comico statunitense! Negli anni ’30 scherzando sulla migrazione dei contadini poveri dall’Oklahoma alla California in un suo spettacolo disse:

“Quando gli Okies lasciarono l’Oklahoma per trasferirsi in California, il livello medio d’intelligenza aumentò in entrambi gli stati.”

Ma come è possibile mai? Come può essere che, soltanto spostando delle persone (unità statistiche) da uno Stato all’altro (da un gruppo a un altro), le medie aumentino in entrambi?
Semmai una dovrebbe alzarsi e l’altra abbassarsi… E invece no: si alzano entrambe.
Può sembrare controintuitivo, ma è perfettamente possibile.

Come stanno effettivamente le cose

Di fatto, se le persone che emigrano si collocano al di sotto della media dell’Oklahoma ma al di sopra della media californiana, ecco che la media cresce in entrambi i gruppi!

Non siete ancora convinti? Vediamo meglio e immaginiamo due gruppi:

  • il gruppo A, con valori medi più alti
  • il gruppo B, con valori medi più bassi

Se prendo un individuo “intermedio” (sotto la media di A ma sopra quella di B) e lo sposto da A a B, le medie di entrambi i gruppi aumentano, anche se la media complessiva dell’intera popolazione rimane invariata.

Il boxplot qui sotto riassume visivamente il meccanismo del paradosso. [Sul tema della rappresentazione dei dati, trovi altri esempi interessanti nella sezione dedicata alla Data Visualization]

Stage migration

In medicina, questo effetto è conosciuto come stage migration, letteralmente “migrazione di stadio”. Si ha -ad esempio- quando un miglioramento nelle tecniche diagnostiche consente di individuare tumori in fase più precoce o di valutare con maggiore precisione la loro gravità.

Immaginiamo due categorie di pazienti: quelli con malattia lieve e quelli con malattia grave. Con le vecchie tecniche, alcuni pazienti “a metà strada” venivano classificati tra i lievi. Poi arriva una nuova TAC e quegli stessi pazienti vengono ricollocati nello stadio grave.

Che cosa succede alle statistiche?

  • Nei casi lievi, restano solo i pazienti davvero meno gravi. La loro sopravvivenza media aumenta (ma solo perché i peggiori sono stati spostati altrove).
  • Nei casi gravi, entrano pazienti che in realtà stanno un po’ meglio della media del gruppo. Anche qui la sopravvivenza media cresce.

Guardando i numeri, sembrerebbe che tutti i pazienti vivano di più. Ma non è affatto così. È solo cambiato il modo in cui li abbiamo classificati. Potremmo chiamarle “illusioni ottiche della statistica“!

Attenzione gente!

L’effetto Will Rogers non riguarda solo la statistica medica. Può verificarsi ogni volta che si ridefiniscono le categorie, dalle classifiche scolastiche ai ranking economici.
Ogni volta che ridefiniamo i gruppi, rischiamo di spostare “Okies” (per dirla come direbbe Will Rogers) da una parte all’altra, e di far sembrare tutto migliore senza che nulla sia davvero cambiato.

Insomma i numeri non mentono, ma possono essere usati per ingannare senza necessariamente mentire. Quando confrontiamo medie, indicatori o statistiche di gruppo, dobbiamo sempre chiederci se ci possa essere un qualche effetto Will Rogers in aguato.

Sulle abitudini sessuali degli italiani

Con una certa regolarità mi imbatto in articoli sulle presunte abitudini sessuali degli italiani. Si fa spesso riferimento ai risultati di sondaggi che hanno come oggetto il numero medio di rapporti, la loro durata o ancora il numero medio di partner.

Nell’ultimo articolo che mi è capitato di leggere viene detto: “Il numero medio di partner intimi che le persone hanno in una vita intera varia tra i 4,3 per le donne e i 6,3 per gli uomini“. Fonte: Centers for Disease Control and Prevention. Anche il CENSIS afferma: “Oggi il numero medio di partner sessuali avuti a quarant’anni è 6, 4 per le donne, 7 per gli uomini.” E puntualmente il leitmotiv si ripropone di sondaggio in sondaggio: gli uomini hanno più partner rispetto alle donne.

Molti di voi non saranno sorpresi nel leggere questi numeri, eppure una situazione del genere è impossibile da un punto di vista matematico. Cerchiamo di analizzare la faccenda in maniera semplice. Supponiamo di avere 10 uomini e 10 donne le cui relazioni eterosessuali sono descritte nel diagramma qui sotto.

In questo diagramma contiamo 15 liaison amoureuse (linee che legano un uomo a una donna). Quindi facendo il numero medio di rapporti per gli uomini otterremo 15/10 e stesso identico calcolo per le donne: le due medie sono uguali. Provate ad aggiungere quante connessioni (linee) volete, complicando il diagramma a dismisura ma sempre otterrete lo stesso numero. Il numero medio di partner per gli uomini deve essere uguale al numero medio di partner per le donne. Il lettore che fosse sorpreso da questa evidenza è invitato a prendere carta e penna e controllare da sé prima di continuare la lettura.

Cinque possibili motivi
Bene, assodato che da un punto di vista matematico le due medie devono essere uguali, possiamo domandarci il motivo per cui in tutti i sondaggi gli uomini sembrano avere molti più rapporti intimi rispetto alle donne. I motivi possono essere diversi. Io ne ho ipotizzati 5 (alcuni più fantasiosi di altri).

Il primo è che il sondaggio presenti qualche problema di campionamento, ovvero che il campione degli intervistati non sia rappresentativo della popolazione. Ad esempio, se il campione fosse sbilanciato tra uomini di una certa età e donne giovani, è evidente che gli uomini maturi abbiano avuto più tempo a disposizione per avere più partner.

Secondo motivo. Il sondaggio riguarda tutti i tipi di rapporti sessuali e non soltanto quelli eterosessuali. In questo caso però la differenza tra le due medie può essere spiegata soltanto da una maggiore concentrazione di rapporti omosessuali tra i ranghi maschili.

Terzo possibile motivo. Essendo un sondaggio condotto su italiani è possibile che i maschietti vantino un maggior numero di performance con le straniere. Insomma d’estate tutti in Romagna a caccia di svedesi.

Quarto motivo, ci incominciamo ad avvicinare al vero. Gli uomini potrebbero interpretare le domande sulla loro vita sessuale in modo diverso rispetto alle donne. Ad esempio, potrebbero includere relazioni brevi o casuali nei loro conteggi di partner, mentre le donne potrebbero escluderle. Un petting (effusioni amorose o semplici preliminari) viene facilmente segnato come gol nel taccuino dei maschietti.

Quinto motivo, il più accreditato, si rifà a pressioni sociali e stereotipi di genere. Gli uomini in generale sentono una certa pressione sociale e sentono di dover dimostrare virilità e successo sessuale. Sono pertanto più propensi a gonfiare il numero di partner. E ricordiamoci che questo genere di sondaggi i numeri sono autodichiarati. Inoltre questo è anche il motivo per cui non ci sorprendiamo più di tanto quando leggiamo i risultati di questi sondaggi.

Altri motivi? Fammi sapere nei commenti.

Considerazioni finali
Di tutto questo, la cosa che mi colpisce maggiormente è da un lato la leggerezza con cui questi risultati vengono riportati e dall’altra la facilità con cui siamo portati a credere a questi numeri. Anche quando sono evidentemente dati impossibili. Il fatto che gli uomini abbiano in media più rapporti sessuali delle donne è in qualche modo in linea con la nostra visione del mondo, e dunque lo consideriamo prima verosimile e poi veritiero. Sul tema verità e verosimiglianza già ci è capitato di parlarne qui su infigures. Un tema molto attuale strettamente legato a quello delle fake news.

Possibili obiezioni
Qualcuno potrebbe obiettare che il discorso regge solamente se il numero di uomini è uguale al numero di donne. Bene, diciamo che in tutti i paesi del mondo la suddivisione tra uomini e donne è pressappoco 50-50. Le differenze sono lievi e variano da paese a paese (ne parleremo presto qui su infigures). In Italia per esempio (considerate tutte le età) secondo le stime ISTAT siamo 58.997.201 abitanti di cui 28.814.832 uomini (48.8%) e 30.182.369 donne (51.2%).

Proviamo a fare i calcoli partendo da questa suddivisione tra uomini e donne (48.8 vs 51.2). Supponiamo inoltre 7 rapporti in media per gli uomini (come da studio CENSIS). In questo caso avremmo un totale di 7 * 28.814.832 rapporti eterosessuali. Per ottenere il numero medio di rapporti per le donne avremo 7 * 28.814.832 / 30.182.369 e dunque 6.7. Esiste pertanto una lieve differenza tra le due medie ma la forbice è molto più stretta rispetto a quanto viene riportato usualmente da questo genere di sondaggi. Inoltre la differenza cui assistiamo è da imputare totalmente alla composizione della popolazione (rapporto uomini e donne) e non certo a differenti abitudini sessuali tra uomini e donne.