Simpson’s Paradox e Monty Hall Paradox

🎶 Ta-ta-tara-ta-ta-ta-taaa…

Quando parte la sigla dei Simpson, sappiamo che tutto può succedere. Cambia ogni volta: la lavagna, il divano, il sassofono di Lisa. È sempre la stessa… ma ogni volta è diversa.

Ecco, questa sensazione di familiarità che però ci sorprende è molto simile a quella che si prova quando ci si imbatte in un paradosso statistico: tutto sembra coerente, finché non lo è più. E ci accorgiamo che dietro i numeri ci sono storie che non stiamo raccontando bene.

In questo articolo ti porto a scoprire due mind-twister che hanno il potere di ribaltare la nostra comprensione della realtà: il Paradosso di Simpson e il Paradosso di Monty Hall. Due casi apparentemente semplici, ma illuminanti per chi lavora con i dati, l’intelligenza artificiale, o semplicemente vuole prendere decisioni migliori.

🌀 Simpson’s Paradox: il potere di una variabile nascosta

Immagina di star analizzando il rapporto tra esercizio fisico e livello di colesterolo. Con sorpresa, scopri che le persone che si allenano di più… sembrano avere più colesterolo.

Assurdo, vero? Ma aspetta. Quando dividi i dati per fasce d’età, scopri che in ogni gruppo, fare esercizio abbassa il colesterolo.

Benvenuto nel Paradosso di Simpson: quando una tendenza presente nei sottogruppi scompare o si inverte nei dati aggregati.

📚 Caso reale: l’ammissione a Berkeley

Nel 1973, l’Università di Berkeley fu accusata di discriminazione di genere: sembrava che le donne venissero ammesse molto meno degli uomini.

Ma analizzando i dati per dipartimento, si scoprì che in molti casi le donne avevano tassi di ammissione più alti.

Il motivo? Le donne tendevano a candidarsi a dipartimenti più competitivi, con meno posti disponibili.

L’apparente discriminazione era un effetto aggregato.


🧠 E allora come facciamo a non cascarci?

Secondo Judea Pearl, per risolvere il Paradosso di Simpson non basta fare “più grafici”. Dobbiamo:

  • 🎯 Scegliere lo strato di analisi giusto in base alla nostra domanda causale
  • ✅ Rappresentare le relazioni causali in un diagramma causale
  • 🔍 Determinare quali variabili sono confondenti e quali sono collider

👀 Confondente o collider?

TIPOSCHEMACOSA FA
ConfondenteX ← C → YCrea correlazioni spurie tra X e Y
ColliderX → C ← YSe lo controlliamo, creiamo correlazioni spurie


“Il Paradosso di Simpson non è un problema della statistica, ma della mancanza di chiarezza causale.” –

Judea Pearl

🧪 Caso classico: il farmaco BBG

È bad per uomini, bad per donne, ma… good overall?!

Sì, perché se partizioni male i dati senza considerare le variabili causali, la media può ingannare.

🚪 Monty Hall Paradox: quando cambiare idea conviene

Quiz televisivo. Tre porte. Dietro una c’è un’auto, dietro le altre due, capre 🐐.

Scegli una porta. Il conduttore, che sa tutto, ne apre una con una capra. Ti chiede: “Vuoi cambiare scelta?”

Molti dicono: “No, ormai è 50/50.”

❌ Sbagliato.

La risposta giusta?

Cambia sempre.

  • All’inizio, hai 1/3 di probabilità di beccare l’auto.
  • Le altre due porte insieme hanno 2/3.
  • Quando il conduttore ti toglie una capra, tutta quella probabilità si “concentra” sull’altra porta.

Questo paradosso fu reso celebre da Marilyn vos Savant. Ricevette migliaia di lettere indignate (anche da professori!). Ma la matematica aveva ragione.

🧠 Il nostro cervello non ama la probabilità

Il Monty Hall non è solo un gioco. È un esempio perfetto di come il nostro cervello odia ragionare in termini probabilistici.

Pensiamo: “Ho tolto un’opzione → le altre due sono uguali.”

Nope.

È lo stesso meccanismo che ci fa pensare che una macchina ci stia seguendo, solo perché gira per tre volte nella nostra stessa direzione.

Spoiler: probabilmente non ti sta seguendo. Ma il tuo cervello ama trovare pattern e intenzioni anche dove non ci sono.

🧩 Quindi cosa ci insegnano questi paradossi?

  • I dati non parlano da soli. Vanno interrogati bene
  • Le correlazioni possono ingannare. Serve contesto, struttura, storytelling
  • Serve un framework causale, come i DAG (grafi aciclici diretti)
  • Serve anche saper chiedere: “Cosa succederebbe se…?

🔍 Conclusione: la verità (causale) è nei dettagli

Questi paradossi sono un invito a rallentare.

A chiederci non solo “Cosa mostrano i dati?”, ma anche “Perché?”

Come nella sigla dei Simpson, ciò che sembra familiare può nascondere una svolta inattesa.

Serve attenzione.

E il coraggio di ammettere che i numeri, da soli, non bastano.

🎶 Ta-ta-tara-ta-ta-ta-taaa…

Illustrazione di Homer Simpson davanti tre porte chiuse.

Related Post

Aprile 12, 2025
🌌 Come Goku nella stanza dello spirito e del tempo: cosa ho imparato costruendo agenti AI con AWS

Ogni tanto capita un progetto che ti cambia la prospettiva. Per me, questo è stato uno di quelli. Durante il corso Build AI Agents with AWS di Zero To Mastery, ho avuto la sensazione di aver sbloccato un nuovo livello: un po’ come Goku quando si allena nella stanza dello spirito e del tempo — […]

Maggio 6, 2025
🎉 Level Up! Ho completato il corso "Build AI Agents with CrewAI" e potenziato le mie competenze AI!

🎉 Level Up! Ho appena completato il corso "Build AI Agents with CrewAI: Zero to Mastery" tenuto da Diogo Resende e mi sento di aver sbloccato un nuovo livello nel mondo dell'intelligenza artificiale! 🏆🤖 Un percorso entusiasmante che ho affrontato con il mio approccio preferito: sperimentare, costruire e imparare divertendomi… e naturalmente risolvere qualche problema […]

veronicaschembri
Copyright © Veronica Schembri

Privacy Policy
Cookie Policy