Il Paradosso Di Simpson

Sommario:

Il Paradosso Di Simpson
Il Paradosso Di Simpson

Video: Il Paradosso Di Simpson

Video: Il Paradosso Di Simpson
Video: Simpson's Paradox 2024, Marzo
Anonim

Navigazione di entrata

  • Contenuto dell'iscrizione
  • Bibliografia
  • Strumenti accademici
  • Anteprima PDF di amici
  • Informazioni sull'autore e sulla citazione
  • Torna in cima

Il paradosso di Simpson

Pubblicato per la prima volta lunedì 2 febbraio 2004; revisione sostanziale ven 1 aprile 2016

Considera la seguente storia:

L'etichetta di ciascun pacchetto di FIXIT-Y-capsuls della (immaginaria) Globalfixit Pharmacuticals Ltd. riporta il seguente uso raccomandato:

Consigliato per maschi e femmine con Condizione Y, ma non raccomandato per persone con Condizione Y.

Mentre la stampa fine sull'etichetta continua a spiegare:

studi clinici con FIXIT-Y hanno mostrato una percentuale più alta di recuperi da Y quando gli uomini l'hanno presa rispetto agli uomini che hanno preso il placebo, e allo stesso modo per le donne. Ma il gruppo che ha preso posto nella popolazione totale ha avuto tassi di recupero più elevati in generale. Puoi fidarti di FIXIT per fornire una farmacologia basata su prove.

La società commercializza anche capsule FIXIT-Z. L'etichetta su questi porta il consiglio che i Z-capsuls sono raccomandati per le persone che soffrono di Z, ma non per i maschi e non per le femmine. Mentre la stampa fine sull'etichetta continua a spiegare:

Gli studi clinici condotti con FIXIT-Z hanno mostrato che le persone che lo assumevano avevano tassi di recupero più elevati rispetto a quelli che avevano preso il placebo. Ma sia i maschi che le femmine che hanno preso il placebo hanno avuto tassi di recupero più elevati rispetto ai maschi e alle femmine che hanno assunto FIXIT-Z. Puoi fidarti di FIXIT per fornire una farmacologia basata su prove.

Mentre nessun capsul può essere buono per uomini e donne, ma cattivo per le persone, o buono per le persone mentre è cattivo per uomini e donne, i dati immaginati (vedi sotto) su cui FIXIT ha basato i suoi consigli mostrano modelli che sono sia aritmeticamente possibili che girano nei set di dati effettivi. Sebbene non vi sia nulla di paradossale sull'esistenza di tali dati dal punto di vista dell'aritmetica, pongono problemi per il processo decisionale pratico (ad esempio, vorresti essere trattato con i capsul di Fixit alla luce degli studi clinici riportati?), Per l'euristica usata nel ragionamento intuitivo sulle probabilità, per inferenze dai dati alle relazioni causali e, più in generale, per programmi filosofici che mirano ad eliminare o ridurre la causalità a regolarità e relazioni tra le probabilità.

L'aritmetica, su cui si basano esempi come le raccomandazioni mal giudicate di FIXIT, non è problematica. In sintesi, si basa sul fatto che

Un'associazione tra una coppia di variabili può essere costantemente invertita in ciascuna sottopopolazione di una popolazione quando la popolazione è partizionata e, al contrario, le associazioni in ciascuna sottopopolazione possono essere invertite quando i dati sono aggregati.

Chiama questo principio Simpson's Reversal of Inequonies. Il mancato riconoscimento di tali inversioni può portare alle sopracitate insidie su cosa fare, cosa credere, cosa inferire e cosa causa cosa. Anche quando vengono riconosciute inversioni effettive e possibili, permangono insidie. Una nota positiva, una volta riconosciute le possibilità di Reversals di Simpson, forniscono una ricca risorsa per la costruzione di modelli causali che aiutano a spiegare molti fatti che sembrano inizialmente anomali. Inoltre, esiste un test chiamato "criterio back-door" (Pearl 1993) che può essere utilizzato per aiutare a risolvere la questione se si debba basare una decisione sulle statistiche dalla popolazione aggregata o dalle sottopopolazioni partizionate.

La sezione 1 fornisce una breve storia del paradosso di Simpson, un'affermazione e una diagnosi delle strutture aritmetiche che ne danno origine e le condizioni al contorno per il suo verificarsi. La Sezione 2 esamina modelli di ragionamento non valido che hanno le loro fonti nel Paradox di Simpson e possibili modi per contrastare i suoi effetti. Un caso particolarmente importante in cui il Paradox di Simpson è stato impiegato in modo non valido è discusso nella Sezione 3. È stato ipotizzato che i dati paradossali forniscano contro-esempi al Principio Sicuro nelle teorie della scelta razionale. Viene spiegato perché tali dati sembrino fornire contro-esempi al Principio Sicuro e viene dissipata la loro apparenza. La sezione 4 discute i ruoli e le implicazioni dei dati paradossali per le teorie dell'inferenza causale e per l'analisi delle relazioni causali in termini di probabilità. Mentre le conclusioni di questa sezione sono in gran parte negative, la Sezione 5 illustra come dati apparentemente paradossali possano supportare modelli causali per l'evoluzione di tratti che inizialmente sembrano incompatibili con un ambiente in cui la selezione naturale svantaggia gli individui che presentano i tratti.

  • 1. Il paradosso di Simpson: storia, diagnosi e condizioni al contorno

    • 1.1 Storia
    • 1.2 Cos'è il paradosso di Simpson: una diagnosi
    • 1.3 Condizioni al contorno per le inversioni di Simpson
  • 2. Le inversioni delle disuguaglianze di Simpson come fonti di ragionamento non valido
  • 3. I dati paradossali forniscono contro-esempi al principio sicuro?
  • 4. Le inversioni delle disuguaglianze, delle correlazioni e delle cause di Simpson
  • 5. Inversione delle disuguaglianze di Simpson in contesti evolutivi
  • Bibliografia
  • Strumenti accademici
  • Altre risorse Internet
  • Voci correlate

1. Il paradosso di Simpson: storia, diagnosi e condizioni al contorno

1.1 Storia

In un articolo fondamentale pubblicato nel 1951, EH Simpson ha attirato l'attenzione su un semplice fatto sulle frazioni che ha una vasta gamma di applicazioni sorprendenti (Simpson 1951). Le applicazioni nascono dalle strette connessioni tra proporzioni, percentuali, probabilità e loro rappresentazioni come frazioni. Mentre gli statistici all'inizio del XX secolo avevano saputo dei problemi per le statistiche a cui Simpson aveva attirato l'attenzione, erano le sue illustrazioni argute e sorprendenti di loro che gli valse il titolo di paradossali (cfr. Yule 1903). Nel 1934, Morris Cohen ed Ernst Nagel presentarono ai filosofi un aspetto dei problemi posti dai dati paradossali. Citarono i tassi di mortalità effettivi nel 1910 per tubercolosi a Richmond, Virginia e New York, New York, che verificarono le seguenti proposizioni (Cohen e Nagel 1934): [1]

Il tasso di mortalità per gli afroamericani era più basso a Richmond che a New York.

Il tasso di mortalità per i caucasici era più basso a Richmond che a New York.

Il tasso di mortalità per la popolazione totale combinata di afroamericani e caucasici era più alto a Richmond che a New York.

Successivamente hanno posto due domande sui dati relativi ai tassi di mortalità: "Ne consegue che la tubercolosi ha causato [corsivo aggiunto] una mortalità maggiore a Richmond rispetto a New York …" e "… sono le due popolazioni che sono confrontate davvero comparabili, cioè, omogeneo?" (Cohen & Nagel 1934). Dopo aver posto le domande, lo hanno lasciato come un esercizio per il lettore di rispondere. In seguito alla pubblicazione dell'articolo di Simpson, gli statistici hanno avviato un vivace dibattito sul significato di fatti come quelli verificati dalle tabelle citate da Cohen e Nagel. Il dibattito ha cercato di limitare le pratiche statistiche che avrebbero evitato gli enigmi derivanti da dati paradossali effettivi e possibili. Tuttavia, questo dibattito non ha affrontato la prima domanda posta da Cohen e Nagel sull'inferenza causale. Come osserva Judea Pearl nella sua indagine sulla letteratura statistica sul paradosso di Simpson, gli statistici avevano un'avversione per parlare di relazioni causali e inferenza causale che si basava sulla convinzione che il concetto di causalità non era adatto e non necessario per i metodi scientifici di indagine e teoria costruzione (Pearl 2000, 173–181).

L'interesse filosofico per il paradosso di Simpson è stato riacceso dall'uso di Nancy Cartwright a sostegno delle sue affermazioni secondo cui i richiami alle leggi causali e alle capacità causali sono richiesti dall'indagine scientifica e dalle teorie della scelta razionale (Cartwright 1979). Mirava a dimostrare che la dipendenza da regolarità e frequenze su cui si possono basare i giudizi di probabilità non è sufficiente per rappresentare le relazioni causali. In particolare, i test di teorie scientifiche e analisi filosofiche della causalità e dell'inferenza causale devono fornire risposte a domande come quelle poste da Cohen e Nagel: ad esempio, è possibile che la tubercolosi abbia causato una maggiore mortalità a Richmond rispetto a New York anche se i tassi di mortalità per ogni sottopopolazione classificata per razza sembra suggerire diversamente? Se le relazioni causali seguono le regolarità,quale sistema di relazioni causali può ottenere tali effetti? Una volta che le rappresentazioni delle relazioni causali che forniscono risposte a domande come quelle poste da Cohen e Nagel sono a portata di mano, le rappresentazioni risultano avere interpretazioni che forniscono modelli causali per una serie di fenomeni interessanti e sconcertanti. Questi includono modelli causali per l'evoluzione dell'altruismo come tratto stabile in una popolazione anche se gli atti altruistici svantaggiano coloro che li compiono e avvantaggiano i loro concorrenti. (Vedi Sober 1993 e Sober & Wilson 1998, che sviluppano questi temi in dettaglio nelle aree della biologia della popolazione e della sociobiologia.) Esempi di tali modelli sono formulati e discussi nella Sezione 5.le rappresentazioni risultano avere interpretazioni che forniscono modelli causali per una serie di fenomeni interessanti e sconcertanti. Questi includono modelli causali per l'evoluzione dell'altruismo come tratto stabile in una popolazione anche se gli atti altruistici svantaggiano coloro che li compiono e avvantaggiano i loro concorrenti. (Vedi Sober 1993 e Sober & Wilson 1998, che sviluppano questi temi in dettaglio nelle aree della biologia della popolazione e della sociobiologia.) Esempi di tali modelli sono formulati e discussi nella Sezione 5.le rappresentazioni risultano avere interpretazioni che forniscono modelli causali per una serie di fenomeni interessanti e sconcertanti. Questi includono modelli causali per l'evoluzione dell'altruismo come tratto stabile in una popolazione anche se gli atti altruistici svantaggiano coloro che li compiono e avvantaggiano i loro concorrenti. (Vedi Sober 1993 e Sober & Wilson 1998, che sviluppano questi temi in dettaglio nelle aree della biologia della popolazione e della sociobiologia.) Esempi di tali modelli sono formulati e discussi nella Sezione 5.e Sober & Wilson 1998, che sviluppano questi temi in dettaglio nelle aree della biologia della popolazione e della sociobiologia.) Esempi di tali modelli sono formulati e discussi nella Sezione 5.e Sober & Wilson 1998, che sviluppano questi temi in dettaglio nelle aree della biologia della popolazione e della sociobiologia.) Esempi di tali modelli sono formulati e discussi nella Sezione 5.

1.2 Cos'è il paradosso di Simpson: una diagnosi

Per alcuni numeri interi potremmo avere:

(begin {align} a / b & / lt A / B, \\ c / d & / lt C / D, / text {and} (a + c) / (b + d) & / gt (A + C) / (B + D). / End {align})

Chiamalo una inversione di disuguaglianze di Simpson. Di seguito è un'illustrazione istruttiva. Le disuguaglianze aritmetiche su cui si basa sono:

(begin {align} 1/5 & / lt 2/8 \\ 6/8 & / lt 4/5 \\ 7/13 & / gt 6/13. / End {align})

La seguente interpretazione della struttura illustra perché può dare origine a perplessità. L'esempio è vagamente basato su una causa di discriminazione presentata contro l'Università della California, Berkeley (vedi Bickle et al., 1975).

Supponiamo che un'università stia cercando di discriminare a favore delle donne quando assume personale. Pubblicizza posizioni nel Dipartimento di Storia e nel Dipartimento di Geografia, e solo quei dipartimenti. Cinque uomini fanno domanda per le posizioni nella storia e uno viene assunto e otto donne fanno domanda e due vengono assunte. Il tasso di successo per gli uomini è del venti percento e il tasso di successo per le donne è del 25 percento. Il dipartimento di storia ha favorito le donne rispetto agli uomini. Nel dipartimento di geografia si applicano otto uomini e sei sono assunti, e cinque donne si applicano e quattro sono assunti. Il tasso di successo per gli uomini è del settantacinque percento e per le donne dell'ottanta percento. Il dipartimento di geografia ha favorito le donne rispetto agli uomini. Eppure in tutta l'Università nel suo complesso sono stati assunti 13 uomini e 13 donne e 7 uomini e 6 donne sono stati assunti. Il tasso di successo per i candidati di sesso maschile è maggiore del tasso di successo per i candidati di sesso femminile.

Uomini Donne
Storia 1/5 (Lt) 2/8
Geografia 6/8 (Lt) 4/5
Università 7/13 (Gt) 6/13

Come può ogni dipartimento favorire le donne candidate, eppure gli uomini in generale ottengono risultati migliori delle donne? Esiste un "pregiudizio nel campionamento", ma non è facile vedere esattamente dove sorge questo pregiudizio. C'erano 13 candidati maschi e 13 femmine: uguali dimensioni del campione per entrambi i gruppi. Geografia e storia avevano 13 candidati ciascuno: di nuovo campioni uguali. Né il problema sta nel fatto che i campioni sono piccoli: moltiplicare tutti i numeri per 1000 e il puzzle rimane. Quindi l'inversione delle disuguaglianze diventa abbastanza solida: è possibile aggiungere o sottrarre un bel po 'da ciascuna di quelle migliaia senza disturbare l'inversione di Simpson.

La chiave di questo esempio sconcertante sta nel fatto che un maggior numero di donne si candida per lavori che sono più difficili da ottenere. È più difficile entrare nella storia che nella geografia. (Per entrare in Geografia devi solo nascere; per entrare in Storia devi fare qualcosa di memorabile.) Delle donne che fanno domanda per un lavoro, più fanno domanda per un lavoro nella Storia che in Geografia, e il contrario è vero per gli uomini. La storia ha assunto solo 3 candidati su 13, mentre la Geografia ha assunto 10 candidati su 13. Quindi il tasso di successo era molto più alto in Geografia, dove c'erano più candidati maschi.

1.3 Condizioni al contorno per le inversioni di Simpson

L'inversione delle disuguaglianze di Simpson si verifica per una vasta gamma di valori che possono essere sostituiti con (a), (b), (c), (d), (A), (B), (C), (D) nello schema sopra. I valori rientrano in una banda larga che si trova tra due estremi:

Ad un certo punto, un po 'più donne si candidano per lavori che sono molto più difficili da ottenere.

Uomini Donne
Storia 1/45 (Lt) 5/55
Geografia 50/55 (Lt) 45/45
Università 51/100 (Gt) 50/100

Dall'altro estremo, molte più donne fanno domanda per lavori leggermente più difficili da ottenere.

Uomini Donne
Storia 4/5 (Lt) 90/95
Geografia 94/95 (Lt) 5/5
Università 98/100 (Gt) 95/100

Inoltre, i numeratori e denominatori delle frazioni che istanziano il modello schematico possono essere moltiplicati uniformemente per qualsiasi numero positivo senza perturbare le relazioni tra le frazioni. Le frazioni che presentano questi schemi corrispondono a percentuali e probabilità. Nella loro forma probabilistica, Colin Blyth fornisce le seguenti condizioni al contorno per Simpson's Reversals (Blyth 1972). Lascia che '(P)' rappresenti una funzione di probabilità e consideri le probabilità condizionate come rapporti di probabilità incondizionate secondo la loro definizione ortodossa; cioè, leggendo il '/' nel contesto (P (- / mid / ldots)) come 'dato che',

[P (A / mid B) = P (A / amp B) / P (B), / text {purché} P (B) text {sia positivo.})

Blyth nota che da un punto di vista matematico, soggetto alle condizioni

(begin {align} P (A / mid B / amp C) & / ge / delta / cdot P (A / mid { sim} B / amp C) / P (A / mid B / amp { sim} C) & / ge / delta / cdot P (A / mid { sim} B / amp { sim} C) end {align})

con (delta / ge 1), è possibile avere

[P (A / metà B) circa 0 / testo {e} P (A / metà { sim} B) circa 1 / / delta.)

Partendo dal presupposto che le proposizioni dell'aritmetica sono necessarie, queste possibilità equivalgono alle condizioni di esistenza nell'aritmetica. Lo schema:

[Se è possibile che (A) sia necessario, quindi (A)]

è valido in una vasta famiglia di logiche modali. Le condizioni al contorno per Reversals di Simpson consentono che qualsiasi associazione probabilistica tra (A) e (B) possa essere invertita in qualche ulteriore partizione di (B). Dal punto di vista dell'aritmetica esiste una partizione ({) C, ({ sim}) C (}) all'interno della quale vengono invertite le associazioni tra (A) e (B). Un'importante conseguenza correlata è che è sempre matematicamente possibile fornire una condizione o un fattore (C) che rende (A) probabilisticamente indipendente da (B) quando (C) è congiunto con (B) come condizione su (A) e con ({ sim} B) come condizione su (A). Questi fatti dell'aritmetica non hanno alcun significato empirico da soli. Però,hanno un significato metodologico nella misura in cui sono necessarie ipotesi empiriche sostanziali per identificare partizioni salienti per fare inferenze da relazioni statistiche e di probabilità.

La necessità di sostanziali assunzioni empiriche sorge in contesti in cui vi sono casi di possibilità aritmetiche che sono evidenziate dalle inversioni di Simpson nei modelli di urna e in possibili ed effettivi scenari empirici. Ad esempio, considera un modello di urna per la nostra storia sui tassi di successo dei candidati. Il modello è composto da ventisei palle. Ogni palla è etichettata con uno degli elementi delle serie ({M, { sim} M }, {H, { sim} H }) e ({S, { sim } S }), ad esempio, una determinata palla potrebbe essere etichettata ([{ sim} M, H, { sim} S]) Supponi che le etichette siano distribuite in modo da corrispondere alle distribuzioni dei candidati. Nelle prove di estrazione di palle dall'urna con sostituzione, le associazioni tra (M), (H) e (S) nelle sottopopolazioni e l'associazione inversa tra (M) e (S) nella popolazione generale,sono resistenti. Le associazioni resilienti sono dovute solo alla struttura del modello e non hanno alcun significato causale. Al contrario, sono necessari presupposti sostanziali per trarre inferenze in altri casi.

I modelli di dati che rientrano nelle condizioni al contorno per Reversals of Inequality di Simpson possono sollevare problemi per testare e valutare ipotesi empiriche, ad esempio testare l'efficacia e la sicurezza delle procedure mediche. Un corso di trattamento per una malattia che colpisce il personale di storia e geografia può essere correlato a un tasso di mortalità più basso per i pazienti trattati rispetto ai pazienti non trattati nella storia e un tasso di mortalità più basso per i pazienti trattati rispetto ai pazienti non trattati in geografia; tuttavia, il corso del trattamento può tuttavia essere correlato a un tasso di mortalità più elevato quando i pazienti trattati vengono confrontati con i pazienti non trattati in generale. Viceversa, un trattamento può essere correlato a tassi di mortalità più elevati in ciascuna sottopopolazione, mentre è correlato a un tasso di mortalità inferiore nella popolazione totale. In tali casi è tutt'altro che chiaro cosa,semmai, per concludere dalle correlazioni sull'efficacia e la sicurezza del trattamento.[2]Inoltre, con modelli come quelli ipotizzati per questo esempio, modi diversi di partizionare gli stessi dati possono produrre correlazioni diverse che sembrano incompatibili con le correlazioni nel modo iniziale di partizionare i dati. Ad esempio, in una divisione per disciplina accademica, i pazienti sembrano peggiorare una volta trattati, anche se può esserci una correlazione positiva nella popolazione totale tra trattamenti e recuperi. Ciò è coerente con una correlazione positiva tra trattamenti e recuperi quando la popolazione è suddivisa per genere. Mentre gli storici e i geografi peggiorano ciascuno a causa del trattamento, sia i maschi che le femmine dei due dipartimenti possono migliorare la tariffa a causa del trattamento, e questi fatti sono coerenti con la popolazione combinata che va meglio, o con la popolazione combinata che va peggio.[3]

Le possibilità di cui sopra sono dovute al fatto che le seguenti formule sono collettivamente coerenti. Prendi '(P)' come funzione di probabilità. Possono essere forniti modelli di probabilità che verificano la coerenza dell'insieme costituito dalle seguenti formule:

(begin {align} P (A / mid B) & / gt P (A / mid { sim} B) / P (A / mid B / amp C) & / lt P (A / mid { sim} B / amp C) / P (A / mid B / amp { sim} C) & / lt P (A / mid { sim} B / amp { sim} C) / P (A / mid B / amp D) & / gt P (A / mid { sim} B / amp D) / P (A / mid B / amp { sim} D) & / gt P (A / mid { sim } B / amp { sim} D) / \ end {align})

Disuguaglianze simili sono possibili con i segni invertiti e le uguaglianze che rappresentano l'indipendenza probabilistica sono coerenti con le associazioni positive e / o negative nelle partizioni delle popolazioni. Questi fatti non sono paradossali da un punto di vista aritmetico. Tuttavia, alle regolarità che possono essere rappresentate da esse non è possibile assegnare a tutti un significato causale e le uguaglianze probabilistiche che sono sufficienti per l'indipendenza probabilistica non possono essere tutte prese per rappresentare l'indipendenza causale.

I metodi statistici standard per i test di significatività non offrono alcuna assicurazione contro risultati contrastanti quando i dati sono suddivisi o consolidati. In un contesto in cui l'efficacia di un nuovo trattamento medico è sottoposta a test, i seguenti dati supportano il rifiuto dell'ipotesi nulla, a livello di 0,05, che il trattamento (T) non faccia alcuna differenza per il recupero (R), dove il alternativa all'ipotesi nulla è che il trattamento è favorevole per il recupero. [4]

(R) ({ Sim} R)
(T) 369 340
({ Sim} T) 152 176

Tuttavia, in questo modello, quando la popolazione è ulteriormente suddivisa per genere, la raccomandazione opposta per maschi e femmine è supportata al livello di significato 0,05.

(RM) ({ Sim} RM) (R { sim} M) ({ Sim} R { sim} M)
(T) 48 152 321 188
({ Sim} T) 73 145 79 31

Supponiamo che l'ipotesi nulla sia l'assenza di associazione tra trattamenti e recuperi e l'alternativa all'ipotesi nulla che il trattamento sia meno favorevole per il recupero rispetto a nessun trattamento. Rifiutare l'ipotesi nulla rientra nel livello di significato.05 sia per le tabelle (M) che per le tabelle ({ sim} M). Quindi, quando si considerano i dati consolidati, il trattamento è favorito, ma quando la popolazione è suddivisa per genere, nessun trattamento è favorito sia per i maschi che per le femmine. Un'ulteriore partizione, ad esempio una partizione per gruppi di età, può invertire le associazioni all'interno delle partizioni per genere. Quindi i trattamenti possono essere positivamente correlati ai recuperi nella popolazione totale, negativamente correlati ai recuperi quando la popolazione è suddivisa per genere,e positivamente correlato con i recuperi quando la popolazione è ripartita per età. La generalità delle condizioni al contorno per l'inversione delle disuguaglianze di Simpson garantisce che ci sono sempre modelli in aritmetica che accolgono i dati e supportano raccomandazioni contrastanti. L'aritmetica tace su quali partizioni prendere come base per la valutazione dei conflitti tra ipotesi dati dati e il modo in cui i dati possono essere partizionati.

2. Le inversioni delle disuguaglianze di Simpson come fonti di ragionamento non valido

Il ragionamento intuitivo su percentuali e relazioni di probabilità è notoriamente soggetto a incidenti. L'esempio che si basava sulla causa intentata contro Berkeley illustrava come un pregiudizio nelle pratiche di assunzione in ciascun dipartimento di un'università possa essere invertito quando i dati vengono riuniti. Tuttavia, almeno inizialmente molte persone ritengono impossibile che una percentuale più elevata di maschi abbia avuto successo in un contesto in cui le donne hanno avuto percentuali di successo più elevate in ciascun dipartimento in cui sono stati presi gli appuntamenti. Un modo per vedere il difetto nel ragionamento intuitivo che deriva dalle inversioni di Simpson è quello di notare che la rappresentazione dei dati dalle partizioni di una popolazione come frazioni e gli usi a cui sono destinate le frazioni quando i dati vengono raggruppati per ottenere statistiche sulle popolazioni totali non è garantito per mantenere le relazioni tra le frazioni all'interno delle partizioni. Le frazioni appropriate hanno infinite rappresentazioni equivalenti. Ad esempio, 1 / (2 = 2/4 = 4/8 = / ldots). Ricordiamo ora la forma delle relazioni tra le frazioni in termini di cui sono state illustrate le inversioni di Simpson, ovvero

(begin {align} a / b & / lt A / B, \\ c / d & / lt C / D, / text {and} (a + c) / (b + d) & / gt (A + C) / (B + D). / End {align})

Ora, trattando i termini come frazioni appropriate, possiamo avere (a / b = 2a / 2b) e (A / B = 5A / 5B); (c / d = 3c / 3d) e (C / D = 4C / 4D). Tuttavia, quando queste rappresentazioni equivalenti vengono messe in comune, le relazioni risultanti tra le frazioni differiranno spesso dalle relazioni originali. Ad esempio, ((2a + 3c) / (2b + 3d)) può essere maggiore o minore di ((a + c) / (b + d)). Quindi, non è valido concludere che le relazioni tra percentuali o rapporti quando i dati sono raggruppati saranno conformi alle regolarità che sono mostrate dagli insiemi che comprendono le partizioni dei dati. Le rappresentazioni equivalenti dei rapporti danno contributi diversi quando i dati vengono messi in comune.

Un modo per contrastare aritmeticamente questa difficoltà è "normalizzare" le rappresentazioni dei dati provenienti da sottopopolazioni e riunire solo le rappresentazioni normalizzate dei dati. La normalizzazione dei dati contrasta gli effetti dell'inclinazione fornendo denominatori costanti per le frazioni che rappresentano i dati e rappresentando le sottopopolazioni che vengono confrontate come se fossero di dimensioni uguali nei rispettivi aspetti in termini di confronto. Tuttavia, le inversioni di Simpson mostrano che esistono numerosi modi per suddividere una popolazione in linea con le associazioni della popolazione totale. Una divisione per genere potrebbe indicare che sia i maschi che le femmine sono peggiorati se sottoposti a un nuovo trattamento, mentre una divisione della stessa popolazione per età ha indicato che i pazienti con meno di cinquant'anni,e i pazienti di età pari o superiore a 50 anni sono andati meglio grazie al nuovo trattamento. La normalizzazione dei dati provenienti da diversi modi di partizionare la stessa popolazione fornirà conclusioni incompatibili sulle associazioni che detengono nella popolazione totale.

Un punto correlato emerge ancora più vividamente quando le frazioni vengono interpretate come probabilità. È stato notato sopra che l'inversione di un Simpson può assumere la seguente forma probabilistica: è possibile avere

(begin {align} P (A / mid B) & / gt P (A / mid { sim} B), / text {where} (A / mid B / amp C) & / lt P (A / mid { sim} B / amp C) text {and} / P (A / mid B / amp { sim} C) & / lt P ({ sim} B / amp { sim} C). / End {align})

Un modo per il ragionamento intuitivo di trascurare questa possibilità è trascurare la cosiddetta legge della probabilità totale e la sua rilevanza per questa impostazione. Dal calcolo della probabilità abbiamo le seguenti equivalenze che rappresentano le probabilità come medie ponderate.

(begin {align} P (A / mid B) & = P (A / mid B / amp C) P (B / mid C) + P (A / mid B / amp { sim} C) P (B / mid { sim} C) / P (A / mid { sim} B) & = P (A / mid { sim} B / amp C) P ({ sim} B / mid C) + P (A / mid { sim} B / amp { sim} C) P ({ sim} B / mid { sim} C) end {align})

Pesi obliqui per (P (B / mid C)), (P (B / mid { sim} C)), (P ({ sim} B / mid C)) e (P ({ sim} B / mid { sim} C)) crea la gamma di possibilità che sono contrassegnate dalle condizioni al contorno per le inversioni di Simpson. Per esempio, lascia

(begin {align} P (A / mid B) & =.54 / text {and} / P (A / mid { sim} B) & =.44 / end {align})

Pertanto, (B) è positivamente rilevante per (A). Lascia che i pesi presenti nella rappresentazione di queste probabilità in termini di un fattore (C) siano i seguenti:

(begin {align} P (B / mid C) & =.28, \\ P ({ sim} B / mid C) & =.72, \\ P (B / mid { sim} C) & =.66, / text {and} / P ({ sim} B / mid { sim} C) & =.34 / end {align})

Dati questi coefficienti correttori, (B) sarà positivamente rilevante per (A), ma sarà negativamente rilevante per (A) in ciascuna delle celle fornite dalla partizione ({C, { sim } C }). Vale a dire, [5]

(begin {align} P (A / mid B / amp C) & =.27, \\ P (A / mid B / amp { sim} C) & =.33, \\ P (A / mid { sim} B / amp C) & =.64, / text {e} / P (A / mid { sim} B / amp { sim} C) & =.66 / end {align})

Se i ragionamenti intuitivi generalmente ignorano i ruoli che i pesi ricoprono o non riescono a svolgere nel loro ragionamento sulla probabilità, possono essere colti alla sprovvista quando i Reversals di Simpson si presentano in dati reali o possibili. Una disposizione a ignorare le ponderazioni nel ragionamento intuitivo potrebbe derivare dall'ignoranza, dall'abitudine o come euristica praticabile quando ragionano sulle relazioni di probabilità. Ovviamente è una domanda empirica se tale svista sia la fonte di un ragionamento non valido, o se un'altra ipotesi spieghi meglio perché all'inizio molte persone considerano impossibili le inversioni di Simpson e perché le inversioni continuano a essere sorprendenti anche dopo che la loro fonte è stata spiegata a loro.

3. I dati paradossali forniscono contro-esempi al principio sicuro?

Il cosiddetto principio Sure Thing (di seguito STP) è fondamentale per le teorie della decisione razionale. LJ Savage fornisce la seguente formulazione:

Se preferiresti sicuramente (g) a (f), sapendo che l'evento (C) ottenuto o sapendo che l'evento (C) non è stato ottenuto, allora preferisci sicuramente (g) a (f) (Savage 1954, 21–2).

Nelle teorie della scelta razionale in cui le preferenze sono ordinate secondo la regola di massimizzare l'utilità attesa, STP è una conseguenza del fatto che l'utilità attesa di un'opzione può essere rappresentata come una media ponderata probabilisticamente delle utilità previste di mutuamente esclusive e collettivamente esaustive modi in cui il mondo potrebbe supporre che l'opzione sia scelta. Ad esempio, con "UE" che rappresenta una funzione che assegna le utilità previste e "P" una funzione di probabilità, [EU (A) = EU (A / amp B) P (B) + EU (A / amp { sim} B) P ({ sim} B).)

Quando sai che (B) è valido, diventa un parametro per l'utilità attesa di (A), e allo stesso modo quando sai che ({ sim} B) è valido. Pertanto, se il valore atteso assegnato a (C) è inferiore a (A) sul presupposto, sai che (B) ottiene e similmente sul presupposto che (B) non ottiene, quindi il valore atteso di (C) è incondizionatamente inferiore al valore atteso di (A).

Supponiamo ora che ti vengano offerte scommesse sui candidati che ottengono un lavoro nell'esempio relativo ai due dipartimenti. Le tue opzioni sono di scommettere su un candidato prescelto a caso che è maschio o di scommettere su un candidato prescelto a caso che è femmina. Sia (C) l'evento per fare domanda per un lavoro nella Storia e ({ sim} C) sia l'evento per fare domanda per un lavoro in Geografia. (Ogni persona nel dominio pertinente fa domanda esattamente per una posizione.) Dato che le percentuali di successo per le femmine erano superiori a quelle per i maschi in entrambi i dipartimenti, l'STP raccomanda di sostenere le femmine come scelta dello scommettitore? Si potrebbe (invalidamente) ragionare come segue: dato che le femmine hanno maggiori possibilità di successo nelle loro applicazioni dato (C) e dato ({ sim} C),STP raccomanda una preferenza per le scommesse sulle femmine in una lotteria in cui si scommette sul genere di candidati vincenti. Naturalmente, questo sarebbe un cattivo consiglio nel contesto dell'esempio, poiché il tasso di successo per i maschi era complessivamente più elevato. Dato un numero adeguatamente elevato di scommesse, un allibratore intelligente potrebbe essere sicuro di un bel guadagno se gli scommettitori sostenessero le donne nelle competizioni per lavoro. Il loro tasso di successo era inferiore al tasso di successo dei loro concorrenti maschi, nonostante fosse più alto in ciascun dipartimento. Il loro tasso di successo era inferiore al tasso di successo dei loro concorrenti maschi, nonostante fosse più alto in ciascun dipartimento. Il loro tasso di successo era inferiore al tasso di successo dei loro concorrenti maschi, nonostante fosse più alto in ciascun dipartimento.

Per vedere cosa è andato storto nel tentativo di applicare STP in questa impostazione, è sufficiente notare che dalla miscela che contiene maschi e femmine viene fatto un sorteggio casuale di candidati di successo e che ci sono più maschi nella miscela. (Ricordiamo che le donne si stavano candidando in numero maggiore per lavori che erano più difficili da ottenere.) È insufficiente per l'applicabilità del Principio che le probabilità si allineano con le femmine che hanno maggiori possibilità di successo in ciascun dipartimento. Il Principio si applica alle preferenze, prese come medie ponderate delle utility con probabilità che forniscono i pesi. Le opzioni presentate sono

  • (1) Un candidato di successo disegnato casualmente è femmina.
  • (2) Un candidato prescelto a caso è maschio.

Va detto che un candidato selezionato ha richiesto una posizione in Storia (C) o in Geografia (({ sim}) C) non influisce sulle probabilità di successo nella miscela. Ciò è evidente quando le utilità previste delle opzioni sono esplicitamente rappresentate come medie ponderate. Usando 'M' per maschio, '({ sim}) M' per femmina, 'S' per successo, e 'C' e '({ sim}) C' come sopra, le utilità previste per le opzioni sono le seguenti.

(begin {align *} tag {1} EU ({ sim} M / amp S) & = EU ({ sim} M / amp S / amp C) P (C / mid S / amp { sim} M) & / quad + EU ({ sim} M / amp S / amp { sim} C) P ({ sim} C / mid S / amp { sim} M) / \ tag {2} EU (M / amp S) & = EU (M / amp S / amp C) P (C / mid S / amp M) & / quad + EU (M / amp S / amp { sim} C) P ({ sim} C / mid S / amp M) end {align *})

Date le cifre utilizzate nell'esempio, le relazioni di probabilità tra i coefficienti correttori sono le seguenti:

(begin {align} P (C / mid S / amp { sim} M) & / gt P (C / mid S / amp M) text {and} / P ({ sim} C / mid S / amp { sim} M) & / gt P ({ sim} C / mid S / amp M). / End {align})

Sono queste relazioni che sono la fonte dell'illusione che STP seleziona l'opzione 1. La probabilità che una donna candidata di successo abbia fatto domanda per un posto nella storia è maggiore di quella del suo concorrente maschio tra i candidati nella storia, e allo stesso modo per le donne in Geografia. Se i candidati erano stati ordinati in base alle loro domande ai rispettivi dipartimenti, dove le femmine avevano percentuali di successo più elevate e il disegno veniva fatto da un dipartimento scelto a caso (con ripetute estrazioni e sostituzioni fino a quando non viene estratto un candidato prescelto) piuttosto che dalla combinazione di candidati vincenti, quindi la scelta migliore sarebbe per il genere con le percentuali di successo più elevate nei rispettivi dipartimenti, cioè le donne. Un simile accordo non sarebbe influenzato dal fatto che un numero maggiore di donne ha presentato domanda di lavoro più difficile da ottenere. Ma questo non è l'accordo che è stato stipulato per le scommesse in cui la selezione viene effettuata dai candidati vincitori riuniti. Le possibilità di selezionare un maschio (o una femmina) da quella miscela sono indipendenti dal dipartimento a cui i candidati prescelti avevano fatto domanda. Di conseguenza, gli scommettitori razionali troveranno l'STP inapplicabile nel contesto, perché non avranno le preferenze che la sua applicazione richiede, cioè una preferenza per le femmine, dato che hanno fatto domanda per un lavoro nella storia (C) e una preferenza per femmine, dato che hanno fatto domanda per un lavoro in Geografia (({ sim} C)). Per gli scommettitori razionali,Le possibilità di selezionare un maschio (o una femmina) da quella miscela sono indipendenti dal dipartimento a cui i candidati prescelti avevano fatto domanda. Di conseguenza, gli scommettitori razionali troveranno l'STP inapplicabile nel contesto, perché non avranno le preferenze che la sua applicazione richiede, cioè una preferenza per le femmine, dato che hanno fatto domanda per un lavoro nella storia (C) e una preferenza per femmine, dato che hanno fatto domanda per un lavoro in Geografia (({ sim} C)). Per gli scommettitori razionali,Le possibilità di selezionare un maschio (o una femmina) da quella miscela sono indipendenti dal dipartimento a cui i candidati prescelti avevano fatto domanda. Di conseguenza, gli scommettitori razionali troveranno l'STP inapplicabile nel contesto, perché non avranno le preferenze che la sua applicazione richiede, cioè una preferenza per le femmine, dato che hanno fatto domanda per un lavoro nella storia (C) e una preferenza per femmine, dato che hanno fatto domanda per un lavoro in Geografia (({ sim} C)). Per gli scommettitori razionali,Per gli scommettitori razionali,Per gli scommettitori razionali, (begin {align} EU ({ sim} M / amp S) & = EU ({ sim} M / amp S / amp C) & = EU ({ sim} M / amp S / amp { sim} C), / end {align})

e similmente per (M), mentre, nelle figure fornite nell'esempio, [EU ({ sim} M / amp S) lt EU (M / amp S).)

Sebbene le inversioni di Simpson non supportino le decisioni che sono in conflitto con il principio sicuro, pongono problemi di significato pratico quando devono essere prese decisioni su cosa fare. Le associazioni nella popolazione totale delle persone dovrebbero guidare il processo decisionale in un processo come quello condotto da Fixit? O le associazioni nelle sottopopolazioni di maschi e femmine dovrebbero guidare le decisioni sull'opportunità di assumere il farmaco? Ricordiamo che una diversa partizione della popolazione totale, ad esempio per età, può mostrare associazioni come quelle della popolazione totale e il contrario di quelle nella partizione in base al genere. Non esistono metodi a priori che rispondano a domande sul fatto che le associazioni in dati aggregati o le associazioni in partizioni di dati aggregati,sono buone basi per dedurre dalle cause agli effetti o per prendere decisioni su cosa fare. Le ipotesi contingenti sulla struttura logica e causale di particolari problemi pratici servono come guida del decisore. Alla luce delle informazioni di base appropriate, le relazioni tra, ad esempio, trattamenti e recuperi nella popolazione totale, potrebbero essere la base indicata per prendere decisioni terapeutiche. Date diverse informazioni di base, le relazioni tra trattamenti e recuperi in una partizione saliente della popolazione possono essere identificate, contrariamente alle associazioni nella popolazione totale. In assenza di alcune ipotesi contingenti su strutture logiche e causali in casi particolari, le semplici associazioni non sono utili per decidere cosa fare. Quindi, mentre le inversioni di Simpson non sono paradossali dal punto di vista logico,indicano associazioni in conflitto che diventano veramente paradossali se ricevono tutti un significato causale.

4. Le inversioni delle disuguaglianze, delle correlazioni e delle cause di Simpson

È un luogo comune che le correlazioni tra le variabili non comportano che si trovino in relazioni causali. Mentre alcune correlazioni sono puramente accidentali, altre possono essere lecite anche quando non si ottiene alcuna connessione causale tra le variabili correlate - ad esempio, la correlazione tra barometri che cadono e pioggia è lecita perché sono effetti comuni di una causa comune, ovvero la caduta della pressione dell'aria. Esperimenti controllati cercano di esporre correlazioni che sono semplicemente accidentali. Che dire allora delle solide correlazioni tra variabili che non interagiscono causalmente? Hans Reichenbach ha proposto che una solida correlazione tra le variabili sia falsa [acausal] quando esiste un fattore che "esclude" la correlazione e funge da causa comune delle variabili associate (Reichenbach 1971, Ch. 4). Dì che (A) è associato a B se e solo se non sono probabilisticamente indipendenti, cioè (P (A / mid B) ne P (A)). Reichenbach ha proposto che tale associazione sia falsa a condizione che esista un fattore (C) tale che (P (A / mid B / amp C) = P (A / mid C)).

L'Inversione delle disuguaglianze di Simpson mostra che da un punto di vista aritmetico, c'è sempre un fattore o una proposizione (C) che "elimina" qualsiasi correlazione. L'esistenza di un tale fattore non può essere sufficiente affinché una correlazione sia falsa. Ad esempio, supponiamo che la probabilità di (A) data (B) sia maggiore che senza (B). Il diagramma seguente illustra questa possibilità con probabilità corrispondenti alle dimensioni proporzionali degli spazi chiusi con tutti (A) rappresentati dal rettangolo racchiuso che è intersecato dalla linea che divide (B) da ({ sim} B).

testo mancante, si prega di informare
testo mancante, si prega di informare

Figura 1. (P (A / mid B) gt P (A / mid { sim} B))

Le condizioni al contorno per Reversals di Simpson garantiscono che esiste un (C) che interseca parti uguali di (A / amp B) e (A / amp { sim} B). Nella Sezione 1 è stato notato che le possibilità aritmetiche equivalgono a condizioni di esistenza per fatti aritmetici. A condizione che uno spazio campione possa essere suddiviso in modo sufficientemente fine, la rilevanza probabilistica tra (A) e (B) può essere "slavata" da un fattore arbitrario (C) all'interno del quale le probabilità di (A / amp B) e (A / amp { sim} B) sono uguali. Il seguente diagramma illustra questa possibilità aritmetica:

testo mancante, si prega di informare
testo mancante, si prega di informare

Figura 2. (P (A / mid B / amp C) = P (A / mid { sim} B / amp C))

dove (C) è rappresentato dal parallelogramma che è diviso in due dal confine tra (B) e ({ sim} B) e comprende parti uguali di (A / amp B) e (A / amp { sim} B). (C) è una proposizione o un fattore arbitrario. Poiché gli spazi chiusi corrispondono alle probabilità, (P (A / mid B / amp C) = P (A / mid { sim} B / amp C)). Quindi, (C) 'esclude' (A) da (B); tuttavia, la sua esistenza è chiaramente insufficiente per dimostrare che la correlazione tra (A) e (B) è spuria. Mentre lo "screening off" può fornire una condizione necessaria per dimostrare che una correlazione tra variabili è dovuta a una causa comune, questa condizione necessaria è garantita dall'aritmetica sottostante del calcolo di probabilità. Ulteriori condizioni sostanziali devono essere fornite al di là delle relazioni di probabilità tra (A), (B),e (C) per identificare (C) come causa comune di (A) e (B).

L'inferenza secondo cui le variabili legalmente correlate sono causalmente indipendenti l'una dall'altra se la correlazione è dovuta a una causa comune è un caso speciale di una visione più generale che fa aumentare le possibilità dei loro effetti. [6] Quando esiste una causa comune (C) di una correlazione tra le variabili (B) e (A), (B) non causa (A); l'innalzamento delle possibilità di (A) è dovuto a (C), e mentre (B) potrebbe essere un sintomo di (A), è così in virtù dell'essere un effetto separato di (C) che precede (A). Il diagramma seguente illustra queste relazioni. (Le frecce rappresentano le direzioni delle connessioni causali.)

testo mancante, si prega di informare
testo mancante, si prega di informare

La figura 3. (B) precede (A) e (C) è una causa comune di (B) e (A)

Dato (C), (B) non aumenta le possibilità di (A). L'idea alla base dell'analisi della causalità in termini di aumento del caso è che le cause ne promuovono gli effetti. In contesti deterministici, le probabilità assumono solo valori estremi e le cause non aumentano le possibilità che si verifichino effetti se non nel senso degenerato che aumentano le possibilità dei loro effetti da zero senza di loro a uno con loro (esclusi i casi di sovradeterminazione deterministica). Tuttavia, è una questione contingente se il mondo in cui abitiamo è deterministico o indeterministico, e i concetti di causalità devono accogliere sia la seconda possibilità che la prima. Quindi, le rappresentazioni della causalità deterministica possono essere viste come un caso speciale di causalità probabilistica in cui le cause sono sufficienti e necessarie per i loro effetti.

Alla luce delle inversioni delle disuguaglianze di Simpson, le relazioni di probabilità tra variabili varieranno ampiamente a seconda delle diverse partizioni delle popolazioni o degli spazi degli stati. Questo fatto sulle relazioni di probabilità fornisce una risorsa inestimabile per la rappresentazione in termini probabilistici delle relazioni complesse che si frappongono tra le reti di cause e i loro effetti. Le cause non solo possono promuovere effetti, ma possono promuovere l'assenza o inibire gli effetti che potrebbero verificarsi in loro assenza. Ad esempio, l'esercizio fisico regolare inibisce o riduce le possibilità di disturbi cardiovascolari. Di conseguenza, qualunque cosa promuova un regolare esercizio fisico promuove anche la salute cardiovascolare anche se promuove anche le malattie cardiovascolari. Cartwright dà il seguente esempio. Il fumo provoca malattie cardiache,ma potrebbe anche indurre i fumatori a fare esercizio fisico in numero maggiore rispetto ai non fumatori. In tal caso, il fumo potrebbe causare indirettamente la salute cardiovascolare e causare direttamente la malattia. Con i segni più e meno che indicano se una causa promuove o inibisce un effetto, il diagramma seguente rappresenta un assetto causale in cui il fumo potrebbe promuovere la salute cardiovascolare promuovendo direttamente la malattia.

testo mancante, si prega di informare
testo mancante, si prega di informare

Figura 4

Ad esempio, se il fumo aumenta le probabilità di malattie cardiache del 25%, ma aumenta anche le possibilità di esercizio fisico regolare del 40% mentre l'esercizio diminuisce le probabilità di malattia del 70%, i fumatori potranno in definitiva beneficiare della propria abitudine rispetto alla salute cardiovascolare. In questo assetto, potrebbe esserci un'inversione di Simpson in cui i fumatori che esercitano la loro tariffa sono peggio dei non fumatori che esercitano, e allo stesso modo per i fumatori che non si esercitano rispetto ai non fumatori, mentre i tassi di malattia dei fumatori sono complessivamente più bassi. L'effetto causale netto del fumo sulla salute è positivo nell'esempio a causa del contributo di una terza variabile, l'esercizio fisico, che è un effetto del fumo. Sono i contributi causali di ulteriori variabili che sono le fonti delle inversioni di Simpson in altri assetti causali in cui gli effetti dei collegamenti causali diretti sono modificati dai contributi delle variabili aggiuntive. Questi includono casi in cui gli effetti diretti sono annullati da effetti inibitori di un fattore di accompagnamento, ad esempio sostanze che sono separatamente velenose, acide e alcaline, possono interagire per non avere effetti deleteri se assunti insieme. Ciascuno funge da antidoto per l'altro.[7] Ulteriori entanglement includono casi in cui una causa che promuove un effetto è accompagnata da una causa inibitoria dell'effetto e sono entrambi effetti di una causa comune. Per esempio,

testo mancante, si prega di informare
testo mancante, si prega di informare

Figura 5. La possibilità di (E) non è disturbata da (CC), una causa comune.

Un'interpretazione di questo diagramma: la trombosi può essere un effetto della gravidanza e può anche essere un effetto di alcuni degli ingredienti delle pillole anticoncezionali. Sia la gravidanza che le pillole aumentano le possibilità di trombosi. Tuttavia, le pillole riducono le possibilità di gravidanza e l'effetto netto sulle popolazioni di donne che assumono le pillole non potrebbe mostrare alcun cambiamento nella frequenza della trombosi. Esempi come quelli che sono stati esaminati mostrano che non è né necessario né sufficiente per una relazione causale tra due variabili che uno aumenti le possibilità dell'altro. Cartwright (2001, 271) pone la questione nei seguenti termini: 'Le cause possono aumentare la probabilità dei loro effetti; ma non hanno bisogno. E viceversa: un aumento della probabilità può essere dovuto a una connessione causale; ma anche molte altre cose possono essere responsabili."

L'osservazione di Cartwright è causa di pessimismo riguardo al programma di analisi della causalità e della rilevanza causale in termini probabilistici? Non necessariamente. Pone un problema relativo a entanglement causali che non sono tracciati da relazioni di probabilità e entanglement probabilistici che non sono dovuti a relazioni causali. Il programma di fornire rappresentazioni probabilistiche delle relazioni causali deve fornire condizioni che districhino le reti causali. Ciò che è richiesto è un modo per localizzare le giuste partizioni delle popolazioni, dove quelle giuste sono quelle le cui relazioni di probabilità tengono traccia delle connessioni causali mantenendo fissi i fattori di fondo rilevanti. Numerose proposte diverse sono state avanzate in letteratura sulla causalità probabilistica che mirano a fornire criteri per individuare le giuste partizioni di dati allo scopo di identificare le connessioni causali.

Le proposte rientrano in due grandi categorie: (1) Proposte riduttive: queste non fanno appello a concetti causali e mirano a fornire un filtro sulle correlazioni che identifica quali correlazioni sono false. Le correlazioni che non sono false sono pensate per conformarsi alle intuizioni sulle relazioni causali e per attuare i ruoli che sono intuitivamente assegnati alle relazioni causali. [8](2) Proposte non riduttive: non sono sfacciate sull'uso di concetti causali per distinguere tra correlazioni spurie e causali. Le proposte di questo secondo gruppo sono generalmente scettiche riguardo al programma Humean che motiva le proposte riduttive, e gli allestimenti che sono esempi di Reversals di Simpson sono uno dei loro principali bisturi critici (Cartwright 1979, e in particolare Dupre & Cartwright 1988). Tuttavia, anche loro affrontano il problema di fornire un filtro sulle correlazioni che segnano quali sono spurie, ma non si sentono costretti a evitare il riferimento a relazioni causali nel fornire criteri per la selezione di partizioni che forniscono dati affidabili per inferenze causali. In sintesi, sia i riduzionisti che gli anti-riduzionisti che appoggiano il programma di rappresentazione delle relazioni causali in termini di relazioni di probabilità lo propongono

(C) causa (E) se e solo se la probabilità di (E) è maggiore data (C) rispetto a non data (C), a condizione che (ldots X / ldots).

La condizione è necessaria per filtrare i casi in cui le relazioni di probabilità tra eventi di tipo (C) e eventi di tipo (E) non tengono traccia delle relazioni causali. Le loro opinioni si dividono sul fatto che i concetti causali debbano o possano essere usati senza una circolarità viziosa nel precisare il contenuto della clausola (ldots X / ldots). I riduzionisti cercano modi per precisare la clausola in termini di classi di riferimento omogenee, in cui l'omogeneità è spiegata in termini di correlazioni solide condizionate da un insieme di fattori che vengono mantenuti fissi. Gli anti-riduzionisti si chiedono rapidamente: quali fattori? Prendere in considerazione tutti i possibili fattori non è solo epistemologicamente intrattabile, ma può portare a conclusioni sciocche in quanto tutti i processi causali assolutamente fondamentali possono essere manipolati introducendo alcuni fattori intermedi. Per esempio,la probabilità di morte per infarto è maggiore che senza infarto, ma il contributo dell'attacco cardiaco viene "schermato" nei casi in cui l'attacco cardiaco coincide con l'essere investito da un camion. In questo esempio, le possibilità di morte sono eccessive. I casi di sovradeterminazione causale sono esempi estremi di reti causali in cui la rilevanza probabilistica viene sbiadita o invertita dai contributi causali di una variabile esogena. Nelle scienze sperimentali, i tentativi di isolare le interazioni tra fattori da variabili intervenienti sono procedure standard. Tuttavia, ciò che è realizzabile anche nelle migliori condizioni di laboratorio non sarà all'altezza dell'ideale di dimostrare che non vi sono fattori intermedi da cui dipende una correlazione. Mostrare quest'ultimo richiederebbe di dimostrare che una proposizione esistenziale negativa è vera.

Gli anti-riduzionisti hanno una pronta risposta alla domanda su quali fattori debbano essere fissati durante la valutazione delle dipendenze probabilistiche e dell'indipendenza probabilistica. Vogliono che tutti i fattori potenzialmente rilevanti che siano di interesse siano tenuti fissi allo scopo di identificare le relazioni di probabilità tra C ed E che sono dovute e sono adatte a rappresentare connessioni causali. Secondo questo approccio, le classi di riferimento che sono causalmente omogenee forniscono la base adeguata per la valutazione delle relazioni di probabilità. Si guarda quindi alle teorie scientifiche di fondo e ad altre conoscenze sulle relazioni causali per determinare se le classi di riferimento sono causalmente omogenee. [9]In molti casi, tuttavia, la nostra curiosità sulle relazioni causali supera la nostra attuale conoscenza delle variabili causalmente rilevanti che devono essere mantenute fisse. Quindi, inferenze a relazioni causali da dati statistici che possono sempre essere contrapposte a regolarità invertite in diverse partizioni dei dati possono portare a affermazioni incoerenti riguardo alle relazioni causali.

Detto questo, si verificano inversioni nei dati, i ricercatori affrontano la questione se le associazioni nei dati aggregati siano spurie o se le associazioni nei dati partizionati siano spurie. Diversi modelli causali (rappresentati da diversi grafici aciclici diretti) saranno adatti a rappresentare risposte diverse in casi diversi (vedere la voce sulla causalità probabilistica). Questi modelli possono essere testati da interventi che isolano e controllano i valori assunti dalle variabili che sono apparentemente cause di effetti che interessano il ricercatore. Esperimenti condotti correttamente isoleranno le variabili da manipolare e quindi rileveranno gli effetti delle manipolazioni (vedere la voce sulla causalità e la manipolabilità). Il cosiddetto "criterio back-door" (Pearl 1993) afferma esattamente ciò che è necessario affinché una variabile sia opportunamente isolata per la manipolazione. Quindi, i problemi posti dalle inversioni di Simpson possono essere risolti testando diverse ipotesi causali che sono coerenti con i dati osservati in cui i test per interventi forniscono una base, al di là di semplici osservazioni, per accettare alcuni modelli causali come rappresentazioni corrette di connessioni causali e per aver respinto altri che hanno semplicemente associazioni spurie. Il "paradosso" di Simpson viene così risolto nel senso che è possibile testare diverse ipotesi causali che rivelano quali associazioni sono false. (Per ulteriori informazioni su questo metodo, consultare Pearl 2014.)i problemi posti dalle inversioni di Simpson possono essere risolti testando diverse ipotesi causali che sono coerenti con i dati osservati in cui i test per interventi forniscono una base, al di là di semplici osservazioni, per accettare alcuni modelli causali come rappresentazioni corrette di connessioni causali e per rifiutare altri che hanno semplicemente associazioni spurie. Il "paradosso" di Simpson viene così risolto nel senso che è possibile testare diverse ipotesi causali che rivelano quali associazioni sono false. (Per ulteriori informazioni su questo metodo, consultare Pearl 2014.)i problemi posti dalle inversioni di Simpson possono essere risolti testando diverse ipotesi causali che sono coerenti con i dati osservati in cui i test per interventi forniscono una base, al di là di semplici osservazioni, per accettare alcuni modelli causali come rappresentazioni corrette di connessioni causali e per rifiutare altri che hanno semplicemente associazioni spurie. Il "paradosso" di Simpson viene così risolto nel senso che è possibile testare diverse ipotesi causali che rivelano quali associazioni sono false. (Per ulteriori informazioni su questo metodo, consultare Pearl 2014.)Il "paradosso" di Simpson viene così risolto nel senso che è possibile testare diverse ipotesi causali che rivelano quali associazioni sono false. (Per ulteriori informazioni su questo metodo, consultare Pearl 2014.)Il "paradosso" di Simpson viene così risolto nel senso che è possibile testare diverse ipotesi causali che rivelano quali associazioni sono false. (Per ulteriori informazioni su questo metodo, consultare Pearl 2014.)

5. Inversione delle disuguaglianze di Simpson in contesti evolutivi

Le inversioni delle disuguaglianze di Simpson hanno applicazioni nella teoria economica e nella genetica delle popolazioni, in particolare nei casi di concorrenza tra imprese o organismi. Nell'esempio sopra di assunzioni differenziali di uomini e donne, immagina che dovremmo mappare le donne su, diciamo, "lemming" e gli uomini su, diciamo, "ratti". Immagina che i lemming siano altruisti e altruisti o, in alternativa, immaginali irrazionali, inefficienti o pigri, in un modo o nell'altro, immagina che si comportino in un modo a beneficio dei loro vicini a loro spese. Immagina che i topi siano egoisti, razionali ed efficienti e regolarmente per ottenere benefici a spese dei loro vicini.

Quindi, mappare il Dipartimento di Storia sulla Norvegia durante un inverno molto rigido in Norvegia, e supponiamo che ci siano più topi che lemming in Norvegia. Quindi la vita è dura per tutti in Norvegia ed è ancora più dura per i lemming che per i ratti. Mappare il dipartimento di geografia sulla Svezia, che è nel bel mezzo di un inverno molto mite, e supponiamo che ci siano più lemming che ratti in Svezia. Quindi la vita è più facile per tutti in Svezia, anche se è ancora più facile per i ratti a cavallo libero e opportunistici che per i lemming. Infine, considera le percentuali riproduttive di ratti e lemming nella massa terrestre totale dei due paesi. (O, se questi "ratti" e "lemming" erano affari, considera i loro relativi tassi di fallimento.) I numeri potrebbero quindi mostrare lo stesso modello che abbiamo descritto per i tassi di assunzione di uomini e donne all'Università della California:

Lemmings ratti
Norvegia ((1 / times 10 ^ 9) / (5 / times 10 ^ 9)) (Lt) ((2 / volte 10 ^ 9) / (8 / volte 10 ^ 9))
Svezia ((6 / times 10 ^ 9) / (8 / times 10 ^ 9)) (Lt) ((4 / times 10 ^ 9) / (5 / times 10 ^ 9))
Scandinavia ((7 / times 10 ^ 9) / (13 / times 10 ^ 9)) (Gt) ((6 / times 10 ^ 9) / (13 / times 10 ^ 9))

I Lemmings stanno perdendo terreno in Norvegia e stanno perdendo terreno in Svezia; eppure stanno guadagnando terreno in aree combinate che costituiscono i due paesi.

La ragione per cui i lemming stanno guadagnando terreno nell'area combinata dei due paesi è che più i lemming vivono dove il tasso di sopravvivenza è più alto. Si noti che il tasso di sopravvivenza è più alto lì proprio perché è lì che vivono più lemming. Pertanto, se i ratti si riuniscono insieme, l'efficienza egoistica di ciascun ratto sarà negativa non solo per i poveri lemming del vicinato ma anche per altri ratti. Anche se solo un po 'più di ratti vivono in una regione piuttosto che in un'altra, se i benefici che ottengono a spese dei vicini diventano troppo estremi, questo ridurrà il tasso di sopravvivenza di tutti in quel quartiere, compresi i ratti; questo farà precipitare una inversione di Simpson e il numero di ratti inizierà a scendere a livello globale rispetto ai lemming.

Sia nella teoria evoluzionistica darwiniana che in gran parte della teoria economica, è difficile vedere come l'altruismo (o, per quella materia, l'inefficienza sistematica) possa evolversi, o essere sostenuto a lungo termine. Cioè, è difficile vedere come una popolazione possa sostenere modelli ereditari di comportamento a beneficio dei concorrenti di una singola impresa o di organismi a scapito delle possibilità a lungo termine di sopravvivenza o di successo riproduttivo per quegli individui e altri con le stesse disposizioni. Per questo motivo ha un notevole significato teorico esplorare le applicazioni del Paradosso di Simpson, per vedere se ciò potrebbe aiutare a spiegare non solo l'altruismo ma anche l'irrazionalità, l'inefficienza, la pigrizia e altri vizi che possono prevalere nelle popolazioni,e ciò può far sì che una popolazione non raggiunga l'ideale del razionalista economico o dell'ideale darwiniano di una ricerca spietatamente efficiente da parte di ciascun individuo dei propri profitti o successo riproduttivo a lungo termine. A conti fatti, questa è probabilmente una notizia allegra.

Bibliografia

  • Axelrod, R., 1984, L'evoluzione della cooperazione, New York: libri di base.
  • Bickel, PJ, Hjammel, EA e O'Connell, JW, 1975, "Distorsione del sesso nelle ammissioni per laureati: dati da Berkeley", Science, 187: 398–404.
  • Blyth, CR, 1972, "Sul paradosso di Simpson e sul principio sicuro", Journal of American Statistical Association, 67: 364–366.
  • Cartwright, N., 1979, “Leggi causali e strategie efficaci”, Noûs, 13 (4): 419–437.
  • –––, 2001, “Cosa c'è che non va nelle reti Bayes?”, The Monist, 84 (2): 242–265. Ristampato in Probabilità è la guida molto di vita, SE Kyburg, Jr. e M. Thalos (a cura di), Chicago e La Salle, IL: Open Court, 2003, 253–275.
  • Cohen, MR, and Nagel, E., 1934, An Introduction to Logic and Scientific Method, New York: Harcourt, Brace and Co.
  • Dawid, AP, 1979, "Indipendenza condizionale nella teoria statistica", Journal of Royal Statistical Society (Serie B), 41: 1–15.
  • Dupre, J. e Cartwright, N., 1988, "Probabilità e causalità: perché Hume e indeterminismo non si mescolano", Noûs, 22: 521–536.
  • Eells, E., 1987, “Cartwright and Otte on Simpson's Paradox”, Philosophy of Science, 54: 233–243.
  • Glymour, C. and Meek, C., 1994, “Conditioning and Intervening”, British Journal for the Philosophy of Science, 45: 1001–1021.
  • Hardcastle, VG, 1991, “Partizioni, leggi causali probabilistiche e Paradosso di Simpson”, Synthese, 86: 209–228.
  • Hesslow, G., 1976, “Discussione: due note sull'approccio probabilistico alla causalità”, Philosophy of Science, 43: 290–292.
  • Lindly, DV e Novick, MR, 1981, "Il ruolo della scambiabilità nell'inferenza", Journal of American Statistical Association, 9: 45–58.
  • Malinas, G., 1997, "Il paradosso di Simpson e il ricercatore ribelle", Australasian Journal of Philosophy, 75: 343–359.
  • –––, 2001, “Il paradosso di Simpson: un'idra logicamente benigna, empiricamente insidiosa”, The Monist, 84 (2): 265–284. Ristampato in Probability Is the Very Guide of Life, Henry E. Kyburg, Jr. e Mariam Thalos (a cura di), Chicago e La Salle, IL: Open Court, 2003, 165–182.
  • Mittal, Y., 1991, "Omogeneità delle sottopopolazioni e paradosso di Simpson", Journal of American Statistical Association, 86: 167–172.
  • Otte, R., 1985, “La causalità probabilistica e il paradosso di Simpson”, Philosophy of Science, 52: 110–125.
  • Pearl, J., 1988, Probabilistic Reasoning in Intelligent Systems, San Mateo, CA: Morgan Kaufman.
  • –––, 1993, “Commento: Modelli grafici, causalità e intervento”, Scienze statistiche, 8: 266–269.
  • –––, 2000, Causalità: modelli, ragionamento e inferenza, New York, Cambridge: Cambridge University Press. [Seconda edizione, 2009.]
  • –––, 2014, “Commento: comprensione del paradosso di Simpson”, The American Statistician, 68: 8–13.
  • Reichenbach, H., 1971, The Direction of Time, Berkeley: University of California Press.
  • Savage, LJ, 1954, The Foundations of Statistics, New York: John Wiley and Sons.
  • Simpson, EH, 1951, "L'interpretazione dell'interazione nelle tabelle di contingenza", Journal of the Royal Statistical Society (Serie B), 13: 238–241.
  • Skyrms, B., 1980, Causal Necessity, New Haven; Yale University Press.
  • Sober, E., 1993, The Nature of Selection, Chicago: University of Chicago Press.
  • –––, 1993, Philosophy of Biology, Oxford: Oxford University Press.
  • Sober, E. e DS Wilson, 1998, Unto Others: The Evolution and Psychology of Unselfish Behaviour, Cambridge, MA: Harvard University Press.
  • Spohn, W., 2001, "Le reti bayesiane sono tutto ciò che c'è da causare alla causalità", in Dipendenza stocastica e causalità, D. Constantini, MC Galavotti e P. Suppes (a cura di), Stanford: CSLI Publications.
  • Sunder, S., 1983, "Paradosso dell'inversione di Simpson e allocazione dei costi", Journal of Accounting Research, 21: 222–233.
  • Suppes, P., 1970, A Probabilistic Theory of Causality, Amsterdam; North-Holland Publishing Co..
  • Thalos, M., 2003, “The Reduction of Causation”, in H. Kyburg e M. Thalos (a cura di), Probabilità è la guida stessa della vita: gli usi filosofici del caso, Chicago: Open Court.
  • Thornton, RJ e Innes, JT, 1985, "Sul paradosso di Simpson nelle statistiche economiche", Oxford Bulletin of Economics and Statistics, 47: 387–394.
  • Van Frassen, BC, 1989, Laws and Symmetry, Oxford: Clarendon.
  • Yule, GH, 1903, “Note sulla teoria dell'associazione degli attributi in Statistica”, Biometrika, 2: 121–134.

Strumenti accademici

icona dell'uomo sep
icona dell'uomo sep
Come citare questa voce.
icona dell'uomo sep
icona dell'uomo sep
Visualizza l'anteprima della versione PDF di questa voce presso Friends of the SEP Society.
icona di inpho
icona di inpho
Cerca questo argomento nell'Internet Philosophy Ontology Project (InPhO).
icona di documenti phil
icona di documenti phil
Bibliografia avanzata per questa voce su PhilPapers, con collegamenti al suo database.

Altre risorse Internet

  • Simpson's Paradox, dal sito web Exploring Data di Education Queensland (Australia) (archiviato su Internet Archive)
  • Simpson's Paradox, di Alan Crowe (archiviato su Internet Archive)
  • Il paradosso di Simpson: quando i set di big data vanno male, in sorprendenti applicazioni di probabilità e statistiche su www.intuitor.com.
  • Articolo online di Nick Chater, Ivo Vlaev e Maurice Grinberg, "Una nuova conseguenza del paradosso di Simpson: cooperazione stabile nel dilemma del prigioniero a colpo singolo da parte di popolazioni di agenti dell'apprendimento individualistico", University College London / New Bulgarian University.

Raccomandato: