A korreláció és az ok-okozati összefüggés zavarának felszámolása 

Itt van egy történelmi apróság, amiről nem biztos, hogy tudomása van. 1860 és 1940 között az Új-Angliában élő metodista miniszterek számának növekedésével a Bostonba importált kubai rum mennyisége is nőtt - és mindkettő rendkívül hasonló módon nőtt. Így a metodista miniszterek biztosan rengeteg rumot vásároltak fel ebben az időszakban!

Valójában nem, ez egy ostoba következtetés. Valójában az történik, hogy mindkét mennyiséget - a metodista minisztereket és a kubai rumot - más tényezők, például a népesség növekedése hajtották felfelé.

E téves következtetéshez túl sokszor elkövetett hibát követtünk el összekeveri az összefüggést az oksággal.

Mi a különbség?

Két mennyiséget állítólag korrelációs  ha mind együtt növekszik, mind csökken („pozitívan korrelál”), vagy ha az egyik növekszik, amikor a másik csökken, és fordítva („negatívan korrelál”).

A korreláció könnyen kimutatható a Pearson korrelációs együtthatója, amely jelzi, hogy a két mennyiség mennyire szorosan van összekapcsolva, -1-től (tökéletesen negatívan korrelálva) 0-ig (egyáltalán nem korrelálva) és 1-ig (tökéletesen pozitívan korrelálva).


belső feliratkozási grafika


 okozati összefüggés1tylervigen.com

De csak azért, mert két mennyiség korrelál, nem feltétlenül jelenti azt, hogy az egyik közvetlenül okozó a másik változtatni. A korreláció nem jelenti az okozati összefüggést, ugyanúgy, mint a felhős idő, nem jelent csapadékot, pedig fordítva is igaz.

Ha két mennyiség korrelál, akkor valódi ok-okozati összefüggés lehet (például csapadékszint és ernyőértékesítés), de talán más változók vezérlik mindkettőt (például kalózszám és a globális felmelegedés), vagy talán ez csak egybeesés (például Amerikai sajtfogyasztás és fojtogatás lepedőnként).

Még ott is, ahol okság áll fenn, vigyáznunk kell arra, hogy ne keverjük össze az okot a következménnyel, különben arra következtethetünk, hogy például a fűtőkészülékek fokozott használata hidegebb időjárást okoz.

Az ok-okozat megállapításához túl kell lépnünk a statisztikán, és külön (tudományos vagy történelmi jellegű) bizonyítékokat és logikai érvelést kell keresnünk. Az összefüggés arra ösztönözhet minket, hogy elsősorban ilyen bizonyítékokat keressünk, de korántsem önálló bizonyíték.

Finom kérdések

Noha a fenti példák nyilvánvalóan buták voltak, az összefüggést gyakran tévesztik ok-okozati összefüggéssel olyan módon, amely a való világban nem azonnal nyilvánvaló. A statisztikák olvasása és értelmezése során nagy gondot kell fordítani arra, hogy megértsük, pontosan mit is jelentenek az adatok és statisztikáik - és ami még fontosabb, hogy mik azok nem utalva.

 okozati összefüggés2

Az adatok értelmezésében az óvatosság szükségességének egyik legfrissebb példája a látszólagos úttörés körüli, ez év eleji izgalom gravitációs hullámok detektálása - úgy tűnik, hogy bejelentést tettek idő előtt, mielőtt az összes adatot befolyásoló változót elszámolták volna.

Sajnos a statisztikák, a valószínűségek és a kockázatok elemzése nem olyan képességkészlet, amely belénk van kötve emberi megérzés, és így túl könnyű félrevezetni. Teljes könyvek a statisztikák téves értelmezésének (vagy félrevezetésének) finom módjairól írtak. Az őrzés fenntartása érdekében itt van néhány gyakori csúszós statisztikai probléma, amelyekkel tisztában kell lennie:

1) Az egészséges dolgozó hatása, ahol néha két csoportot nem lehet közvetlenül összehasonlítani egyenlő versenyfeltételek mellett.

Vegyünk egy hipotetikus vizsgálatot, amely összehasonlítja az irodai dolgozók egy csoportjának egészségét egy űrhajós csoport egészségével. Ha a tanulmány nem mutat szignifikáns különbséget a kettő között - nincs összefüggés az egészségesség és a munkakörnyezet között - arra a következtetésre jutunk, hogy az űrben élés és munkavégzés nem jelent hosszú távú egészségügyi kockázatot az űrhajósok számára?

Nem! A csoportok nincsenek azonos alapon: az űrhajós testület megvizsgálja a jelentkezőket, hogy egészséges jelölteket találjanak, akik aztán átfogó fitnesz-rendszert tartanak fenn annak érdekében, hogy proaktívan küzdhessenek a „mikrogravitációban” való élet hatásai ellen.

Ezért azt várnánk tőlük, hogy lényegesen egészségesebbek legyenek, mint az irodai dolgozók, és joggal kellene aggódniuk, ha nem lennének.

2) Besorolás és a szakaszos migráció hatása - az emberek csoportok közötti keverése drámai hatással lehet a statisztikai eredményekre.

Ez más néven Will Rogers hatása után az amerikai humorista, aki állítólag kinyilvánította:

Amikor az okiek elhagyták Oklahomát és Kaliforniába költöztek, mindkét államban megemelték az átlagos intelligenciaszintet.

Szemléltetésképpen képzeljük el, hogy egy nagy baráti társaságot egy „rövid” és egy „magas” csoportra osztunk (talán azért, hogy fotóra rendezzük őket). Ezt meglepően könnyű megnövelni mindkét csoport átlagos magasságát egyszerre.

Egyszerűen kérje meg a „magas” csoport legrövidebb személyét, hogy váltson át a „rövid” csoportra. A „magas” csoport elveszíti legrövidebb tagját, így megdönti átlagos magasságát - de a „rövid” csoport megszerzi a legmagasabb tagját, és ezáltal az átlagos magasságát is.

Ennek jelentős következményei vannak az orvosi vizsgálatokban, ahol a betegeket gyakran „egészséges” vagy „egészségtelen” csoportokba sorolják egy új kezelés tesztelése során. Ha a diagnosztikai módszerek javulnak, néhány nagyon enyhén egészségtelen beteget át lehet csoportosítani - ami mindkét csoport egészségi állapotának javulásához vezet, függetlenül a kezelés hatékonyságától (vagy sem).

 okozati összefüggés3Az adatok kiválasztása és kiválasztása téves következtetésekhez vezethet. A szkeptikusok a lehűlés időszakát látják (kék), amikor az adatok valóban hosszú távú felmelegedést mutatnak (zöld). skepticalscience.com 

3) Adatbányászat - ha rengeteg adat van jelen, akkor a kívánt következtetések alátámasztására biteket és darabokat lehet cseresznyével szedni.

Ez rossz statisztikai gyakorlat, de ha szándékosan történik az eredeti, teljes adatkészlet ismerete nélkül nehéz felismerni.

Tekintsük a fenti grafikont, amely például a globális felmelegedés adatainak két értelmezését mutatja be. Vagy fluorid - kis mennyiségben ez az egyik leghatékonyabb megelőző gyógyszer a történelemben, de a pozitív hatás teljesen megszűnik, ha csak mérgező mennyiségű fluoridot veszünk figyelembe.

Hasonló okokból fontos, hogy egy adott statisztikai kísérlet eljárásait a kísérlet megkezdése előtt rögzítsék, majd a kísérlet végéig változatlanok maradjanak.

4) Csoportosítás - amire teljesen véletlenszerű adatok esetén is számítani kell.

Vegyünk egy orvosi tanulmányt, amely megvizsgálja, hogy egy adott betegség, például rák vagy sclerosis multiplex milyen földrajzilag elosztva. Ha a betegség véletlenszerűen támad (és a környezetnek nincs hatása), akkor számíthatunk arra, hogy magától értetődően számos betegcsoportot fogunk látni. Ha a betegek tökéletesen egyenletesen oszlanak el, akkor az eloszlás valóban nem véletlenszerű lenne!

Tehát egyetlen klaszter, vagy számos kis klaszter jelenléte teljesen normális. Kifinomult statisztikai módszerekre van szükség annak megállapításához, hogy mekkora klaszterezés szükséges annak megállapításához, hogy ezen a területen valami okozhatja a betegséget.

Sajnos minden klaszter - még egy nem is jelentős - könnyű (és első pillantásra lenyűgöző) hírcímet jelent.

 okozati összefüggés4

A statisztikai elemzéseket, mint bármely más hatékony eszközt, nagyon körültekintően kell használni - és különösen mindig óvatosnak kell lennünk, amikor két mennyiség összefüggésén alapuló következtetéseket vonunk le.

Ehelyett mindig ragaszkodnunk kell külön bizonyítékhoz az ok-okozat mellett való érveléshez - és ez a bizonyíték nem egyetlen statisztikai szám formájában jelenik meg.

Látszólag meggyőző összefüggések, mondjuk az adott gének és a között skizofrénia vagy a között magas zsírtartalmú étrend és szívbetegség, kiderülhet, hogy nagyon kétes módszertanon alapul.

Talán kognitívan rosszul felkészült fajként vagyunk felkészülve e kérdések kezelésére. Kanadai oktatóként Kieran Egan betette a könyvébe Tévedés a kezdetektől:

A rossz hír az, hogy evolúciónk felkészített minket arra, hogy kicsi, stabil, vadászó-gyűjtögető társadalmakban éljünk. Pleisztocén emberek vagyunk, de bágyadt agyunk masszív, multikulturális, technológiailag kifinomult és gyorsan változó társadalmat hozott létre számunkra, ahol élhetünk.

Következésképpen állandóan ellen kell állnunk a kísértésnek, hogy a véletlenszerű értelmet lássuk, és összekeverjük az összefüggést és az okozati összefüggést.A beszélgetés

Ezt a cikket eredetileg közzétették A beszélgetés
Olvassa el a eredeti cikk.


A szerzőkről

borwein jonathanJonathan Borwein (Jon) a Newcastle-i Egyetem matematika-díjas professzora. Ő a Newcastle-i Egyetem matematika professzora és a Számítógéppel Támogatott Matematikai és Alkalmazási Központ (CARMA) igazgatója. Dolgozott a Carnegie-Melon, a Dalhousie, a Simon Fraser és a Waterloo Egyetemeken, és két kanadai kutatói széket tartott számítástechnikában.

rózsa michaelMichael Rose PhD-jelölt, a Newcastle-i Egyetem Matematikai és Fizikai Tudományok Iskolája. Matematika PhD hallgató, Jon Borwein díjas, ausztrál New York-i Egyetem díjazottja. Jelenleg a fraktál matematika alkalmazásának kutatásában segíti az agyi szinapszis eloszlások modellezését.

Nyilatkozat: A szerzők nem dolgoznak, konzultálnak, nem birtokolnak részvényeket vagy kapnak finanszírozást olyan vállalatoktól vagy szervezetektől, amelyek profitálnának a cikkből. Szintén nincsenek releváns kapcsolataik.


Ajánlott könyv:

Pénz, szex, háború, karma: Megjegyzések egy buddhista forradalomhoz
írta David R. Loy.

Pénz, szex, háború, karma: Megjegyzések egy buddhista forradalomhoz, David R. Loy.David Loy a buddhista világnézet egyik leghatalmasabb szószólójává vált, aki senki másként megmagyarázza azt a képességét, hogy átalakítsa a modern világ szociopolitikai táját. Ban ben Pénz, szex, háború, karma, élesen, sőt megdöbbentően világos bemutatásokat kínál a gyakran félreértett buddhista alapanyagokról - a karma működéséről, az én természetéről, a bajok okairól mind az egyéni, mind a társadalmi szinten -, valamint a "soha nem elég "akár idő, pénz, szex, biztonság ... akár háború. Dávid "buddhista forradalma" nem kevesebb, mint radikális változás életünk, bolygónk megközelítésének módjában, a nyelvünket, kultúránkat, sőt lelkiségünket átható kollektív téveszmékben.

Kattintson ide további információkért és / vagy a könyv megrendeléséhez az Amazonon.