Statistika / tikimybės yra toks anti-intuityvus dalykas, kad skaityti apie ją – tai kaip žiūrėti „Mythbusters“, tik su daugiau matematikos.
Tiesa, matematikos šioje knygoje nedaug, bet daug „realaus pasaulio“ pavyzdžių, kaip suprasti ir interpretuoti statistinius duomenis, „ką ištyrė britų mokslininkai“.
Negaliu sakyti, kad taip jau giliai ir esmingai viską supratau, bet pasidalinsiu keliais labiau įstrigusiais dalykais, o jei suklydau (arba jei turite smagių pavyzdžių), pasakykite!
Bootstrapping
Kai turim (kaip manom) reprezentatyvius duomenis – tarkim, kiek žmonės turėjo seksualinių partnerių– iš tam tikro skaičiaus respondentų (pvz 50). Penki turėjo 1, trys turėjo 2, vienas turėjo 30 ir t.t. Tada surašom tuos duomenis tuo pačiu dažniu ant „kamuoliukų“ (na, ne kamuoliukų, jie ten turi programas tam), taigi bus penki kamuoliukai su skaičium 1, trys su skaičium 2 ir t.t. TADA iš to mišinio traukiam kamuoliuką, užrašom ant jo esantį skaičių, ir padedam kamuoliuką atgal. Tada vėl traukiam iš to paties maišo, ir taip 50 kartų. Na, ir kartojam šitą procedūrą daug kartų (pvz 1000), kiekvienąkart gaudami naują penkiasdešimties rinkinį. Paskui galim tuos duomenis susumuoti ir žiūrėti, kokią kreivę jie sudaro, t.y. aplink kurią vertę koncentruojasi.
Conditional probability
Ką reiškia 90% patikimumo testas? Tai reiškia, kad jis teisingai identifikuos 90% atvejų. Tai NEREIŠKIA, kad jei gavai teigiamą (pvz ligos) testą, 90% tikimybė, kad sergi.
Autorius duoda pavyzdį su krūties vėžiu, kurį mamograma identifikuoja 90% tikslumu. Jei juo serga 10 iš 1000 moterų, tai 9 iš jų bus identifikuotos teisingai, o viena gaus false negative. BET juo NESERGA 990 moterų, iš kurių 891 bus teisingai identifikuotos, kad serga, o 99 (10%) – NEteisingai identifikuotos, kad serga. Taigi 108 gaus teigiamą testą, bet iš jų serga tik 9, t.y. 8%.
Šitas man visiškai išmušė saugiklius.
Nulinė hipotezė
Kartą skaičiau „Nature“ žurnale kritiką kai kuriems socialinių mokslų tyrimams, kad jie netestuoja nulinės hipotezės, o iškart bando surasti ryšį tarp dviejų parametrų. „Tai socialiniam pasauly visada bus kažkoks ryšys tarp dviejų parametrų,“ – sakė autorė, – „Reikia pirma primesti, kad ryšys atsitiktinis, o tik po to skelbti rezultatus“.
Kaip aš supratau, pratestuoti nulinę hipotezę reiškia maždaug paskaičiuoti, kokiom kombinacijom gali išsidėlioti duomenys, ir tada TAME KONTEKSTE pažiūrėti, ant kiek stebinantys yra mūsų atrasti duomenys. Pvz 12 vyrų ir 8 moterų grupėje suskaičiuojam kairiarankius – ir atrandam, kad moterys kairiarankės trys, o vyrai kairiarankiai du. Čia, nepratestavę nulinės hipotezės, galėtume manyti, kad procentaliai daugiau kairiarankių tarp moterų. BET! Prieš darydami šią išvadą galime paimti lapukus (nu, ne lapukus, kaip jau minėjau, jie turi programas), ant penkių užrašyti „kairė“, ant penkiolikos – „dešinė“, išdalinti dalyviams kažkokia kombinacija, ir užrašyti rezultatus, kiek vyrų ir moterų gavo kokį lapuką. Po to, kai būsim išdalinę lapukus visom įmanomom kombinacijom ir užrašę rezultatus, gausime kažkokią kreivę, kiek „kairės“ lapukų dalinant atsitiktinai atitektų vyrams, ir kiek – moterims.* Tai DABAR galim pamatuoti savo pirminį rezultatą, kiek jis stebinantis tame kontekste.
* Pvz metant du kauliukus yra daugiau būdų jų sumoje gauti 7 (1+6, 2+5, 3+4), negu gauti 12 (tik 6+6) – tai tokiu atveju 7 atsidurtų kreivės viduryje, o 12 – šone. Ar kažkaip taip.
P-values
Šitas parametras būtent tai ir matuoja – primetant, kad nulinė hipotezė teisinga, KIEK STEBINANTYS yra mūsų gauti duomenys? P-value 0.05 reiškia, kad yra 5% tikimybės, jog duomenys taip sukrito atsitiktinai. 5% nėra daug, bet nėra ir mažai, kai taip jau pagalvoji, ypač jei nori skintis mokslinius laurus (jei tokie egzistuoja).
Ko P-values NEMATUOJA, sako autorius, tai nulinės hipotezės teisingumo. Čia galime grįžti prie Conditional probability – 90% testo tikslumas nereiškia, kad rezultatas yra 90% tiesa. Šita dalis man pasirodė labai tricky, bet kažkokia fundamentali.
Relative increase
Tai reiškia maždaug, kad prieš skelbiant rezultatą, reikia pažiūrėti į duomenis – ar jie tikrai reikšmingi? Autorius cituoja tyrimą, kuris skelbė, kad vyrai su aukštuoju išsilavinimu turi 19% didesnę tikimybę gauti smegenų auglį, negu vyrai be aukštojo. YIKES! Bet ar tikrai? Žiūrim į tyrimą (atliką per 18 metų su 2 milijonais dalyvių): per 3000 vyrų be aukštojo gausim 5 smegenų auglius, o per 3000 su aukštuoju – 6. Techniškai teisinga – 19% didesnė rizika, bet 5/3000 ir 6/3000 neatrodo taip jau baisiai ar netgi itin reikšmingai.
Dar autorius labai entuziastingai kalbėjo apie Bayesian statistics, bet aš tikrai nepapasakosiu, kaip tai veikia – užtat patiko pavyzdys su biliardo kamuoliais.
Tai va, faina knyga, finale galiu pasakyti, kad statistikos miškas man vis dar toks pat tamsus, bet perskaičiusi jaučiuosi kažkaip iš esmės gudresnė.