Hvordan ville verden se ud efter en zombie-apokalypse? Hvad ville der ske, hvis mennesket havde udviklet selvtænkende robotter? Eller hvordan ville livet være, hvis staten overvågede alt, vi gør, hvor end vi er?
Det er bare nogle få eksempler på science-fiction-genrens hovedspørgsmål: Hvad nu hvis?
Faktisk er det spørgsmål også et, vi benytter, når vi laver videnskab. Hvad sker der, når æblet falder ned fra træet? Eller hvad kan vi forvente, der sker i kroppen, når vi indtager denne type medicin?
Her er statistikkens videnskab ikke nogen undtagelse. Spørgsmålene ser bare lidt anderledes ud ved første øjekast.
Men hvordan fungerer den statistiske videnskab overhovedet?
Det er jo ikke sådan, at statistikeren sidder i et laboratorium og udfører forsøg. Statistikeren render heller ikke rundt i felten og indsamler observationer, der kan ligge til grund for en videnskabelig teori.
Jo, måske sidder statistikeren af og til i solen og stirrer op i trækronerne, men egentlig handler den statistiske metode i bund og grund om at besvare et spørgsmål på baggrund af et foreliggende datamateriale.
Deri ligger ikke mindst at sætte tal og ord på den usikkerhed, der skal tilknyttes svaret på spørgsmålet.
For på grund af tilfældighed i lige netop det datamateriale, vi har fået adgang til, er der en tilfældighed til stede, som statistikeren må tage højde for.
Det er en abstrakt tilfældighed, som vi må tænke os til. Vi får nemlig ikke lov til at se flere datasæt fra præcis samme grundpopulation.
Den usikkerhed kan have stor betydning for, hvad konklusionen bliver på et forskningsspørgsmål.
Sci-fi-tankegangen kommer især i spil, når vi statistikere skal forsøge at besvare vores forskningsspørgsmål.
Det gør vi ved at afgøre, om vi skal forkaste eller acceptere det, vi kalder en nulhypotese.
En nulhypotese er det statistiske greb, vi bruger til at besvare det spørgsmål, vi egentlig er interesserede i.
En læge kan for eksempel lave et studie, der skal undersøge, om en ny behandling har gavnlig effekt på blodtrykket.
På baggrund af sin lægelige faglighed fremsætter han eller hun hypotesen, at behandlingen har en gavnlig virkning for de patienter, der bliver undersøgt.
I statistikken vender vi den hypotese om og fremsætter i stedet nulhypotesen - i dette tilfælde ville nulhypotesen lyde: Behandlingen har ingen effekt.
Eller - med andre ord - personer, som tager den nye behandling, og personer, som ikke gør, har forventeligt samme blodtryk.
Afviser vi den nulhypotese, ja, så er der statistisk signifikant evidens for, at der er en effekt af behandlingen.
Og hvad har det så med science-fiction at gøre? Jo, når vi fremsætter en nulhypotese, så siger vi egentlig: Hvad nu hvis nulhypotesen faktisk er sand? Hvordan kan vi så forvente, at verden vil se ud?
Det er her statistikerens science-fiction-historie begynder at udfolde sig.
I vores eksempel fra før vil det betyde, at personer, som får behandlingen, og personer, som ikke får behandlingen, har samme forventede blodtryk.
Og dét er noget, vi kan forsøge at undersøge i data. Helt konkret kigger vi på de to grupper - dem, der får medicin, og dem, der ikke gør - og måler på en eller anden måde, om de ser ens ud på deres blodtryksmålinger. Den måling, vi laver, kaldes en teststørrelse.
Teststørrelsen er et tal, som i grove træk angiver, hvor forskelligt de to grupper opfører sig. Det kunne i dette tilfælde være forskellen på det gennemsnitlige blodtryk i de to grupper.
Men hvordan ved man, hvad der svarer til 'meget forskelligt', og hvad der svarer til 'ikke særlig forskelligt'?
For som vi allerede har været inde på, så er der tilfældighed i vores data, som gør, at de to grupper aldrig vil se helt ens ud, når der ligger et datasæt på bordet foran os.
Her kan vi lave, hvad der hedder en ombytningstest. I en ombytningstest leger vi netop, at nulhypotesen er sand, altså at de to behandlingsgrupper faktisk har præcist samme forventede blodtryk. Med de regler, der er i den leg, er personerne i de to behandlingsgrup...
続きを読む
一部表示