Basale statistiske begreber

P-værdien er sandsynligheden for at observere et resultat mindst lige så ekstremt som det fundne, givet at nulhypotesen er sand. Den bruges derfor som et mål for, hvor godt de observerede data stemmer overens med antagelsen om ingen effekt eller ingen forskel. En lav p-værdi indikerer, at de observerede data ville være relativt usandsynlige under nulhypotesen, hvilket kan give grundlag for at forkaste nulhypotesen til fordel for en alternativ hypotese. En høj p-værdi betyder omvendt, at dataene er forenelige med nulhypotesen, og at der ikke er tilstrækkelig evidens til at afvise den (Wasserstein and Lazar, 2016).

Det er centralt at understrege, at p-værdien ikke er sandsynligheden for, at nulhypotesen er sand, og den siger heller ikke noget direkte om effektens størrelse, kliniske relevans eller praktiske betydning. P-værdien bør derfor fortolkes sammen med effektmål, konfidensintervaller og studiets design. Dette er i overensstemmelse med anbefalingerne fra American Statistical Association, som advarer mod at bruge p-værdier som eneste beslutningsgrundlag (Wasserstein and Lazar, 2016).

Eksempel:

Et studie undersøger effekten af manuel behandling sammenlignet med træning til patienter med kroniske rygsmerter. Resultatet viste at der var en forskel, hvor træning førte til en øget smertereduktion sammenlignet med manuel behandling. Studiet viste en forskel på 5mm på en VAS 0-100. Dog havde resultatet ikke en signifikant p-værdi (p > 0.05). Hvad fortæller p-værdien om resultatet og den måde vi tolker det?

P‑værdien angiver, hvor sandsynligt det er, at den observerede forskel er opstået ved tilfældighed, givet at nul-hypotesen er sand. Da p‑værdien er større end 0,05, er forskellen på 5 mm på VAS‑skalaen ikke statistisk signifikant. Det betyder, at man ikke med sikkerhed kan konkludere, at træning er mere effektiv end manuel behandling ud fra dette studie.

Referencer:

Wasserstein RL, Lazar NA. The ASA Statement on p-Values: Context, Process, and Purpose. The American Statistician. 2016;70(2):129–133

Et konfidensinterval (CI) er et interval omkring et estimat (fx en middelværdi, en forskel eller en odds ratio), som viser usikkerheden i estimatet. I praksis bruges CI til at vurdere både retning og størrelse af en effekt og hvor præcist vi har målt den: et smalt CI tyder på et mere præcist estimat, mens et bredt CI betyder større usikkerhed. CI er ofte mere informativt end p-værdien alene, fordi det hjælper med at diskutere, om en mulig effekt også kan være praktisk/klinisk vigtig (Kirkwood and Sterne, 2003).

Eksempel:

Et studie undersøger effekten af manuel behandling sammenlignet med træning hos patienter med kroniske rygsmerter. Resultatet viste, at træning reducerede smerte med gennemsnitligt 10 mm mere på en VAS smertescore (0‑100 mm) end manuel behandling. Resultaterne viste et 95 % konfidensinterval på mellem ‑5 mm til 15 mm.

Hvad fortæller konfidensintervallet om resultatet og den måde, vi tolker det?

Konfidensintervallet viser, at den sande forskel kan være alt fra en lille forværring til en moderat forbedring. Da intervallet indeholder 0, kan man ikke udelukke, at der reelt ingen forskel er mellem behandlingerne. Samtidig er intervallet relativt bredt, hvilket tyder på usikkerhed i estimatet.

OBS: hvis konfidensintervallet krydser 0 (og den både viser forværring og forbedring), vil p-værdien heller ikke være statistisk signifikant.

Referencer:

Kirkwood, B.R., Sterne, J.A.C., 2003. Essential Medical Statistics, Second Edition. Blackwell Science Ltd.

Standardafvigelse (SD) beskriver spredningen i data, altså hvor meget målingerne typisk ligger fra gennemsnittet. SD handler altså om variationen mellem personer/målinger i en stikprøve (fx variation i blodtryk), ikke om usikkerheden på selve gennemsnittet (det er typisk standard error og CI, der siger noget om præcisionen af et estimat). Når data nogenlunde følger en normalfordeling, kan SD også give en fornemmelse af, hvor stor en del af observationerne der ligger tæt på gennemsnittet (Kirkwood and Sterne, 2003).

Eksempel:

Et studie undersøger smerteintensitet hos patienter med kroniske rygsmerter målt på en VAS 0‑100. Gennemsnittet for smerte var 60 mm med en standardafvigelse på 15 mm.

Hvad fortæller standardafvigelsen om resultatet og den måde, vi tolker det?

Standardafvigelsen viser, at der er stor variation i smerteoplevelsen blandt patienterne. De fleste værdier ligger typisk omkring 15 mm over eller under gennemsnittet, hvilket betyder, at mange patienter har smerter, der enten er væsentligt lavere eller højere end gennemsnittet. SD siger noget om spredningen i data, men ikke om, hvor præcist gennemsnittet er estimeret.

Referencer:

Kirkwood, B.R., Sterne, J.A.C., 2003. Essential Medical Statistics, Second Edition. Blackwell Science Ltd.

Absolut risiko beskriver den faktiske sandsynlighed for, at en hændelse indtræffer i en gruppe, for eksempel hvor mange ud af 100 eller 1.000 personer der oplever et bestemt udfald (Celentano and Szklo, 2019).

Relativ risiko beskriver, hvor meget denne risiko ændrer sig i én gruppe sammenlignet med en anden, typisk udtrykt som en stigning eller reduktion i procent (Celentano and Szklo, 2019).

Forskellen er vigtig, fordi relativ risiko alene kan få en effekt til at fremstå større, end den reelt er, mens absolut risiko viser den faktiske betydning i praksis.

Eksempel:

Et studie viser, at en ny behandling fordobler risikoen for en bivirkning.

Den absolutte risiko stiger fra 1 ud af 10.000 til 2 ud af 10.000 personer.

Det svarer til en 100 % relativ risikostigning, men kun 1 ekstra person ud af 10.000 får bivirkningen.

Hvorfor er det vigtigt?

Den relative risiko kan få effekten til at virke alvorlig, mens den absolutte risiko viser, at den faktiske betydning er meget lille. For at vurdere, om et resultat er relevant i praksis, er det derfor nødvendigt at kende den absolutte risiko – ikke kun den relative.

Referencer:

Celentano, D.D., Szklo, M., 2019. Gordis Epidemiology, Sixth Edition. Elsevier.

Minimal clinical important difference (MCID) beskriver den mindste ændring i et outcome, som patienter oplever som meningsfuld eller klinisk relevant. Det er altså et mål for, hvornår en ændring ikke blot er målbar, men også har betydning i praksis. MCID bruges ofte ved patientrapporterede outcomes som smerte, funktion eller livskvalitet.

MCID hjælper med at skelne mellem statistisk signifikante resultater og klinisk relevante effekter. Et studie kan vise en statistisk signifikant forskel, men hvis ændringen er mindre end MCID, er det usikkert, om den reelt har betydning for patienterne. MCID er derfor et centralt begreb, når man skal vurdere, om forskningsresultater bør føre til ændringer i klinisk praksis.

Eksempel:

Et studie undersøger effekten af et træningsprogram på smerte hos patienter med kroniske rygsmerter målt på VAS 0‑100. Efter 12 ugers træning fandt man en gennemsnitlig smertereduktion på 8 mm sammenlignet med kontrolgruppen og resultatet var statistisk signifikant. Den kendte MCID for VAS‑smerte vurderes til at være omkring 15 mm.

Hvad fortæller MCID om resultatet og den måde, vi tolker det?

Selvom der ses en forbedring i smerte og resultatet er statistisk signifikant, er ændringen mindre end MCID. Det betyder, at forskellen sandsynligvis ikke opleves som klinisk relevant for patienterne. Resultatet indikerer derfor, at effekten af træningen er begrænset set fra et klinisk perspektiv.

Basale statistiske begreber

Hvorfor det er vigtigt at kunne forstå basal statistik?

Kontaktpersoner

Tina Junge

Bastian Søgaard Jensen

Basale statistiske begreber

Hvorfor det er vigtigt at kunne forstå basal statistik?

P-værdi

Konfidensinterval

Standard deviation (SD) / Standardafvigelse

Relativ og absolut risiko

Minimal klinisk relevant forskel

Kontaktpersoner

Tina Junge

Bastian Søgaard Jensen