Bare en av ti medisinske behandlinger støttes av bevis av høy kvalitet
Towfiqu skammet barbhuiya / Shutterstock

Når du besøker legen din, kan du anta at behandlingen de foreskriver har solid bevis for å sikkerhetskopiere den. Men du tar feil. Bare en av ti medisinske behandlinger støttes av bevis av høy kvalitet, våre siste undersøkelser viser.

Analysen, som er publisert i Journal of Clinical Epidemiology, inkluderte 154 systematiske oversikter fra Cochrane publisert mellom 2015 og 2019. Bare 15 (9.9%) hadde bevis av høy kvalitet i henhold til gullstandardmetode for å avgjøre om de gir bevis av høy eller lav kvalitet, kalt GRADE (gradering av anbefalinger, vurdering, utvikling og evaluering). Blant disse hadde bare to statistisk signifikante resultater - noe som betyr at resultatene neppe hadde oppstått på grunn av tilfeldige feil - og ble antatt av forfatterne til å være nyttige i klinisk praksis. Ved bruk av det samme systemet hadde 37% moderat, 31% hadde lav og 22% hadde svært lav kvalitet.

GRADE-systemet ser på ting som risiko for skjevhet. For eksempel, studier som er "blindet" - der pasienter ikke vet om de får den faktiske behandlingen eller placebo - gir bevis av høyere kvalitet enn "ublindede" studier. Blinding er viktig fordi folk som vet hvilken behandling de får, kan oppleve større placeboeffekter enn de som ikke vet hvilken behandling de får.

GRADE vurderer blant annet om studiene var upresise på grunn av forskjeller i måten behandlingen ble brukt på. I 2016-gjennomgangen fant forskere at 13.5% - omtrent en av syv - rapporterte at behandlinger ble støttet av bevis av høy kvalitet. Mangel på bevis av høy kvalitet, ifølge GRADE, betyr at fremtidige studier kan velte resultatene.

De 154 studiene ble valgt fordi de var oppdateringer fra en tidligere gjennomgang av 608 systematiske anmeldelser, utført i 2016. Dette lar oss sjekke om anmeldelser som hadde blitt oppdatert med nye bevis, hadde bevis av høyere kvalitet. Det gjorde de ikke. I 2016-studien rapporterte 13.5% at behandlinger ble støttet av bevis av høy kvalitet, så det var en trend mot lavere kvalitet ettersom mer bevis ble samlet inn.


innerself abonnere grafikk


Det var noen få begrensninger i studien. For det første kan det hende at utvalgsstørrelsen i studien ikke har vært representativ, og andre studier har funnet ut at over 40% av medisinske behandlinger er sannsynlig å være effektive. Også prøven i studien var ikke stor nok til å sjekke om det var visse typer medisinske behandlinger (farmakologiske, kirurgiske, psykologiske) som var bedre enn andre. Det er også mulig at "gullstandarden" for rangering av bevis (GRADE) er for streng.

For mange studier av lav kvalitet

Mange forsøk av dårlig kvalitet blir publisert, og studien vår reflekterte bare dette. På grunn av presset til “Publisere eller omkomme” for å overleve i akademia, blir det gjort flere og flere studier. I PubMed alene - en database med publiserte medisinske papirer - publiseres mer enn 12,000 nye kliniske studier hvert år. Det er 30 forsøk publisert hver dag. Systematiske vurderinger ble designet for å syntetisere disse, men nå er det for mange av dem også: over 2,000 per år publisert i PubMed alene.

Den bevisbaserte medisinbevegelsen har banket en tromme om behovet for å forbedre kvaliteten på forskningen i mer enn 30 år, men paradoksalt nok er det ingen bevis for at ting har blitt bedre til tross for spredning av retningslinjer og veiledning.

I 1994 bønnfalt Doug Altman, professor i statistikk i medisin ved Oxford University mindre, men bedre, forskning. Dette hadde vært bra, men det motsatte har skjedd. Uunngåelig har tsunamien om rettssaker som publiseres hvert år, kombinert med behovet for å publisere for å overleve i akademia, ført til at mye søppel ble publisert, og dette har ikke endret seg over tid.

Bevis av dårlig kvalitet er alvorlig: uten gode bevis kan vi ganske enkelt ikke være sikre på at behandlingene vi bruker fungerer.

Bare en av ti medisinske behandlinger støttes av bevis av høy kvalitetDet var ment å være en vits. Twitter

GRADE-systemet er for tøft

En tømrer skal bare skylde på verktøyene sine som en siste utvei, så unnskyldningen for at GRADE ikke fungerer, skal bare brukes med forsiktighet. Likevel er det sannsynligvis sant at GRADE-systemet er for tøft for noen sammenhenger. For eksempel er det nesten umulig for noen studier som vurderer et bestemt treningsregime å være av høy kvalitet.

En treningsforsøk kan ikke bli "blindet": alle som trener vil vite at de er i treningsgruppen, mens de i kontrollgruppen vil vite at de ikke trener. Det er også vanskelig å få store grupper av mennesker til å gjøre nøyaktig den samme øvelsen, mens det er lettere å få alle til å ta den samme pillen. Disse iboende problemene fordømmer treningsforsøk til å bli vurdert til å være av lavere kvalitet, uansett hvor nyttig sikker trening er.

Metoden vår var også streng. Mens de systematiske gjennomgangene hadde mange resultater (som hver kunne være av høy kvalitet), fokuserte vi på de primære resultatene. For eksempel vil det primære resultatet i en gjennomgang av smertestillende midler være en reduksjon i smerte. Deretter kan de også måle en rekke sekundære resultater, alt fra angstreduksjon til pasienttilfredshet.

Å fokusere på de primære resultatene forhindrer falske funn. Hvis vi ser på mange utfall, er det en fare for at ett av dem vil være av høy kvalitet bare ved en tilfeldighet. For å redusere dette så vi på om noe utfall - selv om det ikke var det primære utfallet. Vi fant at en av fem behandlinger hadde bevis av høy kvalitet for ethvert utfall.

I gjennomsnitt støttes de fleste medisinske behandlinger hvis effektivitet er testet i systematiske vurderinger ikke av bevis av høy kvalitet. Vi trenger mindre, men bedre, forskning for å løse usikkerhet, slik at vi kan bli mer sikre på at behandlingene vi tar fungerer.Den Conversation

om forfatteren

Jeremy Howick, direktør for Oxford Empathy Program, University of Oxford

Denne artikkelen er publisert fra Den Conversation under en Creative Commons-lisens. Les opprinnelige artikkelen.

books_science