Ist die Therapie klinisch nützlich?
Der vorangegangene Abschnitt stellte eine Reihe von Kriterien (methodologischen Filtern) auf, die Leser von Fachliteratur nutzen können, um Studien, die wahrscheinlich valide sind, von denen, die es eventuell nicht sind, zu unterscheiden. Studien, die den meisten methodologischen Filtern nicht gerecht werden, sollte man im Allgemeinen am besten ignorieren. Dieser Abschnitt befasst sich damit, wie Therapeutinnen und Therapeuten diejenigen Studien interpretieren sollten, die die methodologischen Filter passieren. Die Botschaft dabei ist, dass es nicht ausreicht, einfach nur nach Belegen für einen statistisch signifikanten Effekt der Therapie zu suchen. Sie müssen davon überzeugt sein, dass die Studienergebnisse therapeutische Bedeutung haben, und dass die positiven Effekte der Therapie groß genug sind, also auch klinische Signifikanz haben, so dass sich ihre Anwendung “lohnt”. Schädliche Effekte der Therapie müssen entweder selten oder gering sein, so dass die Therapie mehr nützt als schadet. Und schließlich muss die Therapie kosten-effizient sein.
Um für die therapeutische Praxis von Nutzen zu sein, muss eine Studie selbstverständlich therapeutisch bedeutsame Ergebnisse (Outcomes) untersuchen, was auch bedeutet, dass diese valide gemessen werden. Im Allgemeinen sollten dies Outcomes sein, die für die Patienten bedeutsam sind, weil wir normalerweise den primären wert einer Behandlung daran festmachen, ob sie den Bedürfnissen der Patienten gerecht wird. Folglich ist z.B. eine Studie, die belegt, dass Niedrig-Energie Laserbehandlungen den Serotoninspiegel senken, viel weniger hilfreich als eine, die zeigt, dass hierdurch Schmerzen verringert werden; und eine Studie, die zeigt, dass motorisches Training die Spastizität senkt, ist viel weniger hilfreich als eine die zeigt, dass hierdurch die funktionelle Unabhängigkeit vergrößert wird.
Die Größe des Behandlungseffekts ist offensichtlich wichtig, wird aber oft übersehen. Das liegt vielleicht daran, dass viele Leser von klinischen studien den Unterschied zwischen “statistischer Signifikanz” und “klinischer Signifikanz” nicht richtig einzuschätzen wissen. Es kann aber auch sein, dass viele Autoren von klinischen Studien zu sehr mit der Frage beschäftigt sind, ob für ihre Ergebnisse “p < 0.05″ ist oder nicht. Statistische Signifikanz (“p < 0.05″) sagt etwas darüber aus, ob der Unterschied zwischen den Gruppen (also der Therapieerfolg) zu groß ist, um ihn noch vernünftigerweise dem Zufall zuschreiben zu können. Das ist wichtig (wir müssen wissen, ob beobachtete Behandlungseffekte vielleicht nicht einfach Zufallsbefunde sind), aber für sich genommen sagt uns dies nichts darüber, wie groß die Effekte tatsächlich waren. Die beste Schätzung des Behandlungseffektes ist die Differenz zwischen den Gruppen, also der Unterschied zwischen der durchschnittlichen Veränderung in der Kontroll- zu der der Experimentalgruppe. Angenommen, eine Studie ergäbe, dass eine Mobilisationsbehandlung der Schulter eine durchschnittliche Reduktion der Schmerzangaben um 4 cm auf einer visuellen Analogskala erreicht, und eine durchschnittliche Verringerung um 1 cm in der Kontrollgruppe, dann ist unsere beste Schätzung des Behandlungseffektes eine Verringerung um 3 cm auf der VAS (da 4 minus 1 = 3). Oder angenommen, eine Studie zu Muskeldehnungen vor sportlichen Aktivitäten ergäbe, dass 2% der Sportler in der Dehnungs- (Experimental-) gruppe in einem bestimmten Folgezeitraum Verletzungen erlitten, wohingegen in einer Kontrollgruppe (ohne Dehnung) 4% Verletzungen im gleichen Zeitraum davontrügen; dann wäre unsere beste Evidenz, dass Dehnungen das Verletzungsrisiko um 2% verringern (da 4% minus 2% = 2%). Leser von klinischen Studien müssen den berichteten Behandlungseffekt beachten, um entscheiden zu können, ob dieser groß genug ist, um klinisch signifikant zu sein. Die meisten Patienten kommen zur Therapie, weil sie Abhilfe erwarten (zugegeben, eine Verallgemeinerung, die nicht auf alle Bereiche klinischer Praxis zutrifft); die wenigsten haben Interesse an einer Therapie, die nur kleine Veränderung erwarten lässt.
Es gibt eine wichtige Feinheit, wenn man Therapieeffekte betrachtet. Das betrifft Studien, deren Outcomes (Ergebnisse) dichotom gemessen werden (dichotom bedeutet, dass eine Variable (ein Merkmal, ein interessierendes Ergebnis) nur zwei Ausprägungen haben kann, z.B . “tot” oder “lebendig”, “verletzt” oder “nicht verletzt”, “in Pflegeheim eingewiesen” oder “nicht in Pflegeheim eingewiesen”; solche Variablen unterscheiden sich von Variablen wie z.B . Schmerzangabe, wenn diese auf einer VAS gemessen wird, auf der sie fast jeden Wert von 0 bis 10 annehmen kann. Viele Studien, die dichotome Ergebnisse messen, drücken Behandlungseffekte nicht als Unterschied zwischen den Gruppen, sondern in Verhältniszahlen, also als Quotient aus. Ein solcher Quotient wird z.B. “relatives risiko”, “odds ratio” oder “hazard ratio” genannt, aber sie kommen auch unter weiteren Namen daher. Würde man die Ergebnisse unserer hypothetischen Dehnungsstudie mit einem solchen Quotienten ausdrücken, dann würde in der Veröffentlichung stehen, dass Dehnungen eine Verringerung des Verletzungsrisikos um 50% bewirken (da 2% halb so viel wie 4% ist). Wenn Behandlungseffekte als Quotienten ausgedrückt werden, dann hat das meist zur Folge, dass die Wirkung der Therapie groß erscheint. Das bessere Maß ist die Differenz zwischen den Gruppen. Tatsächlich wäre das beste Maß für Behandlungserfolge wohl der Kehrwert der Differenz zwischen den Gruppen [also statt 2%, was ja mathematisch nichts anderes ist als 2% dividiert durch 1, teilt man hierfür 1 durch 2%; Anm. d. Übers]. Dieses maß nennt man “Numbers Needed to Treat” (NNT: “erforderliche Anzahl von Behandlungen”), weil es uns angibt, wie viele Patienten behandelt werden müssten, um ein ungünstiges Ereignis zu verhindern. Im Beispiel mit den Dehnungen beträgt die NNT 1/0.02 = 50 [da 2% = 0.02]; mit anderen Worten: auf 50 Sportler, die sich dehnen, kommt eine vermiedene Verletzung.
Viele Studien berichten nicht über schädigende Wirkungen von Therapien (also über “Nebenwirkungen” oder “Komplikationen” einer Therapie). Das ist bedauerlich, weil die Abwesenheit von Berichten über schädigende Wirkungen oft dahingehend interpretiert wird, dass die Therapie nicht schadet, aber das muss nicht notwendigerweise der Fall sein. Glaziou und Irwig (BMJ 311: 1356-1359, 1995) haben argumentiert, dass die Effekte von Therapie im Allgemeinen dann am deutlichsten sind, wenn sie Patienten, die sich in äußerst ernstem Zustand befinden, verabreicht werden (z.B. kann vom Absaugen der Bronchien bei Patienten mit Kopfverletzungen und reichlicher Sputumretention eine größere Verringerung des Risikos “Atemstillstand” erwartet werden als bei Patienten mit Kopfverletzungen und geringer Sputumretention. Im Gegensatz dazu tendieren die Gefahren der Therapie (in diesem Fall durch erhöhten intrakranialen Druck) unabhängig vom sonstigen Schweregrad zu relativer Konstanz. Daraus folgt: Die Therapie nützt mehr als sie schadet, wenn sie auf Patienten mit reichlicher Sputumretention angewandt wird, aber Therapeuten sollten generell zurückhaltend sein, eine Therapie zu verabreichen, die potenziell ernsthafte Nebeneffekte hat, wenn der Patient eine weniger ernsthafte Erkrankung hat.
In der Praxis ist es oft schwierig für Studien, schädigende Effekte zu entdecken, weil diese dazu neigen, selten aufzutreten und die meisten Studien zu kleine Stichproben haben, um ungünstige Ereignisse oder Effekte zu erfassen, wenn diese auftreten. Mithin besteht auch nach der Durchführung guter randomisierter kontrollierter Studien zur Evaluation von Therapien ein gewichtiger Grund für groß angelegte Beobachtungsstudien, die große Kohorten behandelter Patienten “verfolgen” und “monitoren” um zu überprüfen, ob schädliche Ereignisse nicht übermäßig auftreten. Bis solche Studien durchgeführt sind, sollten Therapeutinnen und Therapeuten sehr behutsam in der Anwendung potentiell schädigender Therapien sein, insbesondere bei Patienten, bei denen von solchen Therapien nur ein geringer Nutzen zu erwarten ist.
Ein gehobenes Niveau der kritischen Beurteilung befasst sich mit Erwägungen hinsichtlich des Grades der Ungenauigkeit von Schätzungen der Behandlungseffekte, wie sie sich durch klinische Studien ergeben. Klinische Studien werden durchgeführt an Stichproben. Von den Stichproben wird angenommen, dass sie repräsentativ für bestimmte Grundgesamtheiten (Populationen) sind. Das bedeutet, dass im besten Falle eine Studie eine (nicht perfekte) Schätzung der Größe des Behandlungseffektes, bezogen auf die Grundgesamtheit, ist. Klinische Studien mit großen Stichproben, also vielen Probanden, erlauben bessere, nämlich präzisere Schätzungen des Behandlungseffektes (bezogen auf die Grundgesamtheit) als Studien mit kleineren Stichproben. Leser sollten im Idealfall den Grad der Ungenauigkeit der Schätzung des Behandlungseffektes berücksichtigen, wenn sie die Ergebnisse einer Studie interpretieren, da dies oft den Grad der Gewissheit berührt, mit dem man den Schlussfolgerungen einer Studie begegnen kann. Das Mittel der Wahl dabei ist die Berechnung eines Konfidenzintervalls um die Schätzung des Behandlungseffekts herum, falls dieses nicht bereits in der Veröffentlichung explizit enthalten ist (eine Anleitung, wie man Konfidenzintervalle zu üblichen Maßen von Behandlungseffekten berechnet und interpretiert, findet sich u.a. hier: Herbert RD (2004). Wie kann man behandlungseffekte aus klinischen studien bewerten? I: Kontinuierliche Outcomes. Wissenschaft Verstehen, Folge 19, Zeitschrift für Physiotherapeuten, 56 Jg, Heft 10, 1902-1913 und Herbert RD (2004). Wie kann man behandlungseffekte aus klinischen studien bewerten? II: Dichotome Outcomes. Wissenschaft Verstehen, Folge 20, Zeitschrift für Physiotherapeuten, 56 Jg, Heft 11, 2126-2133. Leser, die mit der Berechnung von Konfidenzintervallen schon vertraut sind, finden es vielleicht hilfreich, sich den PEDro-Konfidenzintervall-rechner, eine Exel-Datei herunterzuladen.
Der letzte Schritt im Entscheidungsprozess über die Nützlichkeit einer Therapie ist die Entscheidung darüber, ob die Therapie kosteneffizient ist. Dies ist vor allem dann relevant, wenn es sich um Leistungen im Gesundheitssystem handelt, die aus öffentlichen Kassen entweder ganz oder teilweise bezahlt wird. Es wird nie genug Ressourcen geben, um alle Innovationen zu bezahlen (wahrscheinlich noch nicht einmal, um alle guten Innovationen zu bezahlen). Folglich bestehen die Kosten einer jeden Therapie auch darin, dass das hierfür ausgegebene Geld nicht für eine andere Therapie bzw. gesundheitsbezogene Dienstleistung ausgegeben werden kann. Eine vernünftige Verteilung von begrenzten Mitteln bedeutet also auch, Geld dort einzusetzen, wo der Effekt pro Euro am größten ist. Selbstverständlich kann eine Therapie nicht kosteneffizient sein, wenn sie nicht wirkt. Aber eine wirksame Therapie kann sehr wohl kostenineffizient sein. Die Methoden, mit denen Kosteneffizienz bestimmt wird, liegen außerhalb des Fachwissens des Autors. Deswegen ist es wohl besser, wenn ich auf fundiertere Quellen verweise. Bei Interesse an dieser Thematik sei empfohlen:
- Drummond MF, Richardson WS, O’Brien BJ, Levine M, Heyland D (1997). User’s guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: A. Are the results of the study valid? JAMA 277: 1552-1557.
- O’Brien BJ, Heyland D, Richardson WS, Levine M, Drummond MF (1997). User’s guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: B. What are the results and will they help me in caring for my patients? JAMA 277: 1802-1806.
Auch dieser Abschnitt soll kurz zusammengefasst werden:
Statististsche Signifikanz ist nicht gleichzusetzen mit klinischem Nutzen. Um klinisch nützlich sein, muß eine Therapie:
- Outcomes beeinflussen, an denen die Patienten interessiert sind
- Wirkung haben, die groß genug ist, so dass sich ihre Anwendung lohnt
- mehr nützen als schaden
- kosteneffizient sein.
Als vertiefende Literatur zu Effektgrößen wird empfohlen:
Guyatt GH, Sackett DL, Cook DJ (1994). User’s guide to the medical literature: II. How to use an article about therapy or prevention: B. What were the results and will they help me in caring for my patients? JAMA 271: 59-63.



