PEDro-Skala

Die PEDro-Skala wurde zuletzt am 21. Juni 1999 geändert. Die deutsche Űbersetzung der PEDro-Skala wurde erstellt von Stefan Hegenscheidt, Angela Harth und Erwin Scherfer. Die deutsche Űbersetzung wurde im April 2008 fertiggestellt und wurde im Februar 2010 geändert.

Dies erklärt in Kürze, warum das jeweilige Item in die PEDro-Skala aufgenommen wurde. Weitere detailliertere Informationen zu jedem Item bietet das PEDro-Skala Trainingsprogramm.

Die deutsche Űbersetzung der PEDro-Skala wurde erstellt von Stefan Hegenscheidt, Angela Harth und Erwin Scherfer. Die Űbersetzung folgte den “Guidelines for the Cross-Cultural Adaptation Process” [Beaton D, Bombardier C, Guillemin F, Ferraz MB (2002). Recommendations for the Cross-Cultural Adaptation of the DASH & QuickDASH Outcome Measures; Institute for Work & Health; Revised June 2007; last access: Sept 11, 2008]. Stefan Hegenscheidt und Erwin Scherfer entwickelten zunächst unabhängig voneinander zwei Versionen, die miteinander verglichen und schließlich zu einer vorläufigen deutschen Version zusammengeführt wurden. Angela Harth erstellte die Rückübersetzung. Angela Harth ist als Klinikerin und Rehabilitationswissenschaftlerin zwar mit der einschlägigen methodologischen Terminologie vertraut, jedoch nicht im Detail mit dem zu übersetzenden Dokument, so dass hier keine Interferenz durch bekannte Originaltextteile anzunehmen war. Auf die Beteiligung von Laien, wie für der Űbersetzung von Fragebögen zur Selbstbeurteilung gefordert, konnte und musste sinnvollerweise verzichtet werden, weil sich die PEDro ausschließlich an Fachleute richtet.

1. Die Ein- und Ausschlusskriterien wurden spezifiziert

Anmerkung: Dieses Kriterium gilt als erfüllt, wenn berichtet wird, wie die Probanden rekrutiert wurden, und wenn eine Liste mit Kriterien dargestellt wird, die genutzt wurde, um zu entscheiden, wer geeignet war an der Studie teilzunehmen.

Erläuterung: Dieses Kriterium beeinflusst die externe Validität, aber nicht die interne oder statistische Validität einer Studie. Es wurde in die PEDro-Skala aufgenommen, damit alle Items der Delphi-Skala auch in der PEDro-Skala repräsentiert sind. Dieses Item findet keinen Niederschlag in der Berechnung des PEDro-Score (Punktwert, den eine bestimmte Studie bei Anwendung der PEDro-Skala erreicht).

2. Die Probanden wurden den Gruppen randomisiert zugeordnet (im Falle von Crossover Studien wurde die Abfolge der Behandlungen den Probanden randomisiert zugeordnet)

Anmerkung: Wenn in einem Artikel steht, dass die Zuordnung zu den Gruppen randomisiert erfolgte, so wird dies von der Studie angenommen. Die genaue Methode der Randomisierung muss dabei nicht näher spezifiziert sein. Methoden wie Münz- oder Würfelwürfe sollten als Randomisierung angesehen werden. Quasi-randomisierte Zuordnungsverfahren wie die Zuordnung durch Krankenaktennummern im Krankenhaus, Geburtsdatum, oder alternierende Zuordnungen, erfüllen dieses Kriterium nicht.

Erläuterung: Die Randomisierung stellt sicher (mit den Einschränkungen, die der Zufall mit sich bringt), dass die Interventions- (Experimental-) gruppe und die Kontrollgrupp vergleichbar sind.

3. Die Zuordnung zu den Gruppen erfolgte verborgen

Anmerkung: Verborgene Zuordnung bedeutet, dass die Person, die entschieden hat ob der jeweilige Proband für eine Teilnahme geeignet war oder nicht, zum Zeitpunkt dieser Entscheidung nicht wissen konnte, welcher Gruppe der jeweilige Proband zugeordnet werden würde. Für dieses Kriterium wird auch dann ein Punkt vergeben, wenn über eine verdeckte Zuordnung nicht berichtet wird, aber in dem Bericht zum Ausdruck kommt, dass die Zuordnung mit Hilfe blickdichter Briefumschläge erfolgte, oder dass die Allokation über Kontaktaufnahme mit einem unabhängigen Verwalter des Allokationsplans, der sich “nicht am Ort der Studiendurchführung” befand oder “nicht anderweitig an der Studie beteiligt” war, erfolgte.

Erläuterung: “Verborgenheit” bezieht sich darauf, ob die Person, die entscheidet, ob Probanden für die Studie geeignet waren, zum Zeitpunkt der Entscheidung über die Eignung einer bestimmten Person weiß, zu welcher Gruppe diese Person zugeordnet würde, oder ob sie dieses nicht weiß. Wenn sie es nicht weiß, spricht man von verborgener Zuordnung. Es besteht die Gefahr, dass wenn die Zuordnung nicht verborgen geschieht, die Entscheidung darüber, ob oder ob nicht eine Person für geeignet für die Studie beurteilt wird, durch das Wissen darüber, ob diese Person bei Eignung die Intervention erhalten würde oder nicht, beeinflusst wird. Dieses aber könnte systematische Verzerrungen in die ansonsten randomisierte Zuordnung erzeugen. Es gibt empirische Evidenz, dass verborgene Zuordnung die Effektgröße beeinflusst (verborgene Zuordnung wird mit bescheideneren Behandlungseffekten in Verbindung gebracht; see Schulz et al, JAMA 1995;273:408-12).

4. Zu Beginn der Studie waren die Gruppen bzgl. der wichtigsten prognostischen Indikatoren einander ähnlich

Anmerkung: In Studien, die therapeutische Interventionen untersuchen, muss jeweils vor Begin der Intervention mindestens eine Messung hinsichtlich des Schweregrades des zu behandelnden Zustandes, und mindestens ein anderes zentrales Outcome beschrieben werden (Eingangsmessungen). Der Gutachter muss ausreichend davon überzeugt sein, dass sich klinisch signifikante Unterschiede in den Gruppen-Outcomes nicht allein schon aufgrund von Unterschieden in den prognostischen Variablen zu Begin der Studie (also zum Baseline-Zeitpunkt) erwarten ließen. Dieses Kriterium gilt auch dann als erfüllt, wenn nur Baseline-Daten für diejenigen Probanden beschrieben werden, welche bis zum Ende an der Studie teilgenommen haben.

Erläuterung: Dieses Kriterium hilft zu überprüfen, inwieweit eine potenzielle Verzerrung durch den Zufall durch die Randomisierung verursacht wurde. Große Diskrepanzen (hinsichtlich möglicher prognostischer Faktoren) zwischen den Gruppen kann auch auf einen inadäquaten Randomisierungsprozess hinweisen.

5. Alle Probanden waren geblindet

Anmerkung: Blindung bedeutet, dass die betreffende Person (Proband/In, Therapeut/In oder Untersucher/In) nicht gewusst hat, welcher Gruppe der Proband zugeordnet worden ist. Außerdem wird eine Blindung von Probanden und Therapeuten nur dann als gegeben angenommen, wenn davon ausgegangen werden kann, dass sie nicht in der Lage gewesen wären, zwischen den Behandlungen, die in den verschiedenen Gruppen ausgeführt wurden, zu unterscheiden. In Studien, in denen zentrale Outcomes von den Probanden selbst angegeben werden (z.B. Visuelle Analog Skala oder Schmerztagebücher), gilt der Untersucher als geblindet, wenn der Proband geblindet war.

Erläuterung: Die “Blindung” von Probanden bedeutet sicherzustellen, dass die Probanden nicht in der Lag waren zu unterscheiden, ob sie in der Interventions- oder in der Kontrollgruppe waren, ob sie also die Behandlung erhalten oder nicht. Wenn die Probanden geblindet waren, kann der Leser davon ausgehen, dass der offensichtliche Effekt (oder dessen Abwesenheit) nicht auf einen Placebo- oder Hawthorne-Effekt zurückzuführen ist. Der Hawthorne-Effekt ist ein experimentelles Artefakt, wobei die Reaktionen der Probanden dadurch beeinflusst werden, dass sie wissen, welche Reaktionen von ihnen seitens der Forscher erwartet werden.

6. Alle Therapeuten/Innen, die eine Therapie durchgeführt haben, waren geblindet

Anmerkung: Blindung bedeutet, dass die betreffende Person (Proband/In, Therapeut/In oder Untersucher/In) nicht gewusst hat, welcher Gruppe der Proband zugeordnet worden ist. Außerdem wird eine Blindung von Probanden und Therapeuten nur dann als gegeben angenommen, wenn davon ausgegangen werden kann, dass sie nicht in der Lage gewesen wären, zwischen den Behandlungen, die in den verschiedenen Gruppen ausgeführt wurden, zu unterscheiden. In Studien, in denen zentrale Outcomes von den Probanden selbst angegeben werden (z.B. Visuelle Analog Skala oder Schmerztagebücher), gilt der Untersucher als geblindet, wenn der Proband geblindet war.

Erläuterung: Die Blindung der Therapeuten bedeutet sicherzustellen, dass die Therapeuten nicht in der Lage waren zu unterscheiden, ob ein Proband in der Interventions- oder der Kontrollgruppe ist, ob er also die Behandlung erhält oder nicht. Wenn die Therapeuten geblindet waren, kann der Leser davon ausgehen, dass der offensichtliche Effekt (oder dessen Abwesenheit) der Behandlung nicht auf den Enthusiasmus der Therapeuten (oder den Mangel an Enthusiasmus der Therapeuten) für die Intervention oder die Bedingungen der Kontrollgruppe zurückzuführen ist.

7. Alle Untersucher, die zumindest ein zentrales Outcome gemessen haben, waren geblindet

Anmerkung: Blindung bedeutet, dass die betreffende Person (Proband/In, Therapeut/In oder Untersucher/In) nicht gewusst hat, welcher Gruppe der Proband zugeordnet worden ist. Außerdem wird eine Blindung von Probanden und Therapeuten nur dann als gegeben angenommen, wenn davon ausgegangen werden kann, dass sie nicht in der Lage gewesen wären, zwischen den Behandlungen, die in den verschiedenen Gruppen ausgeführt wurden, zu unterscheiden. In Studien, in denen zentrale Outcomes von den Probanden selbst angegeben werden (z.B. Visuelle Analog Skala oder Schmerztagebücher), gilt der Untersucher als geblindet, wenn der Proband geblindet war.

Erläuterung: Die Blindung der Untersucher bedeutet sicherzustellen, dass die Untersucher nicht in der Lage waren, zu unterscheiden, ob ein Proband in der Interventions- oder der Kontrollgruppe war, ob er also die Behandlung erhalten hat oder nicht. Wenn die Untersucher geblindet waren, kann der Leser davon ausgehen, dass der offensichtliche Effekt (oder dessen Abwesenheit) der Behandlung nicht Folge davon war, dass sich eine verzerrte Wahrnehmung bzw. Beobachtung auf die Outcome-Messungen niederschlug.

8. Von mehr als 85% der ursprünglich den Gruppen zugeordneten Probanden wurde zumindest ein zentrales Outcome gemessen

Anmerkung: Dieses Kriterium gilt nur dann als erfüllt, wenn die Studie sowohl über die Anzahl der ursprünglich den Gruppen zugeordneten Probanden, als auch über die Anzahl der Probanden, von denen tatsächlich zentrale Outcomes festgehalten werden konnten, Auskunft gibt. Bei Studien mit Outcome-Messungen zu mehreren Messzeitpunkten, muss mindestens ein zentrales Outcome bei mehr als 85% der Probanden zu einem dieser Zeitpunkte gemessen worden sein.

Erläuterung: Es ist wichtig, dass Outcome-Messungen an allen Probanden vorgenommen werden, die ursprünglich den Gruppen randomisiert zugeordnet wurden. Probanden, deren Outcomes nicht zu einem zweiten Messzeitpunkt gemessen wurden, können sich systematisch von denjenigen unterscheiden, von denen Outcomes zu einem zweiten Messzeitpunkt gemessen werden konnten. Hierin liegt ein Potenzial für Verzerrungen. Die Größe dieser potenziellen Verzerrung nimmt mit der Größe des Anteil der Probanden, von denen keine Daten eines zweiten Messzeitpunktes gewonnen werden konnten, zu.

9. Alle Probanden, für die Ergebnismessungen zur Verfügung standen, haben die Behandlung oder Kontrollanwendung bekommen wie zugeordnet oder es wurden, wenn dies nicht der Fall war, Daten für zumindest ein zentrales Outcome durch eine “intention to treat” Methode analysiert

Anmerkung: Eine Intention to treat Analyse bedeutet, dass in den Fällen, in denen Probanden die zugedachte Behandlung (oder Kontrollanwendung) nicht erhalten haben und in denen Ergebnismessungen möglich waren, die Messwerte so analysiert werden, als ob die Probanden die zugedachte Behandlung (oder Kontrollanwendung) erhalten hätten. Wird eine Analyse nach der “Intention to treat” Methode nicht erwähnt, gilt dieses Kriterium dennoch als erfüllt, falls explizit zum Ausdruck kommt, dass alle Probanden die Behandlungen oder Kontrollanwendungen wie zugedacht erhalten haben.

Erläuterung: Fast unausweichlich gibt es in klinischen Studien Protokollverletzungen. Protokollverletzungen können sein, dass Probanden nicht die Behandlung wie geplant erhalten, oder dass sie eine Behandlung erhalten, die sie nicht erhalten sollten. Die Analyse der Daten danach, wie die Probanden behandelt wurden (anstatt danach, wie sie behandelt werden sollten) kann Verzerrungen erzeugen. Es ist wichtig, dass die Analyse der Daten so erfolgt, als ob jeder Proband die Behandlung oder Kontrollgruppenbehandlung erfahren hat, wie sie geplant wurde. Diese Vorgehensweise nennt man in der Regel “analysis by intention to treat” (wörtl: “Analyse nach Behandlungsintention”; allerdings benutzt man auch im Deutschen den Begriff: intention-to-treat-analysis; Anm d Übers, ES); für eine jüngere diskussion der Intention-to-treat-Analyse see Elkins und Moseley, J Physiother 2015;61(3):165-7.

10. Für mindestens ein zentrales Outcome wurden die Ergebnisse statistischer Gruppenvergleiche berichtet

Anmerkung: Ein Zwischen-Gruppen-Vergleich beinhaltet einen statistischen Vergleich einer Gruppe mit einer anderen Gruppe. Abhängig vom jeweiligen Studiendesign kann es sich dabei um den Vergleich von zwei oder mehr verschiedenen Behandlungen, oder auch um den Vergleich einer Behandlung mit einer Kontrollanwendung (z.B. Placebo-Behandlung, Nicht-Behandlung, Scheinbehandlung) handeln. Die Analyse kann als einfacher Vergleich der Outcomes zwischen den Gruppen erfolgen, die nach einer durchgeführten Behandlung gemessen wurden, oder auch als Vergleich der Veränderungen in einer Gruppe mit den Veränderungen in einer anderen Gruppe (wurde eine faktorielle Varianzanalyse durchgeführt, um die Daten zu analysieren, so wird dies im letzteren Fall häufig als eine “Gruppe x Zeit Interaktion” berichtet). Der Vergleich kann als Hypothesentestung (die einen “p”-Wert liefert, der die Wahrscheinlichkeit dafür angibt, dass der Unterschied zwischen den Gruppen rein zufällig entstanden ist) oder als Schätzung (z.B. der Differenz des Medians oder des arithmetischen Mittels, der Unterschiede in den Prozentanteile, oder der Number Needed to Treat, oder des relativen Risikos oder der “Hazard Ratio” [Der Begriff Hazard Ratio (“Risikoeintrittsquotient“) wird auch in der deutschen medizinischen Fachliteratur verwendet. Die Hazard Ratio ist der Quotient aus den Eintrittswahrscheinlichkeiten (Ereignisdichten) in den zu vergleichenden Gruppen]) mit einem dazugehörigen Konfidenz-Intervall durchgeführt werden.

Erläuterung: In klinischen Studien werden statistische Tests durchgeführt, um festzustellen, ob die Differenz zwischen den Gruppen größer ist, als plausibel durch Zufall erwartet werden kann.

11. Die Studie berichtet sowohl Punkt- als auch Streuungsmaße für zumindest ein zentrales Outcome

Anmerkung: Ein Punktmaß ist ein Maß der Größe des Behandlungseffekts. Der Behandlungseffekt kann als Differenz in den Outcomes zwischen zwei Gruppen beschrieben werden, oder auch als Outcome in jeder der Gruppen. Streuungsmaße können sein: Standardabweichungen, Standardfehler, Konfidenzintervalle, Interquartilsabstände (oder andere Quantilsabstände), und Ranges. Punktmaße und/oder Maße der Streuung können graphisch dargestellt sein (z.B. können Standardabweichungen als Balkendiagramm dargestellt werden), so lange diese Darstellungen eindeutig sind (z.B. so lange klar ist ob die Fehlerbalken Standardabweichungen oder Standardfehler darstellen). Für kategorische Outcomes (nominal- oder ordinalskaliert) gilt dieses Kriterium als erfüllt, wenn die Anzahl der Probanden für jede Kategorie in jeder Gruppe angegeben ist.

Erläuterung: Klinische Studien können relativ unverzerrte Schätzungen von Behandlungseffekten ermöglichen. Die beste Schätzung (Punktschätzung) des Behandlungseffekts ist die Differenz zwischen den Outcomes in der Behandlungsgruppe und der Kontrollgruppe (oder das Verhältnis beider zueinander). Ein Maß für den Grad der Unsicherheit, der mit dieser Schätzung verbunden ist, kann nur berechnet werden, wenn die Studie Angaben über die Streuungen der Messwerte liefert.

Für alle Kriterien

Punkte werden nur vergeben, wenn ein Kriterium eindeutig erfüllt ist. Falls beim genauen Lesen einer Arbeit die Möglichkeit besteht, dass ein Kriterium nicht erfüllt wurde, sollte kein Punkt für dieses Kriterium vergeben werden.

Für Kriterien 4 und 7-11

Zentrale Outcomes sind jene Outcomes, welche das primäre Maß für eine Effektivität (oder eine fehlende Effektivität) der Therapie darstellen. In den meisten Studien wird mehr als eine Variable zur Outcome-Messung verwendet.

PEDro-Skala Download

Download der nicht-komprimierten .pdf-Datei (PC/MAC)

Registrieren Sie sich für den PEDro Newsletter, um die aktuellsten Nachrichten zu erhalten