a) |
in Reviews, die sich aus der computergestützten Recherche in den medizinischen Datenbanken ergaben (15, 16, 26, 27, 54, 77, 88, 89) |
b) |
von systematischen Reviews im Kapitel „Existing systematic reviews – Pain Reviews“ (59) |
c) |
in Monographien zur Kopfschmerz- und Migränetherapie sowie Standardwerken zur Schmerztherapie und allgemeinen Pharmakotherapie (21, 69, 78, 80, 95, 104, 105, 108) |
d) |
in Literatursammlungen der Autoren |
|
|
|
A |
I |
Erfüllung von mindestens 10 der 12 in Tabelle 4 genannten Kriterien und |
II |
Erreichen von mindestens 85 (von 100 möglichen) Punkten nach der Evaluationsmethode für kontrollierte klinische Studien von Evans & Pollock |
B |
I |
Erfüllung von mindestens 8 der 12 oben genannten Kriterien und |
II |
Erreichen von mindestens 65 (von 100 möglichen) Punkten nach der Evaluationsmethode für kontrollierte klinische Studien von Evans & Pollock |
C |
I |
Erfüllung von mindestens 6 der 12 oben genannten Kriterien und |
II |
Erreichen von mindestens 50 (von 100 möglichen) Punkten nach der Evaluationsmethode für kontrollierte klinische Studien von Evans & Pollock |
D |
|
Die Studie kann aufgrund schwerwiegender Mängel im Studiendesign, der statistischen Methodik, Analyse oder Interpretation nur als „sonstiges wissenschaftliches Erkenntnismaterial“ bzw. als Sammlung von Kasuistiken gewertet werden. |
|
Erfüllung folgender Kriterien: |
A |
a) mindestens eine randomisierte, kontrollierte klinische Studie, die in der Bewertung der Studienqualität die Stufe „A“ erreicht |
b) die Studie wurde an einer für die Selbstmedikation repräsentativen Patientenpopulation durchgeführt und besitzt damit direkte Relevanz für diese DMKG-Empfehlungen |
B |
a) mindestens zwei randomisierte, kontrollierte klinische Studien, die in der Bewertung der Studienqualität die Stufe „B“ erreichten |
b) mindestens eine dieser Studien wurde an einer für die Selbstmedikation repräsentativen Patientenpopulation durchgeführt |
C |
a) mindestens eine randomisierte, kontrollierte klinische Studie, die in der Bewertung der Studienqualität die Stufe „B“ oder „C“erreichte |
b) diese Studie wurde an einer für die Selbstmedikation repräsentativen Patientenpopulation durchgeführt |
D |
Es liegen keine randomisierten, kontrollierten klinischen Studien vor bzw. keine der Studien erreichte in der Bewertung der Studienmethodik die Stufe „C“ |
|
Erfüllung folgender Kriterien: |
+++ |
a) es liegt mindestens eine A-Studie vor, deren wissenschaftliche Evidenz mit „+++“ bewertet wurde. |
b) es liegen keine „negativen“ A-Studien vor, d.h. Studien, in denen der Wirkstoff bzw. die Wirkstoffkombination auf „Überlegenheit“ gegenüber Placebo getestet wurde und deren Ergebnis statistisch nicht signifikant war. |
c) Ergebnisse sind konsistent |
++ |
a) es liegt mindestens eine A-Studie vor, deren wissenschaftliche Evidenz mit „++“ bewertet wurde. |
b) es liegen keine „negativen“ A-Studien vor, d.h. Studien, in denen der Wirkstoff bzw. die Wirkstoffkombination auf „Überlegenheit“ gegenüber Placebo getestet wurde und deren Ergebnis statistisch nicht signifikant war. |
c) Ergebnisse sind konsistent |
+ |
a) es liegen mindestens zwei B-Studien vor, deren wissenschaftliche Evidenz mit „++“ bewertet wurde. |
b) es liegen keine „negativen“ A- oder B-Studien vor, d.h. Studien, in denen der Wirkstoff bzw. die Wirkstoffkombination auf „Überlegenheit“ gegenüber Placebo getestet wurde und deren Ergebnis statistisch nicht signifikant war. |
c) Ergebnisse sind konsistent. |
(+) |
a) der erzielte Effekt ist in in mindestens einer B-Studie aufgrund einer deskriptiv-explorativen Auswertung statistisch signifikant (z.B. sekundärer Endpunkt) und von klinischer Relevanz (mehr als ein minimaler klinischer Benefit) |
b) Ergebnisse sind konsistent. |
0 |
das Medikament erzielt keine erwünschten Wirkungen bzw. es liegen keine relevanten, kontrollierten klinischen Studien (mindestens B-Studien) vor. |
+++ |
Die Verträglichkeit von Medikamenten mit diesem Wirkstoff bzw. dieser Wirkstoffkombination ist bei den meisten Patienten bei bestimmungsgemäßem Gebrauch (Selbstmedikation) „gut“ bis „sehr gut“. |
++ |
Die Verträglichkeit von Medikamenten mit diesem Wirkstoff bzw. dieser Wirkstoffkombination ist bei einem größeren Teil der Patienten bei bestimmungsgemäßem Gebrauch (Selbstmedikation) „gut“ bis „sehr gut“. |
+ |
Die Verträglichkeit von Medikamenten mit diesem Wirkstoff bzw. dieser Wirkstoffkombination kann bei einem größeren Teil der Patienten bei bestimmungsgemäßem Gebrauch (Selbstmedikation) noch als „gut“ bezeichnet werden. |
0 |
Die Verträglichkeit von Medikamenten mit diesem Wirkstoff bzw. dieser Wirkstoffkombination kann bei einem größeren Teil der Patienten bei bestimmungsgemäßem Gebrauch (Selbstmedikation) nicht mehr als „gut“ bezeichnet werden. |
? |
Die Verträglichkeit kann nicht beurteilt werden, da der Wirkstoff bzw. die Wirkstoffkombination (bisher) nur wenig verwendet werden. |
„Mittel der 1. Wahl“: diese Empfehlung wurde nur vergeben, wenn |
a) |
die Qualität der wissenschaftlichen Evidenz mit „A“, |
b) |
die wissenschaftliche Evidenz der Wirksamkeit mindestens mit „++“ |
c) |
der klinische Eindruck der Wirksamkeit mindestens mit „++“ |
d) |
und die Verträglichkeit mindestens mit „++“ bewertet wurden. |
|
„Mittel der 2. Wahl“: diese Empfehlung wurde nur vergeben, wenn |
a) |
die Qualität der wissenschaftlichen Evidenz mit „B“, |
b) |
die wissenschaftliche Evidenz der Wirksamkeit mindestens mit „(+)“ |
c) |
der klinische Eindruck der Wirksamkeit mindestens mit „+“ |
d) |
und die Verträglichkeit mindestens mit „+“ bewertet wurden. |
|
„nur in Einzelfällen“: dieser Hinweis erfolgte, wenn |
a) |
die Qualität der wissenschaftlichen Evidenz mit „C oder D“, |
b) |
die wissenschaftliche Evidenz der Wirksamkeit schlechter als „(+)“ |
c) |
der klinische Eindruck der Wirksamkeit mindestens mit „+“ |
d) |
und die Verträglichkeit mindestens mit „+“ bewertet wurden. |
1. |
Die Studienqualität von lediglich 10 Studien konnte mit „A“ bewertet werden. Diese Studien wurden alle im Zeitraum zwischen 1996 und 2003 publiziert. Da nur bewertet werden kann, was publiziert ist, trägt neben den substantiellen Fortschritten in der Studienmethodik auch ihre adäquatere Publikation zu diesem Ergebnis bei. Besondere Bemühungen zur Verbesserung der Publikationsqualität klinischer Studien, wie beispielsweise das CONSORT Statement, fallen ebenfalls in diesen Zeitraum (1, 32, 41, 64, 91, 99). Die in diesen Empfehlungen angewandten Bewertungskriterien sind aber in ihren Kernpunkten seit mehreren Jahrzehnten „state of the art“ (2, 22, 76, 96, 97) und sollten somit auch Studien gerecht werden, die schon vor längerer Zeit durchgeführt und publiziert wurden. |
2. |
Auffallende methodische Schwachpunkte einer ganzen Reihe von Studien waren unter anderem:
- Fehlen der a priori Definition des primären (konfirmativ zu testenden) Endpunktes und fehlende Abgrenzung sekundärer (explorativ zu analysierender) Endpunkte
- in der Konsequenz: statistisches Testen multipler Endpunkte mit inadäquaten statistischen Methoden ohne oder mit nur unzureichender Adjustierung des gewählten Signifikanzniveaus.
- in der Folge: Fehlinterpretation der statistischen Ergebnisse. Sehr häufig war in diesem Zusammenhang das Heranziehen von- nach explorativer Analyse- statistisch signifikanten Ergebnissen sekundärer Endpunkte zum Beleg der Wirksamkeit einer Behandlung.
- Fehlen einer a priori Fallzahlberechnung mit der Folge zu geringer Fallzahlen (Power) (64)
- inadäquates Studiendesign - z.B. Wahl eines Superiority-Designs zur Beantwortung einer Fragestellung der Äquivalenz zweier Behandlungen, die ein Äquivalenz- oder Non-Inferiority Design erfordert – allerdings um den Preis einer wesentlich höheren Patientenzahl (ca. 4-fach gegenüber einem placebo-kontrollierten Superiority Design) (24, 44)
- Unzureichende Darstellung der Fragestellung, Studienmethodik, Durchführung und statistischen Analyse der Studie (z.B. fehlende oder unzureichende Angaben zur Verblindung, zum Procedere und zur Sicherstellung der Randomisierung, zu Studienabbrechern, zu Konfidenzintervallen) (23, 92)
- Fehlen einer Placebo-Kontrollgruppe und Beschränkung auf eine aktive Vergleichsbehandlung, für die unzutreffenderweise angenommen wird, dass ihre Wirksamkeit (in der verwandten Dosierung) nachgewiesen sei (unkritische Übertragung der Ergebnisse aus anderen Schmerzmodellen)
- Fehlen der Ergebnisse der ITT-(Intent-to-treat) Analyse bzw. ausschließliche Betrachtung der PP-(Per-Protokoll) Population (43)
|
3. |
Der therapeutische Effekt war in den älteren Studien fast immer größer als in den neueren „A“-Studien. Dieses in der Literatur oft beschriebene Phänomen wird auf verschiedene systematische Verzerrungen zurückgeführt. So kann durch ein inadäquates „allocation concealment“ der Behandlungseffekt um ca. 40% und durch ein inadäquates Randomisierungsprocedere bzw. unzureichende Verblindung um ca. 10% bzw. 17 % überschätzt werden (63, 90). |
4. |
Die Definition des primären Endpunktes war in den verschiedenen Studien uneinheitlich. Dies erschwerte die vergleichende Beurteilung der wissenschaftlichen Evidenz für die Wirksamkeit der einzelnen Wirkstoffe und Wirkstoffkombinationen. Die Studienergebnisse wurden bewertet, wie von den Studienautoren beschrieben. Eine sehr ambitionierte Formulierung des primären Endpunktes, welcher statistisch nicht zu sichern war, ging folglich „negativ“ in die Bewertung ein. |
5. |
Der Placeboeffekt variierte in den verschiedenen Studien stark. In den älteren war er im allgemeinen deutlich geringer, als in jenen aus den letzten Jahren. |