Hamilton Rating Scale for Depression
Die HAM-D ist die am häufigsten verwendete Outcome-Messung in klinischen Studien zu MDD und wird von vielen als Standard für die Bewertung von Depressionen angesehen.40 Es gibt zwar zahlreiche Versionen dieser Skala, aber die 17-Elemente-Skala ist die in Wirksamkeitsstudien am häufigsten verwendete Version.40 Die Skala wird von einem Kliniker bewertet; die Bewertung erfolgt auf der Grundlage eines klinischen Interviews und zusätzlicher verfügbarer Informationen, wie z. B. Familienberichte.36 Als Maß für den Schweregrad der depressiven Symptome erfasst die HAM-D17 sowohl somatische als auch psychologische Symptome der Depression.49 Die Items werden entweder auf einer 5-Punkte-Skala (Spektrum von 0 bis 4) oder auf einer 3-Punkte-Skala (Spektrum von 0 bis 2) bewertet, wobei steigende Punktzahlen für einen zunehmenden Schweregrad der Symptome stehen.41 Die Punktzahlen für die 17 Items werden addiert, um einen Gesamtwert von 52 bzw. 53 in einigen Versionen zu erhalten.50 Da die Anzahl der Antwortmöglichkeiten von Item zu Item variiert, tragen bestimmte Items mehr zum Gesamtscore bei als andere.41 In den Instruktionen zur Auswertung des HAM-D17 heißt es, dass ein Gesamtwert von 0 bis 7 anzeigt, dass der Patient im Normalbereich liegt (keine Depression), ein Wert von 8 bis 13 eine „leichte Depression“, 14 bis 18 eine „mittelschwere Depression“, 19 bis 22 eine „schwere Depression“ und ein Gesamtwert von 23 oder mehr eine „sehr schwere Depression“ anzeigt.40
Während viele der psychometrischen Eigenschaften des HAM-D17 adäquat sind und durchweg etablierten Kriterien entsprechen, wurden auch einige psychometrische und konzeptionelle Mängel festgestellt.41 Die Reliabilitätskoeffizienten für die interne Konsistenz sowie die Interrater- und Test-Retest-Reliabilität sind im Allgemeinen gut für die Gesamtskala, ebenso wie die internen Reliabilitätsschätzungen für die einzelnen Items der Skala. Obwohl zahlreiche Items eine schwache Interrater- und Test-Retest-Reliabilität auf Item-Ebene aufweisen, kann die Verwendung strukturierter Interviewleitfäden die Reliabilität einzelner Items und der Gesamtskala erhöhen.41 Die Inhaltsvalidität des HAM-D17 ist gering, da es nur eine teilweise Überschneidung zwischen dem Inhalt dieser Skala und den diagnostischen und statistischen Kriterien des Diagnostic and Statistical Manual of Mental Disorders, Fourth Edition (DSM-IV) zur Aufnahme von Symptomen für MDD gibt.40 Einige Symptome auf der HAM-D17 sind keine offiziellen DSM-IV-Kriterien, und während einige dieser Symptome als mit Depressionen assoziiert anerkannt sind (z. B. psychische Angst), ist die Verbindung zu Depressionen bei anderen Symptomen (z. B. Verlust der Einsichtsfähigkeit, Hypochondrie) eher dürftig.41 Umgekehrt sind wichtige Merkmale der DSM-IV-Kriterien für Depressionen, wie Konzentrationsschwierigkeiten, Gefühle der Wertlosigkeit und umgekehrte vegetative Symptome, entweder in komplexen Items verborgen oder werden überhaupt nicht erfasst.41 Die konvergente Validität der HAM-D17 hat sich als angemessen erwiesen, da diese Skala eine mäßige bis hohe Korrelation mit vielen anderen Depressionsskalen aufweist.41 Auch die diskriminante Validität dieser Skala hat sich als angemessen erwiesen.41 Mehrere Meta-Analysen haben außerdem ergeben, dass die HAM-D17 im Vergleich zu anderen Depressionsskalen, wie dem Beck Depression Inventory, empfindlicher auf Veränderungen im Zustand der Patienten reagiert (responsive).51,52 Die multidimensionale Natur des HAM-D17 kann jedoch seine Sensitivität bei der Erkennung von Veränderungen des Schweregrads der Depression im Laufe der Zeit etwas verringern.53 So hat sich beispielsweise gezeigt, dass die vollständige HAM-D17-Skala weniger empfindlich ist als eindimensionale Unterskalen ihrer Items.54 Zu den häufig verwendeten Unterskalen gehören die Kernskala (umfasst Items, die sich auf depressive Kernsymptome beziehen) und die Maier-Skala (umfasst Kernitems zusätzlich zu Items, die sich auf Angst und Unruhe beziehen). Insgesamt sind einige der psychometrischen Eigenschaften des HAM-D17 adäquat, jedoch bleiben einige inhärente psychometrische und konzeptionelle Mängel bestehen.41
Zwei klinisch wichtige Ergebnisse des HAM-D17 werden häufig in Wirksamkeitsstudien berichtet: Ansprechen, definiert als eine 50%ige Verringerung des HAM-D17-Gesamtwerts gegenüber dem Ausgangswert, und Remission, im Allgemeinen definiert als ein Wert von 7 oder weniger im HAM-D17-Gesamtwert.40 Seit ein Konsensgremium 1991 empfahl, dass der Grenzwert für eine Remission ein Wert von ≤ 7 sein sollte,5510 wurde dieser Wert in klinischen Studien weitgehend übernommen. Neuere Erkenntnisse deuten jedoch darauf hin, dass auf der Grundlage einer engen Definition von Remission im DSM-IV, die das Fehlen klinisch signifikanter Symptome der Depression voraussetzt, der optimale Cut-off-Wert ≤ 2 auf dem HAM-D17-Gesamtscore sein sollte.40 Der Wert ≤ 7 wurde bei Verwendung einer breiteren Definition von Remission als angemessen erachtet.40 Für klinische Studien empfahl das National Institute for Health and Care Excellence (NICE) einen Unterschied von 3 Punkten zwischen der Medikamenten- und der Placebogruppe als Kriterium für die klinische Signifikanz,18 obwohl diese Zahl nicht begründet wurde.50 In den aktualisierten NICE-Leitlinien56 wurde nicht erwähnt, was einen klinisch signifikanten Unterschied ausmacht. Ein separater Bericht von Montgomery und Möller schlug vor, dass ein Unterschied von zwei Punkten zwischen Antidepressivum und Placebo klinisch relevant sein könnte,17 obwohl diese Zahl, ähnlich wie die NICE-Leitlinien, offenbar auf Meinungen beruht. Daher wurde weder ein formal abgeleiteter minimaler klinisch wichtiger Unterschied (MCID) noch ein evidenzbasierter klinisch signifikanter Unterschied für den HAM-D17 ermittelt.