Hamilton Rating Scale for Depression
Le HAM-D est la mesure des résultats la plus fréquemment utilisée dans les essais cliniques sur le TDM et est considéré par beaucoup comme la norme pour l’évaluation de la dépression.40 Bien qu’il existe de nombreuses versions de cette échelle, l’échelle à 17 éléments est la version la plus fréquemment utilisée dans les essais d’efficacité.40 L’échelle est évaluée par un clinicien ; les évaluations sont faites sur la base d’un entretien clinique et d’informations supplémentaires disponibles, comme le rapport de la famille.36 En tant que mesure de la gravité des symptômes de la dépression, l’HAM-D17 aborde les symptômes somatiques et psychologiques de la dépression.49 Les items sont évalués sur une échelle de 5 points (spectre de 0 à 4) ou de 3 points (spectre de 0 à 2), sur laquelle des scores croissants représentent une gravité croissante des symptômes.41 Les scores des 17 items sont additionnés pour obtenir un score total de 52, ou 53 dans certaines versions.50 Comme le nombre d’options de réponse varie d’un item à l’autre, certains items contribuent davantage au score total que d’autres.41 Les instructions de notation du HAM-D17 indiquent qu’un score total compris entre 0 et 7 indique que le patient se situe dans la fourchette normale (pas de dépression), qu’un score compris entre 8 et 13 indique une » dépression légère « , qu’un score compris entre 14 et 18 indique une » dépression modérée « , qu’un score compris entre 19 et 22 indique une » dépression sévère » et qu’un score total de 23 ou plus indique une » dépression très sévère « .40
Bien que de nombreuses propriétés psychométriques du HAM-D17 soient adéquates et répondent systématiquement aux critères établis, certains défauts psychométriques et conceptuels ont également été identifiés.41 Les coefficients de fiabilité pour la cohérence interne ainsi que la fiabilité inter-juges et test-retest sont généralement bons pour l’échelle globale, tout comme les estimations de fiabilité interne pour les items individuels de l’échelle. Bien que la fiabilité inter-évaluateurs et la fiabilité test-retest de nombreux items soient faibles au niveau des items, l’utilisation de guides d’entrevue structurés peut augmenter la fiabilité des items individuels et de l’échelle totale.41 La validité de contenu de l’échelle HAM-D17 est faible, car il n’y a qu’un chevauchement partiel entre le contenu de cette échelle et les critères diagnostiques d’inclusion des symptômes du TDM du Manuel diagnostique et statistique des troubles mentaux, quatrième édition (DSM-IV).40 Certains symptômes du HAM-D17 ne sont pas des critères officiels du DSM-IV et, alors que certains de ces symptômes sont reconnus comme étant associés à la dépression (par exemple, l’anxiété psychique), le lien avec la dépression est plus ténu pour d’autres symptômes (par exemple, la perte d’intuition, l’hypocondrie).41 Inversement, des caractéristiques importantes des critères du DSM-IV pour la dépression, telles que les difficultés de concentration, le sentiment de dévalorisation et les symptômes végétatifs inversés, sont soit enfouies dans des items complexes, soit pas du tout saisies.41 La validité convergente de l’échelle HAM-D17 s’est avérée adéquate, puisque cette échelle présente une corrélation modérée à élevée avec de nombreuses autres échelles de dépression.41 De même, la validité discriminante de cette échelle s’est avérée adéquate.41 Plusieurs méta-analyses ont également montré que l’échelle HAM-D17 était plus sensible aux changements (réactivité) de l’état des patients que d’autres échelles de dépression, telles que l’inventaire de dépression de Beck.51,52 Cependant, la nature multidimensionnelle de l’échelle HAM-D17 peut réduire quelque peu sa sensibilité à la détection des changements dans la gravité de la dépression au fil du temps.53 Par exemple, il a été démontré que l’échelle complète HAM-D17 est moins sensible que les sous-échelles unidimensionnelles de ses items.54 Les sous-échelles fréquemment utilisées comprennent le Core (qui comprend des items liés aux symptômes dépressifs de base) et le Maier (qui comprend des items de base en plus d’items liés à l’anxiété et à l’agitation). Dans l’ensemble, certaines des propriétés psychométriques du HAM-D17 sont adéquates, mais certaines failles psychométriques et conceptuelles inhérentes demeurent.41
Deux résultats cliniquement importants sur le HAM-D17 sont fréquemment rapportés dans les essais d’efficacité : la réponse, définie comme une réduction de 50 % par rapport au score total du HAM-D17 de base ; et la rémission, généralement définie comme un score de 7 ou moins sur le score total du HAM-D17.40 Depuis qu’un groupe de consensus a recommandé en 1991 que le seuil de rémission soit un score ≤ 7,5510 ce niveau a été largement adopté dans les essais cliniques. Cependant, des données plus récentes ont suggéré que, sur la base d’une définition étroite de la rémission dans le DSM-IV, qui requiert une absence de symptômes cliniquement significatifs de dépression, le seuil optimal devrait être ≤ 2 sur le score total HAM-D17.Le niveau ≤ 7 a été jugé approprié lorsqu’on utilise une définition plus large de la rémission40. Pour les essais cliniques, le National Institute for Health and Care Excellence (NICE) a recommandé une différence de 3 points entre les groupes médicament et placebo comme critère de signification clinique,18 bien qu’aucune justification de ce chiffre n’ait été fournie.50 Dans les lignes directrices actualisées du NICE,56 il n’y avait aucune mention de ce qui constituait une différence cliniquement significative. Un rapport distinct de Montgomery et Möller a suggéré qu’une différence de deux points entre l’antidépresseur et le placebo pourrait être cliniquement pertinente,17 bien que, comme dans les directives du NICE, il semble que ce chiffre soit basé sur une opinion. Par conséquent, une différence minimale cliniquement importante (MCID) formellement dérivée ou une différence cliniquement significative fondée sur des preuves pour le HAM-D17 n’ont pas été identifiées.