Articles

Analyse du Score de propension

Aperçu

Logiciel

Description

Sites Web

Lectures

Cours

Aperçu

Le PS est une probabilité. En fait, il s’agit d’une probabilité conditionnelle d’être exposée compte tenu d’un ensemble de covariables, Pr(E+|covariables). Nous pouvons calculer un PS pour chaque sujet dans une étude observationnelle quelle que soit son exposition réelle.

Une fois que nous avons un PS pour chaque sujet, nous retournons ensuite dans le monde réel des exposés et des non exposés. Nous pouvons associer des sujets exposés à des sujets non exposés avec le même PS (ou très similaire). Ainsi, la probabilité d’être exposé est la même que la probabilité d’être non exposé. L’exposition est « aléatoire. »

Description

L’analyse du score de propension (PSA) est apparue comme un moyen d’obtenir une échangeabilité entre les groupes exposés et non exposés dans les études observationnelles sans s’appuyer sur la construction de modèles traditionnels. L’échangeabilité est essentielle à notre inférence causale.

Dans les études expérimentales (par exemple, les essais contrôlés randomisés), la probabilité d’exposition est de 0,5. Ainsi, la probabilité d’être non exposé est également de 0,5. La probabilité d’être exposé ou non exposé est la même. Par conséquent, l’état d’exposition réel d’un sujet est aléatoire.

Cette probabilité égale d’exposition nous rend plus à l’aise d’affirmer que les groupes exposés et non exposés sont semblables sur tous les facteurs sauf leur exposition. Par conséquent, nous disons que nous avons une échangeabilité entre les groupes.

L’un des plus grands défis des études observationnelles est que la probabilité d’être dans le groupe exposé ou non exposé n’est pas aléatoire.

Il y a plusieurs occasions où une étude expérimentale n’est pas réalisable ou éthique. Mais nous aimerions toujours l’échangeabilité des groupes obtenue par randomisation. Le PSA nous aide à imiter une étude expérimentale en utilisant les données d’une étude observationnelle.

Conduite de PSA

5 Étapes brièvement décrites pour PSA
1. Décidez de l’ensemble des covariables que vous souhaitez inclure.
2. Utilisez la régression logistique pour obtenir un PS pour chaque sujet.
3. Faites correspondre les sujets exposés et non exposés sur le PS.
4. Vérifiez l’équilibre des covariables dans les groupes exposés et non exposés après l’appariement sur PS.
5. Calculez l’estimation de l’effet et les erreurs types avec cette population de correspondance.

1. Décidez de l’ensemble des covariables que vous souhaitez inclure.
C’est l’étape critique de votre PSA. Nous utilisons ces covariables pour prédire notre probabilité d’exposition. Nous voulons inclure tous les prédicteurs de l’exposition et aucun des effets de l’exposition. Nous ne prenons pas en compte le résultat pour décider de nos covariables. Nous pouvons inclure des facteurs de confusion et des variables d’interaction. Si nous avons un doute sur la covariable, nous l’incluons dans notre ensemble de covariables (sauf si nous pensons qu’il s’agit d’un effet de l’exposition).

2. Utilisez la régression logistique pour obtenir un PS pour chaque sujet.
Nous utilisons les covariables pour prédire la probabilité d’être exposé (qui est le PS). Plus nous utilisons de covariables vraies, meilleure est notre prédiction de la probabilité d’être exposé. Nous calculons un PS pour tous les sujets, exposés et non exposés.

En utilisant des chiffres et des lettres grecques :
ln(PS/(1-PS)) = β0 +ß1X1+…+ßpXp
PS =(exp(β0+ß1X1+… +ßpXp))/(1+exp(β0+ß1X1+…+ßpXp))

3. Faites correspondre les sujets exposés et non exposés sur le PS.
Nous voulons faire correspondre les sujets exposés et non exposés sur leur probabilité d’être exposés (leur PS). Si nous ne pouvons pas trouver une correspondance appropriée, alors ce sujet est écarté. Le rejet d’un sujet peut introduire un biais dans notre analyse.

Plusieurs méthodes de correspondance existent. Le plus commun est le voisin le plus proche des étriers. Le voisin le plus proche serait le sujet non exposé qui a un PS le plus proche du PS pour notre sujet exposé.

Nous ne pourrons peut-être pas trouver une correspondance exacte, nous disons donc que nous accepterons un score PS dans certaines limites d’étrier. Nous définissons une valeur apriori pour les étriers. Cette valeur varie généralement de +/-0,01 à +/-0,05. En dessous de 0.01, nous pouvons obtenir beaucoup de variabilité dans l’estimation car nous avons du mal à trouver des correspondances, ce qui nous amène à écarter ces sujets (correspondance incomplète). Si nous dépassons 0,05, nous pouvons être moins sûrs que nos exposés et non exposés sont vraiment échangeables (correspondance inexacte). Typiquement, 0,01 est choisi pour une coupure.

Le rapport entre les sujets exposés et les sujets non exposés est variable. l’appariement 1: 1 peut être fait, mais souvent l’appariement avec le remplacement est fait à la place pour permettre de meilleures correspondances. L’appariement avec remplacement permet au sujet non exposé qui a été apparié avec un sujet exposé d’être renvoyé dans le pool de sujets non exposés disponibles pour l’appariement.

Il existe un compromis en biais et en précision entre l’appariement avec remplacement et sans (1:1). La correspondance avec le remplacement permet de réduire le biais en raison d’une meilleure correspondance entre les sujets. L’appariement sans remplacement a une meilleure précision car plus de sujets sont utilisés.

4. Vérifiez l’équilibre des covariables dans les groupes exposés et non exposés après l’appariement sur PS.
Un chevauchement substantiel des covariables entre les groupes exposés et non exposés doit exister pour que nous puissions faire des inférences causales à partir de nos données. Cela est vrai dans tous les modèles, mais dans PSA, cela devient visuellement très apparent. S’il n’y a pas de chevauchement des covariables (c’est-à-dire si nous n’avons pas de chevauchement des scores de propension), toutes les inférences seraient faites hors support des données (et donc, les conclusions seraient dépendantes du modèle).

Nous pouvons utiliser quelques outils pour évaluer notre équilibre des covariables. Tout d’abord, nous pouvons créer un histogramme du PS pour les groupes exposés et non exposés. Deuxièmement, nous pouvons évaluer la différence standardisée. Troisièmement, nous pouvons évaluer la réduction du biais.

Différence normalisée =(100*(moyenne (x exposée) – (moyenne (x non exposée)))/(sqrt((SD^2 exposée + SD^2 non exposée) /2))

Une différence de plus de 10% est considérée comme mauvaise. Nos covariables sont réparties trop différemment entre les groupes exposés et non exposés pour que nous puissions nous sentir à l’aise en supposant une échangabilité entre les groupes.
Réduction du biais = 1 – (|différence normalisée appariée /|| différence normalisée non appariée /)
Nous aimerions voir une réduction substantielle du biais de l’analyse non appariée à l’analyse appariée. Quels moyens substantiels dépend de vous.
5. Calculez l’estimation de l’effet et les erreurs types avec cette population appariée.
Estimation de l’effet moyen du traitement du traité (ATT) = somme (y exposé – y non exposé) / nombre de paires appariées
Les erreurs types peuvent être calculées à l’aide de méthodes de rééchantillonnage bootstrap.
Les paires appariées résultantes peuvent également être analysées à l’aide de méthodes statistiques standard, par exemple les modèles de risques proportionnels de Kaplan-Meier, Cox. Vous pouvez inclure PS dans le modèle d’analyse finale en tant que mesure continue ou créer des quartiles et stratifier.

Quelques notes supplémentaires sur le PSA
Le PSA peut être utilisé pour des expositions dichotomiques ou continues.
Comme le PSA ne peut traiter que les covariables mesurées, la mise en œuvre complète devrait inclure une analyse de sensibilité pour évaluer les covariables non observées.
PSA peut être utilisé dans SAS, R et Stata. Ce sont des modules complémentaires disponibles en téléchargement.
Bien que le PSA ait traditionnellement été utilisé en épidémiologie et en biomédecine, il a également été utilisé dans les tests éducatifs (Rubin est l’un des fondateurs) et en écologie (l’EPA a un site Web sur le PSA!).

Forces et limites du PSA

Les forces
Peuvent inclure des termes d’interaction dans le calcul du PSA.
Le PSA utilise un score au lieu de plusieurs covariables pour estimer l’effet. Cela permet à un chercheur d’utiliser des dizaines de covariables, ce qui n’est généralement pas possible dans les modèles multivariables traditionnels en raison de degrés de liberté limités et de cellules à comptage nul résultant de stratifications de plusieurs covariables.
Peut être utilisé pour les variables dichotomiques et continues (les variables continues ont beaucoup de recherches en cours).
Les patients inclus dans cette étude peuvent constituer un échantillon de patients « du monde réel” plus représentatif qu’un ECR ne le fournirait.
Comme nous n’utilisons aucune information sur le résultat lors du calcul du PS, aucune analyse basée sur le PS ne biaisera l’estimation de l’effet.
Nous évitons l’inférence hors support.
Nous nous appuyons moins sur les valeurs p et d’autres hypothèses spécifiques au modèle.
Nous n’avons pas besoin de connaître les causes du résultat pour créer l’échangeabilité.

Limitations
La limitation la plus grave est que le PSA ne contrôle que les covariables mesurées.
Le chevauchement des groupes doit être important (pour permettre une correspondance appropriée).
La correspondance sur les covariables observées peut ouvrir des chemins de porte dérobée dans les covariables non observées et exacerber les biais cachés.
Le PSA fonctionne mieux dans de grands échantillons pour obtenir un bon équilibre des covariables.
Si nous avons des données manquantes, nous obtenons un PS manquant.
Ne prend pas en compte le clustering (problématique pour la recherche au niveau du quartier).

Lectures

Manuels &Chapitres

Oakes JM et Johnson PJ. 2006. Appariement des scores de propension pour l’épidémiologie sociale dans les méthodes d’épidémiologie sociale (eds. JM Oakes et JS Kaufman), Jossey-Bass, San Francisco, Californie.
Introduction simple et claire à l’APS avec un exemple travaillé d’épidémiologie sociale.

Hirano K et Imbens GW. 2005. The propensity score with continuous treatments in Applied Bayesian Modeling and Causal Inference from Incomplete-Data Perspectives: An Essential Journey with Donald Rubin’s Statistical Family (eds. Un Gelman et XL Meng), John Wiley &Sons, Ltd, Chichester, Royaume-Uni.
Discussion sur l’utilisation du PSA pour les traitements continus.

Articles méthodologiques

Rosenbaum PR et Rubin DB. 1983. Le rôle central du score de propension dans les études observationnelles pour les effets causaux. Biometrika, 70(1); 41-55.
Article germinal sur le PSA.

Rosenbaum PR et Rubin DB. 1985. Le biais dû à une correspondance incomplète. Biometrika, 41(1); 103-116.
Discussion du biais dû à l’appariement incomplet des sujets dans l’APS.

D’Agostino RB. 1998. Méthodes de score de propension pour la réduction des biais dans la comparaison d’un traitement à un groupe témoin non randomisé. Statistique Med, 17; 2265-2281.
Une discussion plus approfondie du PSA avec des exemples travaillés. Comprend le calcul des différences normalisées et la réduction des biais.

Joffe MM et Rosenbaum PR. 1999. Commentaires invités: Scores de propension. Am J Epidemiol, 150 (4); 327-333.
Discussion sur les utilisations et les limites du PSA. Comprend également une discussion sur l’APS dans les études de cohorte de cas.

Articles d’application

Kumar S et Vollmer S. 2012. L’accès à un assainissement amélioré réduit-il la diarrhée en Inde rurale? Econ Santé. DOI: 10.1002/hec.2809
Applique le PSA à l’assainissement et à la diarrhée chez les enfants en Inde rurale. Beaucoup d’explications sur la façon dont l’APS a été menée dans le document. Bon exemple.

Suh HS, Hay JW, Johnson KA et Doctor, JN. 2012. Efficacité comparative de la thérapie combinée à la statine et au fibrate et de la statine en monothérapie chez les patients atteints de diabète de type 2: utilisation de méthodes de score de propension et de variables instrumentales pour ajuster le biais de sélection du traitement.Pharmacoépidémiol et sécurité des médicaments. DOI: 10.1002/pds.3261
Applique le PSA aux traitements du diabète de type 2. Compare également le PSA avec des variables instrumentales.

Rubin DB. 2001. Utilisation des scores de propension pour aider à concevoir des études d’observation: Application au litige sur le tabac. Résultats des services de santé Méthode Res, 2; 169-188.
Application plus avancée du PSA par l’un des initiateurs du PSA.

Landrum MB et Ayanian JZ. 2001. Causal effect of ambulatory specialty care on mortality following myocardial infarctus: A comparison of propensity socre and instrumental variable analysis. Méthode des résultats des services de santé, 2; 221-245.
Un bon exemple clair de PSA appliqué à la mortalité après l’IM. Comparaison avec les méthodes IV.

Bingenheimer JB, Brennan RT et Earls FJ. 2005. Exposition à la violence par arme à feu et comportement violent grave. Science, 308; 1323-1326.
Exemple intéressant de PSA appliqué à l’exposition à la violence par arme à feu et au comportement violent grave subséquent.

Sites Web

Implémentation d’un logiciel statistique
Logiciel de mise en œuvre de méthodes de mise en correspondance et de scores de propension :

Pour la macro SAS:
http://ndc.mayo.edu/mayo/research/biostat/sasmacros.cfmgmatch : Mise en correspondance informatisée des cas aux contrôles à l’aide de l’algorithme de mise en correspondance gourmande avec un nombre fixe de contrôles par cas.
vmatch: Correspondance informatisée des cas aux contrôles à l’aide d’une correspondance optimale variable.

Documentation SAS :

Pour le programme R:

Diapositives de Thomas Love 2003 Présentation de l’ASA:

Ressources (documents, bibliographie annotée) de Thomas Love:

Explication et exemple de l’écologie du PSA:

Cours

Un atelier en ligne sur l’appariement des scores de propension est disponible via EPIC

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *