Articles

Puntuación de Propensión Análisis

Resumen

Software

Descripción

los Sitios web

Lecturas

Cursos

Descripción

El PS es una probabilidad. De hecho, es una probabilidad condicional de estar expuesto dado un conjunto de covariables, Pr (E + |covariables). Podemos calcular un PS para cada sujeto en un estudio observacional, independientemente de su exposición real.

Una vez que tenemos un PS para cada sujeto, volvemos al mundo real de expuesto y no expuesto. Podemos comparar sujetos expuestos con sujetos no expuestos con el mismo (o muy similar) PS. Por lo tanto, la probabilidad de estar expuesto es la misma que la probabilidad de no estar expuesto. La exposición es » aleatoria.»

Descripción

El análisis de puntuación de propensión (PSA) surgió como una forma de lograr la intercambiabilidad entre grupos expuestos y no expuestos en estudios observacionales sin depender de la construcción de modelos tradicionales. La intercambiabilidad es crítica para nuestra inferencia causal.

En estudios experimentales (por ejemplo, ensayos de control aleatorizados), la probabilidad de exposición es de 0,5. Por lo tanto, la probabilidad de no ser expuesta también es de 0,5. La probabilidad de estar expuesto o no expuesto es la misma. Por lo tanto, el estado de exposición real de un sujeto es aleatorio.

Esta misma probabilidad de exposición nos hace sentir más cómodos afirmando que los grupos expuestos y no expuestos son iguales en todos los factores, excepto en su exposición. Por lo tanto, decimos que tenemos intercambiabilidad entre grupos.

Uno de los mayores desafíos con los estudios observacionales es que la probabilidad de estar en el grupo expuesto o no expuesto no es aleatoria.

Hay varias ocasiones en las que un estudio experimental no es factible o ético. Pero todavía nos gustaría que la intercambiabilidad de los grupos se lograra mediante aleatorización. El PSA nos ayuda a imitar un estudio experimental utilizando datos de un estudio observacional.

Realizar el PSA

5 Pasos descritos brevemente para alcanzar el PSA
1. Decida el conjunto de covariables que desea incluir.
2. Utilice la regresión logística para obtener una PS para cada sujeto.
3. Coinciden con sujetos expuestos y no expuestos en el PS.
4. Verifique el equilibrio de covariables en los grupos expuestos y no expuestos después de emparejar en PS.
5. Calcule la estimación del efecto y los errores estándar con esta población de coincidencias.

1. Decida el conjunto de covariables que desea incluir.Este es el paso crítico para su PSA. Usamos estas covariables para predecir nuestra probabilidad de exposición. Queremos incluir todos los predictores de la exposición y ninguno de los efectos de la exposición. No consideramos el resultado al decidir sobre nuestras covariables. Podemos incluir factores de confusión y variables de interacción. Si tenemos dudas sobre la covariable, la incluimos en nuestro conjunto de covariables (a menos que pensemos que es un efecto de la exposición).

2. Utilice la regresión logística para obtener una PS para cada sujeto.
Utilizamos las covariables para predecir la probabilidad de exposición (que es el PS). Cuantas más covariables verdaderas utilicemos, mejor será nuestra predicción de la probabilidad de exposición. Calculamos un PS para todos los sujetos, expuestos y no expuestos.

el Uso de los números y las letras griegas:
ln(P/(1-PS))= β0+ß1X1+…+ßpXp
PS= (exp(β0+ß1X1+…+ßpXp)) / (1+exp(β0 +ß1X1 +…+ßpXp))

3. Coinciden con sujetos expuestos y no expuestos en el PS.Queremos emparejar a los sujetos expuestos y no expuestos en su probabilidad de estar expuestos (su PS). Si no podemos encontrar una coincidencia adecuada, entonces ese sujeto es descartado. Descartar un sujeto puede introducir sesgos en nuestro análisis.

Existen varios métodos para emparejar. Lo más común es el vecino más cercano dentro de las pinzas. El vecino más cercano sería el sujeto no expuesto que tiene un PS más cercano al PS de nuestro sujeto expuesto.

Es posible que no podamos encontrar una coincidencia exacta, por lo que decimos que aceptaremos una puntuación PS dentro de ciertos límites. Fijamos un valor a priori para las pinzas. Este valor suele oscilar entre + / -0,01 y + / -0,05. Por debajo de 0.01, podemos obtener mucha variabilidad dentro de la estimación porque tenemos dificultades para encontrar coincidencias y esto nos lleva a descartar esos sujetos (coincidencia incompleta). Si pasamos de 0.05, podemos estar menos seguros de que nuestros expuestos y no expuestos son verdaderamente intercambiables (coincidencia inexacta). Por lo general, se elige 0,01 para un corte.

La proporción de sujetos expuestos a sujetos no expuestos es variable. se puede hacer una coincidencia de 1:1, pero a menudo la coincidencia con el reemplazo se hace en su lugar para permitir mejores coincidencias. El emparejamiento con reemplazo permite que el sujeto no expuesto que ha sido emparejado con un sujeto expuesto sea devuelto al grupo de sujetos no expuestos disponibles para emparejamiento.

Existe un equilibrio en el sesgo y la precisión entre el emparejamiento con reemplazo y el no (1:1). El emparejamiento con reemplazo permite reducir el sesgo debido a una mejor coincidencia entre los sujetos. El emparejamiento sin reemplazo tiene mejor precisión porque se utilizan más sujetos.

4. Verifique el equilibrio de covariables en los grupos expuestos y no expuestos después de emparejar en PS.Debe existir una superposición sustancial en las covariables entre los grupos expuestos y no expuestos para que podamos hacer inferencias causales a partir de nuestros datos. Esto es cierto en todos los modelos, pero en el PSA, se vuelve visualmente muy evidente. Si no hay superposición en las covariables (es decir, si no tenemos superposición de puntuaciones de propensión), entonces todas las inferencias se harían fuera del soporte de los datos (y, por lo tanto, las conclusiones dependerían del modelo).

Podemos usar un par de herramientas para evaluar nuestro equilibrio de covariables. En primer lugar, podemos crear un histograma de la PS para grupos expuestos y no expuestos. En segundo lugar, podemos evaluar la diferencia estandarizada. En tercer lugar, podemos evaluar la reducción del sesgo.

Diferencia estandarizada = (100*(media(x expuesta)-(media(x no expuesta)))/(sqrt ((SD^2exposed+ SD^2unexposed)/2))

Se considera mala diferencia de más del 10%. Nuestras covariables se distribuyen de manera demasiado diferente entre grupos expuestos y no expuestos para que nos sintamos cómodos asumiendo intercambiabilidad entre grupos.
Reducción de sesgo = 1 – (|diferencia estandarizada emparejada/||diferencia estandarizada no igualada/)
Nos gustaría ver una reducción sustancial en el sesgo del análisis no igualado al emparejado. Qué medios sustanciales depende de ti.
5. Calcule la estimación del efecto y los errores estándar con esta población coincidente.
Estimación del efecto promedio del tratamiento del TCA tratado=suma (y expuesto – y no expuesto) / # de pares emparejados
Los errores estándar se pueden calcular utilizando métodos de remuestreo de arranque.Los pares emparejados resultantes también se pueden analizar utilizando métodos estadísticos estándar, por ejemplo, modelos de riesgos proporcionales de Kaplan-Meier y Cox. Puede incluir PS en el modelo de análisis final como medida continua o crear cuartiles y estratificar.

Algunas notas más sobre el PSA
El PSA se puede utilizar para exposiciones dicotómicas o continuas.Debido a que el PSA solo puede abordar las covariables medidas, la implementación completa debe incluir un análisis de sensibilidad para evaluar las covariables no observadas.
El PSA se puede usar en SAS, R y Stata. Estos son complementos que están disponibles para descargar.
Aunque el PSA se ha utilizado tradicionalmente en epidemiología y biomedicina, también se ha utilizado en pruebas educativas (Rubin es uno de los fundadores) y ecología (EPA tiene un sitio web en PSA!).

Concentraciones y limitaciones del PSA

Concentraciones
Pueden incluir términos de interacción para calcular el PSA.el PSA utiliza una puntuación en lugar de múltiples covariables para estimar el efecto. Esto permite que un investigador use docenas de covariables, lo que generalmente no es posible en modelos multivariables tradicionales debido a los grados limitados de libertad y las células de recuento cero que surgen de estratificaciones de múltiples covariables.
Se puede usar para variables dicotómicas y continuas (las variables continuas tienen mucha investigación en curso).Los pacientes incluidos en este estudio pueden ser una muestra más representativa de pacientes del» mundo real » de lo que proporcionaría un ECA.Dado que no utilizamos ninguna información sobre el resultado al calcular el PS, ningún análisis basado en el PS sesgará la estimación del efecto.Evitamos inferencias fuera de soporte.Dependemos menos de los valores p y otros supuestos específicos del modelo.No necesitamos conocer las causas del resultado para crear intercambiabilidad.

Limitaciones
La limitación más grave es que el PSA solo controla las covariables medidas.La superposición de grupos debe ser sustancial (para permitir una correspondencia adecuada).La coincidencia en covariables observadas puede abrir caminos de puerta trasera en covariables no observadas y exacerbar el sesgo oculto.
El PSA funciona mejor en muestras grandes para obtener un buen equilibrio de covariables.
Si nos faltan datos, obtenemos un PS faltante.
No tiene en cuenta el agrupamiento (problemático para la investigación a nivel de vecindario).

Lecturas

Libros de texto & Capítulos

Oakes JM y Johnson PJ. 2006. Coincidencia de puntuación de propensión para epidemiología social en Métodos de Epidemiología social (eds. JM Oakes y JS Kaufman), Jossey-Bass, San Francisco, CA.Introducción simple y clara al PSA con un ejemplo práctico de epidemiología social.

Hirano K e Imbens GW. 2005. The propensity score with continuous treatments in Applied Bayesian Modeling and Causal Inference from Incomplete-Data Perspectives: An Essential Journey with Donald Rubin’s Statistical Family (eds. A Gelman y XL Meng), John Wiley & Sons, Ltd, Chichester, Reino Unido.Discusión sobre el uso del PSA para tratamientos continuos.

Artículos metodológicos

Rosenbaum PR y Rubin DB. 1983. El papel central de la puntuación de propensión en los estudios observacionales de efectos causales. Biometrika, 70( 1); 41-55.Artículo Germinal en PSA.

Rosenbaum PR y Rubin DB. 1985. El sesgo debido a la coincidencia incompleta. Biometrika, 41 (1); 103-116.Discusión del sesgo debido al emparejamiento incompleto de los sujetos en el PSA.

D’Agostino RB. 1998. Métodos de puntuación de propensión para la reducción del sesgo en la comparación de un tratamiento con un grupo control no aleatorizado. Statist Med, 17; 2265-2281.
Una discusión adicional del PSA con ejemplos trabajados. Incluye cálculos de diferencias estandarizadas y reducción de sesgos.

Joffe MM y Rosenbaum PR. 1999. Comentario invitado: Puntuaciones de propensión. Am J Epidemiol, 150 (4); 327-333.Discusión de los usos y limitaciones del PSA. También incluye una discusión del APE en estudios de casos y cohortes.

Artículos de aplicación

Kumar S y Vollmer S. 2012. El acceso a mejores servicios de saneamiento reduce la diarrea en las zonas rurales de la India. Salud Econ. DOI: 10.1002 / hec.2809
Aplica el PSA al saneamiento y la diarrea en niños de zonas rurales de la India. Muchas explicaciones sobre cómo se llevó a cabo el PSA en el artículo. Buen ejemplo.

Suh HS, Hay JW, Johnson KA, y Doctor, JN. 2012. Eficacia comparativa de la terapia combinada con estatinas y fibrato y la monoterapia con estatinas en pacientes con diabetes tipo 2: uso de puntuación de propensión y métodos variables instrumentales para ajustar el sesgo de selección del tratamiento.Farmacoepidemiol y Seguridad de los Medicamentos. DOI: 10.1002 / pds.3261
Aplica el PSA a las terapias para la diabetes tipo 2. También compara el PSA con variables instrumentales.

Rubin DB. 2001. Using propensity scores to help design observational studies: Application to the tobacco litigation (en inglés). Método Res de Resultados de Servicios de Salud, 2; 169-188.Aplicación más avanzada de PSA por uno de los creadores de PSA.

Landrum MB y Ayanian JZ. 2001. Efecto causal de la atención especializada ambulatoria en la mortalidad tras un infarto de miocardio: Comparación de la propensión al socre y el análisis de variables instrumentales. Método Res de resultados de Servicios de Salud, 2; 221-245.Un buen ejemplo claro de PSA aplicado a la mortalidad después de un infarto de miocardio. Comparación con métodos IV.

Bingenheimer JB, Brennan RT y Earls FJ. 2005. Exposición a la violencia con armas de fuego y comportamiento violento grave. Science, 308; 1323-1326.Ejemplo interesante de PSA aplicado a la exposición a la violencia con armas de fuego y el comportamiento violento grave subsiguiente.

Sitios web

Implementación de software estadístico
Software para implementar métodos de coincidencia y puntuaciones de propensión:

Para macro SAS:
http://ndc.mayo.edu/mayo/research/biostat/sasmacros.cfmgmatch: Coincidencia computarizada de casos a controles utilizando el algoritmo de coincidencia codicioso con un número fijo de controles por caso.
vmatch: Coincidencia computarizada de casos a controles utilizando coincidencia óptima de variables.

Documentación SAS:

Para el programa R:

Diapositivas de Thomas Love 2003 Presentación ASA:

Recursos (folletos, bibliografía anotada) de Thomas Love:

Explicación y ejemplo de ecology of PSA:

Cursos

Un taller en línea sobre Emparejamiento de puntuación de Propensión está disponible a través de EPIC

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *