Articles

Propensity Score Analyse

Übersicht

Software

Beschreibung

Webseiten

Messwerte

Kurse

Übersicht

Die PS ist eine Wahrscheinlichkeit. Tatsächlich ist es eine bedingte Wahrscheinlichkeit, bei einer Reihe von Kovariaten, Pr(E + | Kovariaten), exponiert zu werden. Wir können eine PS für jedes Subjekt in einer Beobachtungsstudie unabhängig von ihrer tatsächlichen Exposition berechnen.

Sobald wir für jedes Motiv eine PS haben, kehren wir in die reale Welt von exposed und unexposed zurück. Wir können belichtete Probanden mit unbelichteten Probanden mit derselben (oder sehr ähnlichen) PS abgleichen. Somit ist die Wahrscheinlichkeit, exponiert zu werden, dieselbe wie die Wahrscheinlichkeit, unbelichtet zu werden. Die Belichtung ist „zufällig.“

Beschreibung

Propensity Score Analysis (PSA) entstand als eine Möglichkeit, Austauschbarkeit zwischen exponierten und unbelichteten Gruppen in Beobachtungsstudien zu erreichen, ohne sich auf traditionelle Modellbildung zu verlassen. Austauschbarkeit ist entscheidend für unsere kausale Schlussfolgerung.

In experimentellen Studien (z. B. randomisierten Kontrollstudien) beträgt die Wahrscheinlichkeit, exponiert zu werden, 0,5. Somit beträgt die Wahrscheinlichkeit, unbelichtet zu sein, ebenfalls 0,5. Die Wahrscheinlichkeit, exponiert oder unbelichtet zu werden, ist gleich. Daher ist der tatsächliche Expositionsstatus eines Probanden zufällig.

Diese gleiche Expositionswahrscheinlichkeit lässt uns bequemer behaupten, dass die exponierten und unbelichteten Gruppen in allen Faktoren außer ihrer Exposition gleich sind. Daher sagen wir, dass wir Austauschbarkeit zwischen Gruppen haben.

Eine der größten Herausforderungen bei Beobachtungsstudien besteht darin, dass die Wahrscheinlichkeit, in der exponierten oder nicht exponierten Gruppe zu sein, nicht zufällig ist.

Es gibt mehrere Fälle, in denen eine experimentelle Studie nicht durchführbar oder ethisch vertretbar ist. Wir möchten jedoch weiterhin, dass die Austauschbarkeit von Gruppen durch Randomisierung erreicht wird. PSA hilft uns, eine experimentelle Studie mit Daten aus einer Beobachtungsstudie nachzuahmen.

Durchführen von PSA

5 Kurz beschriebene Schritte zu PSA
1. Legen Sie die Menge der Kovariaten fest, die Sie einbeziehen möchten.
2. Verwenden Sie die logistische Regression, um eine PS für jedes Subjekt zu erhalten.
3. Passen Sie belichtete und unbelichtete Motive auf der PS an.
4. Überprüfen Sie das Gleichgewicht der Kovariaten in den exponierten und unbelichteten Gruppen nach dem Abgleich auf PS.
5. Berechnen Sie die Effektschätzung und die Standardfehler mit dieser Übereinstimmungspopulation.

1. Legen Sie die Menge der Kovariaten fest, die Sie einbeziehen möchten.
Dies ist der entscheidende Schritt zu Ihrem PSA. Wir verwenden diese Kovariaten, um unsere Expositionswahrscheinlichkeit vorherzusagen. Wir möchten alle Prädiktoren der Exposition und keine der Auswirkungen der Exposition einbeziehen. Wir berücksichtigen das Ergebnis nicht bei der Entscheidung über unsere Kovariaten. Wir können Störfaktoren und Interaktionsvariablen einbeziehen. Wenn wir Zweifel an der Kovariate haben, nehmen wir sie in unsere Kovariaten auf (es sei denn, wir glauben, dass es sich um einen Effekt der Exposition handelt).

2. Verwenden Sie die logistische Regression, um eine PS für jedes Subjekt zu erhalten.
Wir verwenden die Kovariaten, um die Wahrscheinlichkeit vorherzusagen, exponiert zu werden (was die PS ist). Je mehr echte Kovariaten wir verwenden, desto besser ist unsere Vorhersage der Wahrscheinlichkeit, exponiert zu werden. Wir berechnen ein PS für alle Probanden, belichtet und unbelichtet.

Mit Zahlen und griechischen Buchstaben:
ln(PS/(1-PS))= β0+ß1X1+…+ßpXp
PS= (exp(β0+ß1X1+…+ßpXp)) / (1+exp(β0 +ß1X1 +…+ßpXp))

3. Passen Sie belichtete und unbelichtete Motive auf der PS an.
Wir wollen die exponierten und unbelichteten Probanden auf ihre Wahrscheinlichkeit, exponiert zu werden (ihre PS), abstimmen. Wenn wir keine passende Übereinstimmung finden können, wird dieses Thema verworfen. Das Verwerfen eines Themas kann zu Verzerrungen in unserer Analyse führen.

Es gibt mehrere Methoden zum Abgleichen. Am häufigsten ist der nächste Nachbar innerhalb von Bremssätteln. Der nächste Nachbar wäre das unbelichtete Subjekt, das eine PS hat, die der PS für unser belichtetes Subjekt am nächsten liegt.

Wir können möglicherweise keine exakte Übereinstimmung finden, daher sagen wir, dass wir eine PS-Punktzahl innerhalb bestimmter Zeitgrenzen akzeptieren. Wir legen einen Apriori-Wert für die Bremssättel fest. Dieser Wert liegt typischerweise zwischen +/-0,01 und +/-0,05. Unter 0.01, wir können eine Menge Variabilität innerhalb der Schätzung erhalten, weil wir Schwierigkeiten haben, Übereinstimmungen zu finden, und dies führt dazu, dass wir diese Themen verwerfen (unvollständige Übereinstimmung). Wenn wir über 0,05 hinausgehen, sind wir möglicherweise weniger zuversichtlich, dass unsere belichteten und unbelichteten wirklich austauschbar sind (ungenaue Übereinstimmung). Typischerweise wird 0,01 für einen Cutoff gewählt.

Das Verhältnis von exponierten zu unbelichteten Probanden ist variabel. 1: 1-Matching kann durchgeführt werden, aber oft wird stattdessen ein Matching mit Ersatz durchgeführt, um bessere Matches zu ermöglichen. Das Abgleichen mit Ersatz ermöglicht es, das unbelichtete Subjekt, das mit einem belichteten Subjekt abgeglichen wurde, in den Pool der unbelichteten Subjekte zurückzugeben, die für das Abgleichen verfügbar sind.

Es gibt einen Kompromiss in Bias und Präzision zwischen Matching mit Ersatz und ohne (1:1). Matching mit Ersatz ermöglicht eine geringere Verzerrung aufgrund einer besseren Übereinstimmung zwischen den Probanden. Matching ohne Ersatz hat eine bessere Präzision, da mehr Themen verwendet werden.

4. Überprüfen Sie das Gleichgewicht der Kovariaten in den exponierten und unbelichteten Gruppen nach dem Abgleich auf PS.
Wesentliche Überschneidungen in den Kovariaten zwischen den exponierten und nicht exponierten Gruppen müssen bestehen, damit wir kausale Schlüsse aus unseren Daten ziehen können. Dies gilt für alle Modelle, aber in PSA wird es optisch sehr deutlich. Wenn es keine Überlappung der Kovariaten gibt (dh wenn wir keine Überlappung der Neigungswerte haben), werden alle Schlussfolgerungen außerhalb der Unterstützung der Daten gezogen (und somit wären die Schlussfolgerungen modellabhängig).

Wir können ein paar Werkzeuge verwenden, um unser Gleichgewicht der Kovariaten zu bewerten. Zuerst können wir ein Histogramm der PS für belichtete und unbelichtete Gruppen erstellen. Zweitens können wir den standardisierten Unterschied beurteilen. Drittens können wir die Bias-Reduktion bewerten.

Standardisierte Differenz=(100 *(Mittelwert(x belichtet) -(Mittelwert(x unbelichtet)))/(sqrt((SD ^ 2exposed+ SD^2unexposed)/2))

Mehr als 10% Unterschied gilt als schlecht. Unsere Kovariaten sind zu unterschiedlich zwischen exponierten und unbelichteten Gruppen verteilt, als dass wir uns wohl fühlen könnten, wenn wir die Austauschbarkeit zwischen Gruppen annehmen.
Bias reduction= 1-(|standardized difference matched/||standardized difference unmatched/)
Wir möchten eine wesentliche Reduzierung der Verzerrung von der nicht angepassten zur übereinstimmenden Analyse sehen. Was das bedeutet, liegt ganz bei Ihnen.
5. Berechnen Sie die Effektschätzung und die Standardfehler mit dieser übereinstimmenden Grundgesamtheit.
Schätzung des durchschnittlichen Behandlungseffekts der behandelten (ATT) = Summe (y exposed- y unexposed) / # der übereinstimmenden Paare
Standardfehler können mit Bootstrap-Resampling-Methoden berechnet werden.
Die resultierenden Matched Pairs können auch mit statistischen Standardmethoden analysiert werden, z.B. Kaplan-Meier, Cox Proportional Hazards Modelle. Sie können PS als kontinuierliche Kennzahl in das endgültige Analysemodell aufnehmen oder Quartile erstellen und schichten.

Noch ein paar Anmerkungen zu PSA
PSA kann für dichotome oder kontinuierliche Belichtungen verwendet werden.Da PSA nur gemessene Kovariaten adressieren kann, sollte die vollständige Implementierung eine Sensitivitätsanalyse umfassen, um unbeobachtete Kovariaten zu bewerten.
PSA kann in SAS, R und Stata verwendet werden. Dies sind Add-Ons, die zum Download zur Verfügung stehen.Obwohl PSA traditionell in der Epidemiologie und Biomedizin verwendet wurde, wurde es auch in Bildungstests (Rubin ist einer der Gründer) und Ökologie (EPA hat eine Website auf PSA!).

Stärken und Grenzen von PSA

Stärken
Können Interaktionsterme in die Berechnung von PSA einbeziehen.
PSA verwendet bei der Schätzung des Effekts einen Score anstelle mehrerer Kovariaten. Dies ermöglicht es einem Forscher, Dutzende von Kovariaten zu verwenden, was in herkömmlichen multivariablen Modellen aufgrund begrenzter Freiheitsgrade und Nullzählungszellen, die sich aus Schichtungen mehrerer Kovariaten ergeben, normalerweise nicht möglich ist.
Kann für dichotome und kontinuierliche Variablen verwendet werden (kontinuierliche Variablen hat viele laufende Forschung).Patienten, die in diese Studie einbezogen werden, können eine repräsentativere Stichprobe von „realen“ Patienten sein, als eine RCT liefern würde.
Da wir bei der Berechnung des PS keine Informationen über das Ergebnis verwenden, wird keine auf dem PS basierende Analyse die Effektschätzung verzerren.
Wir vermeiden Off-Support-Inferenz.
Wir verlassen uns weniger auf p-Werte und andere modellspezifische Annahmen.
Wir müssen die Ursachen des Ergebnisses nicht kennen, um Austauschbarkeit zu schaffen.

Einschränkungen
Die schwerwiegendste Einschränkung besteht darin, dass PSA nur für gemessene Kovariaten steuert.
Die Gruppenüberlappung muss erheblich sein (um einen angemessenen Abgleich zu ermöglichen).
Matching auf beobachteten Kovariaten kann Backdoor-Pfade in unbeobachteten Kovariaten öffnen und versteckte Verzerrungen verschärfen.
PSA funktioniert am besten in großen Proben, um ein gutes Gleichgewicht der Kovariaten zu erhalten.
Wenn wir fehlende Daten haben, erhalten wir eine fehlende PS.
Berücksichtigt nicht das Clustering (problematisch für die Forschung auf Nachbarschaftsebene).

Lesungen

Lehrbücher & Kapitel

Oakes JM und Johnson PJ. 2006. Propensity Score Matching für die Sozialepidemiologie in Methoden der Sozialepidemiologie (Hrsg. JM Oakes und JS Kaufman), Jossey-Bass, San Francisco, CA.
Einfache und klare Einführung in PSA mit einem Beispiel aus der Sozialepidemiologie.

Hirano K und Imbens GW. 2005. Der Propensity Score mit kontinuierlichen Behandlungen in angewandter Bayes’scher Modellierung und kausaler Inferenz aus unvollständigen Datenperspektiven: Eine wesentliche Reise mit Donald Rubins statistischer Familie (Hrsg. A Gelman und XL Meng), John Wiley & Sons, Ltd, Chichester, Vereinigtes Königreich.
Diskussion über die Verwendung von PSA für kontinuierliche Behandlungen.

Methodische Artikel

Rosenbaum PR und Rubin DB. 1983. Die zentrale Rolle des Propensity Scores in Beobachtungsstudien für kausale Effekte. Biometrika, 70(1); 41-55.
Germinal Artikel über PSA.

Rosenbaum PR und Rubin DB. 1985. Die Verzerrung aufgrund unvollständiger Übereinstimmung. Biometrika, 41(1); 103-116.
Diskussion der Verzerrung aufgrund unvollständiger Übereinstimmung der Probanden in PSA.

D’Agostino RB. 1998. Propensity Score Methoden zur Biasreduktion beim Vergleich einer Behandlung mit einer nicht-randomisierten Kontrollgruppe. Statist Med, 17; 2265-2281.
Eine weitere Diskussion von PSA mit Arbeitsbeispielen. Enthält Berechnungen von standardisierten Differenzen und Bias-Reduktion.

Joffe MM und Rosenbaum PR. 1999. Eingeladener Kommentar: Propensity Scores. Am J Epidemiol, 150(4); 327-333.
Diskussion der Verwendungen und Einschränkungen von PSA. Beinhaltet auch die Diskussion von PSA in Fallkohortenstudien.

Anwendungsartikel

Kumar S und Vollmer S. 2012. Der Zugang zu verbesserten sanitären Einrichtungen reduziert Durchfall im ländlichen Indien. Gesundheit Econ. DOI: 10.1002/hec.2809
Gilt PSA für Hygiene und Durchfall bei Kindern im ländlichen Indien. Viele Erklärungen, wie PSA in der Zeitung durchgeführt wurde. Gutes Beispiel.

Suh HS, Hay JW, Johnson KA und Doctor, JN. 2012. Vergleichende Wirksamkeit der Statin-Fibrat-Kombinationstherapie und der Statin-Monotherapie bei Patienten mit Typ-2-Diabetes: Verwendung von Propensity-Score-und Instrumental-Variable-Methoden zur Anpassung an die Behandlung-Auswahl-Bias.Pharmakoepidemiol und Arzneimittelsicherheit. Ursprungsbezeichnung: 10.1002/pds.3261
Wendet PSA auf Therapien für Typ-2-Diabetes an. Vergleicht auch PSA mit instrumentellen Variablen.

Rubin DB. 2001. Verwendung von Neigungswerten zur Gestaltung von Beobachtungsstudien: Anwendung auf die Tabakindustrie. Gesundheit und Ergebnisse Res-Methode, 2; 169-188.
Erweiterte Anwendung von PSA von einem der PSA-Urheber.

Landrum MB und Ayanian JZ. 2001. Kausale Wirkung der ambulanten Spezialversorgung auf die Mortalität nach Myokardinfarkt: Ein Vergleich der Neigung socre und instrumentelle Variablenanalyse. Gesundheit und Ergebnisse Res-Methode, 2; 221-245.
Ein gutes klares Beispiel für PSA, das auf die Mortalität nach MI angewendet wird. Vergleich mit IV-Methoden.

Bingenheimer JB, Brennan RT und Earls FJ. 2005. Exposition gegenüber Schusswaffengewalt und schwerwiegendes gewalttätiges Verhalten. Wissenschaft, 308; 1323-1326.Interessantes Beispiel für PSA, das auf die Exposition gegenüber Schusswaffengewalt und nachfolgendes schwerwiegendes gewalttätiges Verhalten angewendet wird.

Websites

Statistische Softwareimplementierung
Software zur Implementierung von Matching-Methoden und Propensity Scores:

Für SAS-Makro:
http://ndc.mayo.edu/mayo/research/biostat/sasmacros.cfmgmatch: Computergesteuerter Abgleich von Fällen mit Kontrollen unter Verwendung des Greedy-Matching-Algorithmus mit einer festen Anzahl von Kontrollen pro Fall.
vmatch: Computerized Matching von Fällen zu Kontrollen mit variabler optimaler Anpassung.

SAS-Dokumentation:

Für R-Programm:

Folien von Thomas Love 2003 ASA-Präsentation:

Ressourcen (Handouts, kommentierte Bibliographie) von Thomas Love:

Erklärung und Beispiel von ecology of PSA:

Kurse

Ein Online-Workshop zum Propensity Score Matching ist über EPIC verfügbar

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.