Propensity Score Analyse
Overzicht |
– Software |
Beschrijving |
Websites |
de Metingen |
Koersen |
Overzicht
De PS is een kans. In feite is het een voorwaardelijke kans om blootgesteld te worden gegeven aan een set covariaten, Pr (E+ / covariaten). We kunnen een PS berekenen voor elk onderwerp in een observationele studie, ongeacht haar werkelijke blootstelling.
zodra we een PS hebben voor elk onderwerp, keren we terug naar de echte wereld van exposed en unposed. We kunnen blootgestelde proefpersonen koppelen aan blootgestelde proefpersonen met dezelfde (of zeer vergelijkbare) PS. De kans op blootstelling is dus hetzelfde als de kans op blootstelling. De belichting is “willekeurig.”
Description
Neigingsscore analysis (PSA) is ontstaan als een manier om uitwisselbaarheid tussen blootgestelde en niet-blootgestelde groepen te bereiken in observationele studies zonder te vertrouwen op traditionele Modelbouw. Uitwisselbaarheid is cruciaal voor onze causale gevolgtrekking.
in experimentele studies (bijvoorbeeld gerandomiseerde controleproeven) is de kans op blootstelling 0,5. De kans op onbelichtheid is dus ook 0,5. De kans op blootstelling of belichting is hetzelfde. Daarom is de actuele blootstellingsstatus van een persoon willekeurig.
Deze gelijke kans op blootstelling maakt het ons comfortabeler te beweren dat de blootgestelde en niet-blootgestelde groepen op alle factoren behalve hun blootstelling gelijk zijn. Daarom zeggen we dat we uitwisselbaarheid hebben tussen groepen.
een van de grootste uitdagingen bij observationele studies is dat de kans dat men zich in de blootgestelde of niet-blootgestelde groep bevindt, niet willekeurig is.
Er zijn verschillende gevallen waarin een experimenteel onderzoek niet haalbaar of ethisch is. Maar we willen nog steeds dat de uitwisselbaarheid van groepen bereikt wordt door randomisatie. PSA helpt ons om een experimentele studie na te bootsen met behulp van gegevens uit een observationele studie.
uitvoeren PSA
5 kort beschreven stappen naar PSA
1. Beslis over de set van covariaten die u wilt opnemen.
2. Gebruik logistieke regressie om een PS te verkrijgen voor elk onderwerp.
3. Match blootgestelde en blootgestelde proefpersonen op de PS.
4. Controleer de balans van covariaten in de blootgestelde en niet-blootgestelde groepen na het matchen op PS.
5. Bereken de effectschatting en standaardfouten met deze matchpopulatie.
1. Beslis over de set van covariaten die u wilt opnemen.
Dit is de cruciale stap naar je PSA. We gebruiken deze covariaten om onze kans op blootstelling te voorspellen. We willen alle voorspellers van de blootstelling en geen van de effecten van de blootstelling. We kijken niet naar de uitkomst bij het beslissen over onze covarianten. We kunnen confounders en interactievariabelen bevatten. Als we twijfelen aan de covariant, nemen we het op in onze verzameling covarianten (tenzij we denken dat het een effect van de blootstelling is).
2. Gebruik logistieke regressie om een PS te verkrijgen voor elk onderwerp.
We gebruiken de covariaten om de kans op blootstelling te voorspellen (dat is de PS). Hoe meer echte covariaten we gebruiken, hoe beter onze voorspelling van de kans om blootgesteld te worden. We berekenen een PS voor alle proefpersonen, blootgesteld en onbelicht.
met cijfers en Griekse letters:
ln (PS/(1-PS))= β0+ß1X1+…+ßpXp
PS= (exp(β0+ß1X1+…+ßpXp)) / (1+exp(β0 +ß1X1 +…+ßpXp))
3. Match blootgestelde en blootgestelde proefpersonen op de PS.
We willen de blootgestelde en niet-blootgestelde personen vergelijken op hun kans om blootgesteld te worden (hun PS). Als we geen geschikte match kunnen vinden, dan wordt dat onderwerp weggegooid. Het weggooien van een persoon kan vooringenomenheid in onze Analyse introduceren.
Er bestaan verschillende methoden voor matching. Het meest voorkomende is de dichtstbijzijnde buur binnen beugels. De dichtstbijzijnde buur zou de onbelichte persoon zijn die een PS heeft die het dichtst bij de PS van onze blootgestelde persoon ligt.
we kunnen mogelijk geen exacte overeenkomst vinden, dus zeggen we dat we een PS-score binnen bepaalde kaliper grenzen zullen accepteren. We hebben een apriori waarde ingesteld voor de remklauwen. Deze waarde varieert meestal van + / -0,01 tot +/-0,05. Minder dan 0.01, kunnen we veel variabiliteit binnen de schatting krijgen omdat we moeite hebben om overeenkomsten te vinden en dit leidt ons om die proefpersonen te verwerpen (onvolledige matching). Als we voorbij 0.05 gaan, kunnen we minder zeker zijn dat onze blootgestelde en onbelichte echt uitwisselbaar zijn (onnauwkeurige matching). Typisch, 0.01 wordt gekozen voor een cut-off.
de verhouding tussen blootgestelde en niet-blootgestelde personen is variabel. 1: 1 matching kan worden gedaan, maar vaak matching met vervanging wordt gedaan in plaats daarvan om betere wedstrijden toe te staan. Matching with replacement maakt het mogelijk om het niet-blootgestelde onderwerp dat is gekoppeld aan een blootgestelde persoon terug te sturen naar de pool van niet-blootgestelde personen die beschikbaar zijn voor matching.
Er is een trade-off in bias en precisie tussen matching met vervanging en zonder (1:1). Matching met vervanging zorgt voor verminderde bias vanwege een betere matching tussen proefpersonen. Matching zonder vervanging heeft een betere precisie omdat er meer onderwerpen worden gebruikt.
4. Controleer de balans van covariaten in de blootgestelde en niet-blootgestelde groepen na het matchen op PS.er moet een aanzienlijke overlap bestaan in covariaten tussen de blootgestelde en niet-blootgestelde groepen om causale gevolgtrekkingen uit onze gegevens te kunnen maken. Dit is waar in alle modellen, maar in PSA, het wordt visueel zeer duidelijk. Als er geen overlapping is in covariaten (dat wil zeggen als we geen overlapping hebben van neigingsscores), dan zouden alle gevolgtrekkingen worden gemaakt van ondersteuning van de gegevens (en dus zouden conclusies modelafhankelijk zijn).
we kunnen een paar tools gebruiken om onze balans van covariaten te beoordelen. Eerst kunnen we een histogram maken van de PS voor blootgestelde en niet-blootgestelde groepen. Ten tweede kunnen we het gestandaardiseerde verschil beoordelen. Ten derde kunnen we de bias reduction beoordelen.
gestandaardiseerd verschil = (100*(mean (x exposed)-(mean (x exposed)))/(sqrt((SD^2 exposed+ SD^2 un Exposed)/2))
meer dan 10% verschil wordt als slecht beschouwd. Onze covariaten zijn te verschillend verdeeld tussen blootgestelde en niet-blootgestelde groepen zodat we ons comfortabel voelen als we de uitwisselbaarheid tussen groepen aannemen.
Bias reduction = 1 – (|standardized difference matched/||standardized difference unmatched/)
We zouden graag een substantiële reductie in bias zien van de ongeëvenaarde naar de gematchte analyse. Welke substantiële middelen zijn aan jou.
5. Bereken de effectschatting en standaardfouten met deze overeenkomende populatie.
schatting van het gemiddelde behandelingseffect van de behandelde(ATT)=Som (y exposed – y unposed)/# van overeenkomende paren
standaardfouten kunnen worden berekend met behulp van bootstrap resampling methoden.
De resulterende overeenkomende paren kunnen ook worden geanalyseerd met behulp van standaard statistische methoden, bijvoorbeeld Kaplan-Meier, Cox proportional hazards modellen. U kunt PS in het eindanalysemodel opnemen als een continue maat of kwartielen maken en stratificeren.
nog een paar opmerkingen over PSA
PSA kunnen worden gebruikt voor dichotome of continue blootstellingen.
omdat PSA alleen gemeten covariaten kan aanpakken, moet de volledige implementatie gevoeligheidsanalyse omvatten om niet-geobserveerde covariaten te beoordelen.
PSA kan gebruikt worden in Sas, R en Stata. Dit zijn add-ons die beschikbaar zijn om te downloaden.hoewel PSA traditioneel wordt gebruikt in epidemiologie en biogeneeskunde, wordt het ook gebruikt in educatieve testen (Rubin is een van de oprichters) en ecologie (EPA heeft een website over PSA!).
sterktes en beperkingen van PSA
sterktes
Kunnen interactietermen omvatten bij het berekenen van PSA.
PSA gebruikt één score in plaats van meerdere covariaten bij het schatten van het effect. Dit staat een onderzoeker toe om tientallen covariaten te gebruiken, wat gewoonlijk niet mogelijk is in traditionele multivariabele modellen vanwege beperkte vrijheidsgraden en nultelling cellen die voortvloeien uit stratificaties van meerdere covariaten.
Kan gebruikt worden voor dichotome en continue variabelen (continue variabelen hebben veel lopend onderzoek).
patiënten in deze studie kunnen een meer representatieve steekproef van “echte” patiënten zijn dan een RCT zou opleveren.
omdat we geen informatie over de uitkomst gebruiken bij het berekenen van de PS, zal geen analyse op basis van de PS effectschatting beïnvloeden.
We vermijden Off-support gevolgtrekking.
We vertrouwen minder op p-waarden en andere modelspecifieke aannames.we hoeven de oorzaken van de uitkomst niet te kennen om uitwisselbaarheid te creëren.
Beperkingen
de ernstigste beperking is dat PSA alleen controleert voor gemeten covariabelen.
groepsoverlapping moet aanzienlijk zijn (om passende matching mogelijk te maken).
Matching op waargenomen covariaten kan achterdeurpaden openen in niet-geobserveerde covariaten en verborgen vooringenomenheid verergeren.
PSA werkt het beste in grote monsters om een goede balans van covariaten te verkrijgen.
als we ontbrekende gegevens hebben, krijgen we een ontbrekende PS.
houdt geen rekening met clustering (problematisch voor buurtonderzoek).
lezingen
tekstboeken & Hoofdstukken
Oakes JM and Johnson PJ. 2006. Neigingsscore matching voor sociale epidemiologie in methoden in sociale Epidemiologie (eds. JM Oakes en JS Kaufman), Jossey-Bass, San Francisco, CA.
Eenvoudige en duidelijke inleiding tot PSA met gewerkt voorbeeld uit sociale epidemiologie.
Hirano K en Imbens GW. 2005. De neigingsscore met continue behandelingen in Toegepaste Bayesiaanse modellering en causale gevolgtrekking vanuit Incomplete data perspectieven: een essentiële reis met Donald Rubin ‘ s statistische familie( eds. A Gelman and XL Meng), John Wiley & Sons, Ltd, Chichester, UK.discussie over het gebruik van PSA voor continue behandelingen.
methodologische artikelen
Rosenbaum PR en Rubin DB. 1983. De centrale rol van de neigingsscore in observationele studies voor causale effecten. Biometrika, 70(1); 41-55.
Germinaal artikel over PSA.
Rosenbaum PR en Rubin DB. 1985. De vooringenomenheid door onvolledige matching. Biometrika, 41 (1); 103-116.discussie over de bias als gevolg van onvolledige matching van proefpersonen in PSA.
D ‘ Agostino RB. 1998. Neigingsscore methoden voor bias reductie in de vergelijking van een behandeling met een niet-gerandomiseerde controlegroep. Statist Med, 17; 2265-2281.een verdere bespreking van PSA met werkvoorbeelden. Inclusief berekeningen van gestandaardiseerde verschillen en bias reductie.
Joffe MM en Rosenbaum PR. 1999. Uitgenodigd commentaar: neigingen scores. Am J Epidemiol, 150 (4); 327-333.bespreking van het gebruik en de beperkingen van PSA. Omvat ook bespreking van PSA in case-cohort studies.
Toepassingsartikelen
Kumar s en Vollmer S. 2012. Heeft toegang tot verbeterde sanitaire voorzieningen te verminderen diarree op het platteland van India. Gezondheid Econ. DOI: 10.1002 / hec.2809
Past PSA toe op sanitaire voorzieningen en diarree bij kinderen op het Indiase platteland. Veel uitleg over hoe PSA werd uitgevoerd in de krant. Goed voorbeeld.
Suh HS, Hay JW, Johnson KA, And Doctor, JN. 2012. Vergelijkende effectiviteit van statine plus fibraat combinatietherapie en statine monotherapie bij patiënten met type 2 diabetes: gebruik van neigingsscore en instrumentele variabele methoden om aan te passen voor de selectie van de behandeling.Pharmacoepidemiol en Drug veiligheid. DOI: 10.1002 / pds.
Past PSA toe op therapieën voor type 2 diabetes. Vergelijkt ook PSA met instrumentele variabelen.
Rubin DB. 2001. Gebruik van neigenheidsscores om observationele studies te helpen ontwerpen: toepassing op de Tobacco litigation. Gezondheid Serv Uitkomsten Res Methode, 2; 169-188.
meer geavanceerde toepassing van PSA door een van PSA ‘ s initiators.
Landrum MB en Ayanian JZ. 2001. Causaal effect van ambulante specialty care op mortaliteit na myocardinfarct: een vergelijking van de neiging socre en instrumentele variabele analyse. Health Serv Outcomes Res Method, 2; 221-245.een goed duidelijk voorbeeld van PSA toegepast op mortaliteit na MI. Vergelijking met IV methoden.Bingenheimer JB, Brennan RT, en Earls FJ. 2005. Blootstelling aan vuurwapen geweld en ernstig gewelddadig gedrag. Wetenschap, 308; 1323-1326.interessant voorbeeld van PSA toegepast op blootstelling aan vuurwapen geweld en daaropvolgende ernstig gewelddadig gedrag.
Websites
implementatie van statistische Software
Software voor het implementeren van matchingmethoden en voorkeursscores:
voor SAS macro:
http://ndc.mayo.edu/mayo/research/biostat/sasmacros.cfmgmatch: geautomatiseerde matching van cases aan besturingselementen met behulp van het greedy matching algoritme met een vast aantal besturingselementen per geval.
vmatch: geautomatiseerde matching van cases aan controles met behulp van variabele optimale matching.
SAS-documentatie:
voor R-programma:
Slides from Thomas Love 2003 ASA presentation:
Resources (handouts, annotated bibliography) from Thomas Love:
uitleg en voorbeeld uit ecology of PSA:
Courses
een online workshop over het matchen van de Neigingsscore is beschikbaar via EPIC