Analiza skłonności
przegląd |
oprogramowanie |
opis |
strony internetowe |
lektury |
kursy |
przegląd
prawdopodobieństwo. W rzeczywistości jest to warunkowe prawdopodobieństwo ujawnienia, biorąc pod uwagę zbiór kowariatów, Pr (e+|kowariaty). Możemy obliczyć PS dla każdej osoby w badaniu obserwacyjnym, niezależnie od jej rzeczywistego narażenia.
gdy mamy PS dla każdego tematu, wracamy do realnego świata eksponowanych i nieeksponowanych. Możemy dopasować eksponowane przedmioty z nienaświetlonymi przedmiotami o tym samym (lub bardzo podobnym) PS. Tak więc prawdopodobieństwo bycia odsłoniętym jest takie samo jak prawdopodobieństwo bycia nienaświetlonym. Ekspozycja jest ” przypadkowa.”
opis
Analiza punktowa skłonności (PSA) powstała jako sposób na osiągnięcie wymienności między grupami narażonymi i nienaświetlonymi w badaniach obserwacyjnych bez polegania na tradycyjnym budowaniu modelu. Wymienność ma kluczowe znaczenie dla naszego wnioskowania przyczynowego.
w badaniach eksperymentalnych (np. randomizowanych badaniach kontrolnych) prawdopodobieństwo ekspozycji wynosi 0,5. Tak więc prawdopodobieństwo bycia nienaświetlonym wynosi również 0,5. Prawdopodobieństwo bycia odsłoniętym lub nienaświetlonym jest takie samo. W związku z tym rzeczywisty stan narażenia podmiotu jest losowy.
to równe prawdopodobieństwo narażenia sprawia, że czujemy się bardziej komfortowo twierdząc, że grupy narażone i nienaświetlone są podobne pod względem wszystkich czynników, z wyjątkiem ich narażenia. Dlatego mówimy, że mamy wymienność między grupami.
jednym z największych wyzwań w badaniach obserwacyjnych jest to, że prawdopodobieństwo bycia w grupie narażonej lub nienaświetlonej nie jest przypadkowe.
istnieje kilka przypadków, w których badanie eksperymentalne nie jest wykonalne lub etyczne. Ale nadal chcielibyśmy, aby wymienność grup była osiągana przez randomizację. PSA pomaga nam naśladować badanie eksperymentalne, wykorzystując dane z badania obserwacyjnego.
prowadzenie PSA
5 krótko opisane kroki do PSA
1. Wybierz zestaw zmiennych, które chcesz uwzględnić.
2. Użyj regresji logistycznej, aby uzyskać PS dla każdego przedmiotu.
3. Dopasuj eksponowane i nienaświetlone obiekty na PS.
4. Sprawdź balans współzmiennych w grupach odsłoniętych i nienaświetlonych po dopasowaniu na PS.
5. Oblicz oszacowanie efektu i standardowe błędy z tą populacją dopasowania.
1. Wybierz zestaw zmiennych, które chcesz uwzględnić.
To jest krytyczny krok do Twojego PSA. Używamy tych zmiennych do przewidywania naszego prawdopodobieństwa narażenia. Chcemy uwzględnić wszystkie predyktory ekspozycji i żaden z efektów ekspozycji. Nie bierzemy pod uwagę wyniku przy podejmowaniu decyzji o naszych współzmiennych. Możemy uwzględnić czynniki zakłócające i zmienne interakcji. Jeśli mamy wątpliwości co do współzmienności, włączamy ją do naszego zbioru współzmienności (chyba że uważamy, że jest to efekt ekspozycji).
2. Użyj regresji logistycznej, aby uzyskać PS dla każdego przedmiotu.
używamy kowariatów do przewidywania prawdopodobieństwa narażenia (czyli PS). Im więcej prawdziwych współzmiennych używamy, tym lepiej przewidujemy prawdopodobieństwo bycia ujawnionym. Obliczamy PS dla wszystkich przedmiotów, narażonych i nienaświetlonych.
używając cyfr i liter greckich:
LN(PS/(1-PS))= β0+ß1X1+…+ßpXp
PS= (exp (β0+ß1X1+…+ßpXp)) / (1+exp (β0 +ß1X1 +…+ßpXp))
3. Dopasuj eksponowane i nienaświetlone obiekty na PS.
chcemy dopasować odsłonięte i nienaświetlone obiekty do ich prawdopodobieństwa odsłonięcia (ich PS). Jeśli nie możemy znaleźć odpowiedniego dopasowania, to przedmiot jest odrzucany. Odrzucenie obiektu może wprowadzić stronniczość do naszej analizy.
istnieje kilka metod dopasowywania. Najczęściej jest to najbliższy sąsiad w obrębie zacisków. Najbliższy sąsiad byłby niedoświetlonym podmiotem, który ma PS najbliższe PS dla naszego narażonego podmiotu.
możemy nie być w stanie znaleźć dokładnego dopasowania, więc mówimy, że zaakceptujemy wynik PS w określonych granicach. Ustawiliśmy wartość apriori dla suwmiarek. Wartość ta zazwyczaj waha się od +/ – 0,01 do +/ – 0,05. Poniżej 0.01, możemy uzyskać dużą zmienność w oszacowaniu, ponieważ mamy trudności ze znalezieniem dopasowań, a to prowadzi nas do odrzucenia tych przedmiotów (niekompletne dopasowanie). Jeśli przekroczymy 0.05, możemy być mniej pewni, że nasze odsłonięte i nienaświetlone są naprawdę wymienne (niedokładne dopasowanie). Zazwyczaj 0.01 jest wybierane dla odcięcia.
stosunek ekspozycji do osób nienaświetlonych jest zmienny. Dopasowanie 1:1 może być wykonane, ale często dopasowanie z wymianą odbywa się zamiast tego, aby umożliwić lepsze dopasowania. Dopasowanie z wymianą pozwala na dopasowanie nienaświetlonego podmiotu, który został dopasowany do odsłoniętego podmiotu, aby powrócić do puli nienaświetlonych podmiotów dostępnych do dopasowania.
istnieje kompromis między dopasowaniem z wymianą i bez (1:1). Dopasowanie z wymianą pozwala na zmniejszenie uprzedzeń z powodu lepszego dopasowania między obiektami. Dopasowanie bez wymiany ma lepszą precyzję, ponieważ używa się więcej obiektów.
4. Sprawdź balans współzmiennych w grupach odsłoniętych i nienaświetlonych po dopasowaniu na PS.
znaczące nakładanie się współzmiennych między grupami narażonymi i nienaświetlonymi musi istnieć, abyśmy mogli wnioskować przyczynowo z naszych danych. Jest to prawdą we wszystkich modelach, ale w PSA staje się wizualnie bardzo widoczne. Jeśli nie ma nakładania się kowariatów (tj. jeśli nie mamy nakładania się wyników skłonności), to wszystkie wnioski byłyby wykonane poza wsparciem danych (a zatem wnioski byłyby zależne od modelu).
możemy użyć kilku narzędzi do oceny naszej równowagi współzmiennych. Po pierwsze, możemy utworzyć histogram PS dla grup odsłoniętych i nienaświetlonych. Po drugie, możemy ocenić standaryzowaną różnicę. Po trzecie, możemy ocenić redukcję stronniczości.
Standaryzowana różnica=(100*(średnia(x naświetlone)-(średnia(X nie naświetlone))/(sqrt((SD^2 naświetlone+ SD^2 naświetlone)/2))
ponad 10% różnicy jest uważane za złe. Nasze współzmienne są rozmieszczone zbyt różnie między odsłoniętymi i nienaświetlonymi grupami, abyśmy mogli czuć się komfortowo zakładając wymienność między grupami.
redukcja odchylenia= 1-(|standaryzowana różnica dopasowana|/|standaryzowana różnica niezrównana|)
chcielibyśmy zobaczyć znaczne zmniejszenie odchylenia od niezrównanej do dopasowanej analizy. Co istotne środki zależy od Ciebie.
5. Oblicz oszacowanie efektu i standardowe błędy z tą dopasowaną populacją.
oszacowanie średniego efektu leczenia leczonych (ATT)=sum(y narażone – y nienaświetlone)/# dopasowanych par
Standardowe błędy można obliczyć za pomocą metod resamplingu bootstrap.
wynikowe pary dopasowane można również analizować za pomocą standardowych metod statystycznych, np. Kaplana-Meiera, modeli proporcjonalnych zagrożeń Coxa. Możesz włączyć PS do końcowego modelu analizy jako miarę ciągłą lub utworzyć kwartyle i stratyfikację.
kilka uwag na temat PSA
PSA można wykorzystać do ekspozycji dychotomicznych lub ciągłych.
ponieważ PSA może dotyczyć tylko mierzonych współzmiennych, pełna implementacja powinna obejmować analizę wrażliwości w celu oceny nieobserwowanych współzmiennych.
PSA można stosować w SAS, R i Stata. Są to dodatki, które są dostępne do pobrania.
chociaż PSA tradycyjnie był stosowany w epidemiologii i Biomedycynie, był również używany w testach edukacyjnych (Rubin jest jednym z założycieli) i ekologii (EPA ma stronę internetową na temat PSA!).
mocne strony i ograniczenia PSA
mocne strony
mogą obejmować Warunki interakcji przy obliczaniu PSA.
PSA używa jednego wyniku zamiast wielu zmiennych współzmiennych w szacowaniu efektu. Pozwala to badaczowi używać dziesiątek współzmiennych, co zwykle nie jest możliwe w tradycyjnych modelach wielozmiennych z powodu ograniczonego stopnia swobody i zerowej liczby komórek wynikających z rozwarstwień wielu współzmiennych.
może być używany do zmiennych dychotomicznych i ciągłych (zmienne ciągłe mają wiele bieżących badań).
pacjenci włączeni do tego badania mogą być bardziej reprezentatywną próbką „prawdziwych” pacjentów niż RCT.
ponieważ nie używamy żadnych informacji na temat wyniku przy obliczaniu PS, Żadna analiza oparta na PS nie spowoduje estymacji efektu.
unikamy wnioskowania off-support.
w mniejszym stopniu opieramy się na wartościach p i innych założeniach specyficznych dla modelu.
nie musimy znać przyczyn wyniku, aby stworzyć wymienność.
Ograniczenia
najpoważniejszym ograniczeniem jest to, że PSA kontroluje tylko zmierzone współzmienne.
nakładanie się grupy musi być znaczne (aby umożliwić odpowiednie dopasowanie).
dopasowanie obserwowanych współzmiennych może otwierać ścieżki backdoor w niezauważonych współzmiennych i nasilać Ukryte odchylenie.
PSA działa najlepiej w dużych próbkach, aby uzyskać dobrą równowagę zmiennych.
Jeśli mamy brakujące dane, otrzymujemy brakujące PS.
nie bierze pod uwagę klastrowania (problematyczne dla badań na poziomie sąsiedztwa).
Lektury
podręczniki & rozdziały
2006. Propensity score matching for social epidemiology in Methods in Social Epidemiology (eds. JM Oakes i js Kaufman), Jossey-Bass, San Francisco, CA.
proste i czytelne wprowadzenie do PSA na przykładzie epidemiologii społecznej .
Hirano K i Imbens GW. 2005. The propensity score with continuous treatments in Applied Bayesian Modeling and Causal Inference from Incomplete-Data Perspectives: an Essential Journey with Donald Rubin ’ s Statistical Family (eds. Gelman i XL Meng), John Wiley & Sons, Ltd, Chichester, UK.
dyskusja na temat stosowania PSA w leczeniu ciągłym.
Artykuły metodyczne
Rosenbaum PR i Rubin DB. 1983. Centralna rola skali skłonności w badaniach obserwacyjnych dla skutków przyczynowych. Biometrika, 70( 1); 41-55.
artykuł Germinalny na temat PSA.
Rosenbaum PR i Rubin DB. 1985. Błąd wynikający z niepełnego dopasowania. Biometrika, 41(1); 103-116.
dyskusja nad tendencją wynikającą z niepełnego dopasowania badanych w PSA .
D ’ Agostino RB. 1998. Metody oceny skłonności do redukcji odchylenia w porównaniu leczenia do niezdolomizowanej grupy kontrolnej. Statist Med, 17; 2265-2281.
dalsza dyskusja na temat PSA z wypracowanymi przykładami. Obejmuje obliczenia znormalizowanych różnic i redukcji odchylenia.
Joffe MM i Rosenbaum PR. 1999. Zaproszony komentarz: wyniki skłonności. Am J., 150 (4); 327-333.
omówienie zastosowań i ograniczeń PSA . Obejmuje również omówienie PSA w badaniach kohortowych.
Artykuły aplikacyjne
Kumar S I Vollmer S. 2012. Czy dostęp do lepszych warunków sanitarnych zmniejsza biegunkę w wiejskich Indiach. Zdrowie Econ. DOI: 10.1002 / hec.2809
stosuje PSA do warunków sanitarnych i biegunki u dzieci na obszarach wiejskich Indii. Wiele wyjaśnień na temat tego, jak PSA było prowadzone w artykule. Dobry przykład.
Suh HS, Hay JW, Johnson KA, I Doctor, JN. 2012. Porównawcza skuteczność leczenia skojarzonego statyną z fibratem i monoterapią statyną u pacjentów z cukrzycą typu 2: Zastosowanie metod oceny skłonności i zmiennych instrumentalnych w celu dostosowania do nastawienia wyboru leczenia.Farmakoepidemiol i bezpieczeństwo leków. DOI: 10.1002 / pds.3261
stosuje PSA w leczeniu cukrzycy typu 2. Porównuje również PSA ze zmiennymi instrumentalnymi.
Rubin DB. 2001. Wykorzystanie wyników skłonności do projektowania badań obserwacyjnych: zastosowanie do sporów dotyczących tytoniu. Health Serv Outcomes Res Method, 2; 169-188.
bardziej zaawansowane zastosowanie PSA przez jednego z twórców PSA.
Landrum MB i Ayanian JZ. 2001. Przyczynowy wpływ ambulatoryjnej opieki specjalistycznej na śmiertelność po zawale mięśnia sercowego: porównanie skłonności do zawału z analizą zmiennych instrumentalnych. Health Serv Outcomes Res Method, 2; 221-245.
dobry wyraźny przykład PSA zastosowanego do śmiertelności po zawale mięśnia sercowego. Porównanie z metodami IV.
Bingenheimer JB, Brennan RT i Earls FJ. 2005. Narażenie na przemoc z użyciem broni palnej i poważne brutalne zachowanie. Nauka, 308; 1323-1326.
ciekawy przykład PSA zastosowanego do narażenia na przemoc z użyciem broni palnej i późniejszych poważnych zachowań agresywnych .
strony internetowe
implementacja oprogramowania statystycznego
oprogramowanie do implementacji metod dopasowywania i wyników skłonności:
dla makro SAS:
http://ndc.mayo.edu/mayo/research/biostat/sasmacros.cfmgmatch: skomputeryzowane dopasowywanie przypadków do kontrolek przy użyciu algorytmu greedy matching z ustaloną liczbą kontrolek na przypadek.
vmatch: skomputeryzowane dopasowanie przypadków do kontrolek za pomocą zmiennej optymalne dopasowanie.
dokumentacja SAS:
dla programu R:
slajdy z Thomas Love 2003 prezentacja ASA:
zasoby (materiały informacyjne, Bibliografia z adnotacjami) z Thomas Love:
Wyjaśnienie I przykład z ekologii PSA:
kursy
warsztaty online na temat dopasowywania wyników skłonności są dostępne w EPIC