Articles

Když předpoklady ancova jsou irelevantní

jednou za čas, pracuji s klientem, který uvízl mezi konkrétním statistickým kamenem a tvrdým místem.

stává se to, když se snaží spustit analýzu kovariance (ancova) modelu, protože mají kategoricky nezávislou proměnnou a spojitou kovariaci.

problém nastává, když spoluautor, člen výboru, nebo recenzent trvá na tom, že ANCOVA je nevhodné v této situaci, protože jeden z následujících ANCOVA předpoklady nejsou splněny:

1. Nezávislá proměnná a kovariát jsou na sobě nezávislé.

2. Neexistuje žádná interakce mezi nezávislou proměnnou a kovariátem.

Pokud se podíváte je v každém návrhu experimentů učebnice, který je obvykle, kde najdete informace o tom, ANOVA a ANCOVA, budete skutečně najít tyto předpoklady. Takže kritik má pěkné reference.

jedná se však o případ, kdy je důležité zastavit se a přemýšlet o tom, zda se předpoklady vztahují na vaši situaci a jak řešení předpokladu ovlivní analýzu a závěry, které můžete vyvodit. zda se předpoklady vztahují na vaši situaci a jak řešení předpokladu ovlivní analýzu a závěry, které můžete vyvodit.

Příklad

velmi jednoduchým příkladem může být studie, která zkoumá rozdíl výšek dětí, které dělat a nemají parazit. Vzhledem k tomu, že velkým přispěvatelem k výšce dětí je věk, je to důležitá kontrolní proměnná.

v tomto grafu vidíte vztah mezi věkem X1, na ose x a výškou na ose y při dvou různých hodnotách X2, stavu parazita. X2=0 označuje skupinu dětí, které mají parazita a X2=1 je skupina dětí, které nemají.

asociace bez interakce

mladší děti mají tendenci být postiženy parazitem častěji. To znamená, že průměrný věk (průměr X1) modrých teček je jasně nižší než průměrný věk černých hvězd. Jinými slovy, věk dětí s parazitem je nižší než věk bez.

takže nezávislost mezi nezávislou proměnnou (stav parazita) a kovariátem (věk) je jasně porušena.

jak se vypořádat s porušením předpokladů

toto jsou vaše možnosti:

1. Pokles těchto proměnných z modelu tak, že nejste porušení předpokladů, ANCOVA a spustit one-way ANOVA. To se zdá být populární volbou mezi většinou kritiků.

2. V modelu si přesto ponechte kovariát i nezávislou proměnnou.

3. Kategorizujte kovariát do nízkého a vysokého věku a poté spusťte ANOVU 2×2.

volba #3 je často obhajována, ale doufám, že brzy uvidíte, proč je to v nejlepším případě zbytečné. Svévolné rozdělení číselné proměnné do kategorií je jen zahodit dobré informace.

pojďme prozkoumat možnost #1.

problém s ním je zobrazen v grafu-neodráží přesně data ani vztahy mezi proměnnými.

S proměnnou v modelu, rozdíl v průměrné výšce pro děti s a bez parazit se odhaduje pro děti ve stejném věku (výška červená čára).

Pokud jste drop veličinou, rozdíl ve střední výška se odhaduje na celkový průměr pro každou skupinu (fialová čára).

jinými slovy, žádný vliv věku budou přidány na vliv parazita stavu, a budete přehánět vliv parazita na mysli rozdíl ve výšce dítěte.

proč je to tedy předpoklad?

Jste pravděpodobně ptát sami sebe, „proč by to být předpoklad, ANCOVA, pokud odstranění veličinou nás vede k přehánět vztahy?“

abychom pochopili proč, musíme prozkoumat problém, který tyto předpoklady řeší.

V analýze kovariance sekce Geoffrey Keppel je vynikající kniha, Design a Analýza: Výzkumník je Příručka, on říká:

používá se k dosažení dvou důležitých úprav: (1) upřesnit odhady experimentální chyby a (2) upravit účinky léčby pro jakékoli rozdíly mezi léčebnými skupinami, které existovaly před podáním experimentální léčby. Protože předměty byly náhodně přiřazeny na léčbu podmínky , očekávali bychom, že najdeme relativně malé rozdíly mezi ošetření na proměnnou a podstatně větší rozdíly v těchto proměnných mezi subjekty v rámci různých léčebných podmínek. Očekává se tedy, že analýza kovariance dosáhne svých největších výhod snížením velikosti chybového výrazu ; jakákoli korekce pro již existující rozdíly vytvořená náhodným přiřazením bude ve srovnání malá.

několik stránek dále, že státy,

hlavním kritériem pro kovariance je podstatné lineární korelaci se závislou proměnnou Y. Ve většině případů, skóre na těchto proměnných jsou získány před zahájením experimentální léčba…. Příležitostně se skóre shromažďují po dokončení experimentu. Takový postup je obhajitelný pouze tehdy, když je jisté, že experimentální léčba neovlivnila kovariát….Analýza kovariance je založena na předpokladu, že kovariát je nezávislý na experimentální léčbě.

jinými slovy, jde o to, špiní výsledky, které lze vyvodit, že experimentálně manipulovat léčby. Pokud kovariance byla v souvislosti s léčbou, to by ukazovalo na problém s náhodným úkol, nebo to by naznačovalo, že samotné léčby způsobil kovariance hodnoty. To jsou velmi důležité úvahy v experimentech.

Pokud však, jako v našem parazit například hlavní kategorické nezávisle proměnné je pozorován, a ne manipulovat, předpoklad nezávislosti mezi proměnnou a nezávisle proměnnou je irelevantní.

je to návrhový předpoklad. Není to modelový předpoklad.

jediný efekt předpokladu, že nezávislá proměnná a kovariát jsou nezávislé, je v tom, jak interpretujete výsledky.

jaké je tedy vhodné řešení?

vhodná odpověď #2–ponechat proměnnou v analýze, a ne interpretovat výsledky observační studie, jako kdyby byly z experimentu.

to povede k přesnějšímu odhadu skutečného vztahu mezi nezávislou proměnnou a výsledkem. Jen se ujistěte, že říkáte, že toto je střední rozdíl v jakékoli dané hodnotě kovariátu.

poslední problém se pak stává: pokud váš kritik zakázal slovo ANCOVA, protože nemáte experiment, jak tomu říkáte?

nyní je to na sémantice. To je správné nazývat to obecný lineární model vícenásobné regrese, nebo (podle mého uvážení), ANCOVA (nikdy jsem neviděl nikoho, kdo odmítají volání analýzu, analýzu variance, když dva kategorické IVs se týkaly).

kritici, kteří se na tento předpoklad zavěsí, jsou obvykle ti, kteří chtějí konkrétní jméno. Obecný lineární Model je pro ně příliš nejednoznačný. Měl jsem klienty, kteří to museli nazvat vícenásobnou regresí, i když hlavní nezávislá proměnná byla kategorická.

jednou z možností je použití “ kategorické prediktorové proměnné „namísto“ nezávislé proměnné “ při popisu proměnné v ANCOVA. Ta druhá znamená manipulaci; první ne.

Toto je případ, kdy stojí za to bojovat za vaši analýzu, ale ne za jméno. Smyslem toho všeho je přesné sdělování výsledků.
Záložky a Sdílet

Tlumočení Lineární Regrese Koeficienty: Procházka Výstup
Učí přístup k pochopení koeficientů v regresní jak jsme se projít výstup z modelu, který zahrnuje numerické a kategoriální prediktory a interakce.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *