Amikor ANCOVA feltételezései irrelevánsak
, időnként olyan ügyféllel dolgozom, aki egy adott statisztikai kő és kemény hely között ragadt.
Ez akkor történik, amikor a kovariancia (ANCOVA) modell elemzését próbálják futtatni, mert van egy kategorikus független változójuk és egy folyamatos kovariánsuk.
a probléma akkor merül fel, amikor egy társszerző, bizottsági tag vagy értékelő ragaszkodik ahhoz, hogy ANCOVA nem megfelelő ebben a helyzetben, mert az alábbi ANCOVA feltételezések egyike nem teljesül:
1. A független változó és a kovariáns egymástól független.
2. Nincs kölcsönhatás a független változó és a kovariáns között.
ha felnéz őket a kísérletek bármely tervében, ahol általában ANOVA és ANCOVA információkat talál, akkor valóban megtalálja ezeket a feltételezéseket. Tehát a kritikusnak szép referenciái vannak.
azonban ez egy olyan eset, amikor fontos, hogy hagyja abba, és gondolkodni, hogy a feltételezések vonatkoznak a helyzet, és hogyan foglalkozik a feltételezés hatással lesz az elemzés és a következtetéseket lehet levonni.
egy példa
egy nagyon egyszerű példa erre lehet egy tanulmány, amely megvizsgálja a magassági különbség a gyerekek, akik nem egy parazita. Mivel a gyermekek magasságának nagy szerepe az életkor, ez egy fontos szabályozóváltozó.
ebben a grafikonban az X1-es kor és az y-tengely magassága közötti összefüggést látjuk az X2 két különböző értékén, a parazita állapotán. X2 = 0 a parazitával rendelkező gyermekek csoportját jelzi, X2 = 1 pedig azoknak a gyermekeknek a csoportja, akik nem.
a fiatalabb gyermekek gyakrabban szenvednek a parazitával. Vagyis a kék pontok átlagos életkora (x1 átlaga) egyértelműen alacsonyabb, mint a fekete csillagok átlagéletkora. Más szavakkal, a parazita gyerekek életkora alacsonyabb, mint a nélküliek.
tehát a független változó (parazita státusz) és a kovariáns (kor) közötti függetlenséget egyértelműen megsértik.
hogyan kell kezelni megsértése a feltételezések
ezek a lehetőségek:
1. Dobd el a kovariáns a modell, hogy te nem sérti a feltételezések ANCOVA futtatni egyirányú ANOVA. Úgy tűnik, hogy ez a legnépszerűbb lehetőség a legtöbb kritikus körében.
2. Tartsa meg mind a kovariáns, mind a független változót a modellben.
3. Osztályozza a kovariánsokat alacsony és magas korokra, majd futtasson egy 2×2 ANOVA-t.
a #3 opciót gyakran támogatják, de remélem, hogy hamarosan látni fogja, miért nincs szükség a legjobb esetben. A Numerikus változó kategóriákba történő önkényes felosztása csak jó információkat dob el.
vizsgáljuk meg az 1. opciót.
a probléma a grafikonon látható–nem tükrözi pontosan az adatokat vagy a változók közötti kapcsolatokat.
a modell kovariánsával a parazitával rendelkező vagy anélkül élő gyermekek átlagos magasságának különbségét ugyanabban a korban (a vörös vonal magassága) becsülik meg.
Ha a kovariáns csökken, az átlagos magasság különbségét az egyes csoportok (a lila vonal) teljes átlagára becsülik.
más szóval, az életkor bármely hatása hozzáadódik a parazita állapotának hatásához, és túlbecsüli a parazita hatását a gyermekek magasságának átlagos különbségére.
akkor miért feltételezés?
valószínűleg azt kérdezi magától: “miért lenne ez ANCOVA feltételezése, ha a kovariáns eltávolítása túlállami kapcsolatokhoz vezet?”
ahhoz, hogy megértsük, miért, meg kell vizsgálnunk a problémát, amelyet ez a feltételezés foglalkozik.
Geoffrey Keppel kiváló könyvének, tervezésének és elemzésének kovarianciás szekciójának elemzésében kijelenti:
két fontos kiigazítás végrehajtására szolgál: (1) A kísérleti hibákra vonatkozó becslések finomítása és (2) a kezelési hatások kiigazítása a kísérleti kezelések beadása előtt létező kezelési csoportok közötti különbségekre. Mert a tárgyak voltak véletlenszerűen hozzárendelt kezelés feltételek , mi gondolnánk, hogy viszonylag kis különbségek a kezelések a covariate, valamint lényegesen nagyobb különbségek a covariate között az alanyok belül a különböző kezelési feltételek. Így a kovariancia elemzése várhatóan a legnagyobb előnyöket fogja elérni a hibaidő méretének csökkentésével ; a már meglévő különbségek korrekciója véletlenszerű hozzárendelést eredményezett, összehasonlítva kicsi lesz.
néhány oldal múlva kijelenti,
a kovariátum fő kritériuma jelentős lineáris korreláció a függő változóval, Y. a legtöbb esetben a kovariátum pontszámait a kísérleti kezelés megkezdése előtt kapják meg…. Időnként a pontszámokat a kísérlet befejezése után gyűjtik össze. Egy ilyen eljárás csak akkor védhető meg, ha biztos, hogy a kísérleti kezelés nem befolyásolta a kovariánsot….A kovariancia elemzése azon a feltételezésen alapul, hogy a kovariáns független a kísérleti kezelésektől.
más szóval arról van szó, hogy nem festjük meg azokat az eredményeket, amelyeket kísérletileg manipulált kezelésekkel lehet rajzolni. Ha egy kovariáns kapcsolódik a kezeléshez, ez véletlenszerű hozzárendeléssel kapcsolatos problémát jelezne, vagy azt jelezné, hogy maguk a kezelések okozták a kovariáns értékeket. Ezek nagyon fontos szempontok a kísérletekben.
Ha azonban, mint parazita példánkban, a fő kategorikus független változót megfigyeljük és nem manipuláljuk, akkor a kovariáns és a független változó közötti függetlenségi feltételezés irreleváns.
Ez egy tervezési feltételezés. Ez nem egy modell feltételezés.
a független változó feltételezésének és a kovariáns függetlenségének egyetlen hatása az eredmények értelmezésének módja.
Tehát mi a megfelelő megoldás?
a megfelelő válasz #2–tartsa a kovariánsokat az elemzésben, és ne értelmezze a megfigyelési vizsgálat eredményeit úgy, mintha egy kísérletből származnának.
ezzel pontosabb becslést kapunk a független változó és az eredmény közötti valós kapcsolatról. Csak győződjön meg róla, hogy azt mondja, hogy ez az átlagos különbség a kovariáns adott értékén.
az utolsó kérdés akkor válik: ha a kritikus betiltotta az ANCOVA szót, mert nincs kísérlete, mit nevezel?
most már a szemantika. Pontosan nevezzük általános lineáris modellnek, többszörös regressziónak, vagy (az én opciómban) ANCOVÁNAK (még soha nem láttam senkit, aki ANOVA-nak hívná az elemzést, amikor a két kategorikus IV összefüggés volt).
azok a kritikusok, akik ezt a feltételezést felfüggesztik, általában azok, akik egy adott nevet akarnak. Az általános lineáris modell túl kétértelmű számukra. Volt olyan ügyfelem, akinek többszörös regressziónak kellett hívnia, annak ellenére, hogy a fő független változó a kategorikus volt.
az egyik lehetőség a “kategorikus prediktor változó” használata a “független változó” helyett az ANCOVA változójának leírásakor. Ez utóbbi manipulációt jelent; az előbbi nem.
Ez egy olyan eset, amikor érdemes harcolni az elemzésért, de nem a névért. Ennek lényege az eredmények pontos közlése.