Articles

Kappa-tilasto mittaamaan sattuman ulkopuolista sopimista vapaan vasteen arvioinneissa

vapaan vasteen Kappan johtaminen

kahden raterin osalta tavanomainen kappa-tilasto on (Po-Pe) / (1-Pe), jossa Po on Havaittujen yhtäpitävien luokitusten osuus ja Pe pelkästään sattumasta johtuva odotettu yhtäpitävien luokitusten osuus. Kun luokitus on kaksijakoinen, tiedot voidaan tiivistää 2 × 2-taulukkoon. Olkaamme ilmi, a määrä havaintoja, jotka on luokiteltu negatiivisiksi molemmat raters, b ja c määrä havaintoja mitoitettu positiiviseksi yhden rater mutta negatiivinen muut, ja d määrä havainnot mitoitettu positiiviseksi molemmat raters. N havaintoparien joukossa on siis A + d konskoranttipareja ja b + c discordanttisia pareja. Olettaen, että havainnot ovat toisistaan riippumattomia, Po arvioidaan arvolla (A + d)/n ja Pe arvolla /N2. Sitten kappa-tilasto (tässä tapauksessa Cohenin kappa) saadaan:

$$ k=\frac{2\left( ad – bc\right)}{\left( b+ c\right) n+2\left( ad – bc\right)} $$
(1)

kun potilaat voivat osallistua useampaan kuin yhteen havaintoon, tiedot ryhmitellään. Yang et al ehdotti kappa-tilastotietoa, joka saadaan tavanomaisesta kaavasta (Po-Pe)/(1-Pe), jossa Po on painotettu keskiarvo sopimisen osuuksista klustereissa (potilaat) ja Pe saadaan painotetuista keskiarvoista, jotka ovat marginaalisia osuuksia kunkin raterin luokituksista. Tällä lähestymistavalla, Kappa ryhmitelty data on sama arvio kuin kun klusterointi jätetään huomiotta. Sen vuoksi 2 × 2: n perustaulukko soveltuu myös ryhmitettyjen tietojen yksimielisyyden estimointiin.

vapaan vasteen arvioinneissa jokainen raateri raportoi vain positiivisia löydöksiä ja Numeroa a ei tunneta. Olisi väärin korvata a: lla 0, ikään kuin raterit eivät olisi sopineet mistään kielteisestä havainnosta; sekä havaittu sopimus että kappa aliarvioitaisiin. Olisi myös väärin korvata a vain potilaiden määrällä ilman mitään positiivista löydöstä, koska jokaisessa potilaassa on useita mahdollisia vauriokohtia. Tyypillisesti a: n voidaan olettaa olevan suuri kuvantamistutkimuksissa, koska jokainen ulostulo näyttää suuren määrän anatomisia tai funktionaalisia rakenteita tai alarakenteita, joista jokainen on potentiaalisesti positiivinen tai negatiivinen. Siksi positiivisten löydösten määrä tietyllä potilaalla on yleensä pieni verrattuna mahdollisten poikkeavuuksien määrään.

ehdotamme tässä kappatilastoa, joka kuvaa Cohenin kappaa lähestyvänä äärettömyytenä. Eq: ssa määritellyn kappa-statistiikan osittaisderivaatta. (1) suhteessa A on:

$$ \frac{\partial \widehat{k}}{\partial a}=\frac{2\left( b+ c\right)\left( b+ d\right)\left( c+ d\right)}{{\left}^2} $$

tämä osittainen derivaatta on positiivinen, joten Kappan tilasto kasvaa monotonisesti A: n kanssa. lisäksi tällä derivaatalla on nollaraja lähestyttäessä ääretöntä, mikä merkitsee, että kappa-tilastolla on äärellinen raja lähestyessään ääretöntä. Kutsumme tätä rajaa vapaasti reagoivaksi kappaksi (KFR). Per Ekv. (1), KFR on kahden funktion a suhde, f (A) = 2 (ad-bc) ja g (a) = (b + c) (a + b + c + d) + 2 (ad-bc), jotka molemmat lähestyvät ääretöntä lähestyessään ääretöntä siten, että niiden suhde on määrittelemätön. L ’ Hôpitalin säännön mukaan KFR on F (A): n ja g (A): n osittaisderivaatan suhteen raja lähestyessään ääretöntä, mikä osoittautuu

$$ {K}_{FR}=\frac{2 d}{b+ c+2 d} $
(2)

vapaan vasteen Kappan ominaisuudet

KFRhas useita mielenkiintoisia ominaisuuksia. Se ei riipu a: sta, vaan ainoastaan positiivisista havainnoista b, c ja D. A: ta koskeva epävarmuus ei sen vuoksi estä arvioimasta, että sopimus on täysin sattumanvarainen, jos kielteisten havaintojen määrää voidaan pitää hyvin suurena.

KFR: ää tulkittaessa on hyödyllistä tarkastella kunkin raterin antamien arvosanojen lukumäärää erikseen. Ensimmäinen rater teki c + d positiivisia havaintoja, ja toinen rater teki B + d positiivisia havaintoja. Näin ollen nimittäjä b + c + 2D on 2 raterin tekemien positiivisten yksittäisten havaintojen kokonaismäärä, 2d on jommankumman raterin tekemien positiivisten havaintojen lukumäärä, jotka toinen rataaja vahvisti, ja b + c on jommankumman raterin tekemien positiivisten havaintojen lukumäärä, joita toinen ei vahvistanut. KFR on siis vahvistettujen positiivisten yksittäisten havaintojen osuus kaikista positiivisista yksittäisistä havainnoista. KFR-tilasto 0,5 tarkoittaa, että toinen rater vahvisti puolet positiivisista havainnoista, mitä voidaan pitää keskiarvona, kun taas 0.8: aa voi pitää erittäin hyvänä. Tämä on linjassa Cohenin kappalle julkaistujen tulkintaohjeiden kanssa .

kun tiedot ryhmitellään, KFR saadaan suoraan kokoamalla kaikkien klustereiden 2 × 2-taulukot yhdeksi 2 × 2-taulukoksi ja soveltamalla Eq: ta. (2). Yhdistetty KFR on painotettu keskiarvo yksittäisistä vapaan hoitovasteen kappa-tilastoista potilailla, joilla on vähintään yksi positiivinen havainto (jokainen potilas indeksoidaan k: lla).:

$$ {K}_{FR}={\displaystyle \sum_k}{v}_k\frac{2{d}_k}{b_k+{C}_k+2{d}_k} $$

jossa jokainen paino vk edustaa potilaan k positiivisten arvosanojen osuutta kaikista positiivisista arvioista:

$$ {v}_k=\frac{b_k+{C}_k+2{d}_K}{B+ C+2 D} $$

tästä seuraa, että potilaat, joilla ei ole havaittuja leesioita, eivät vaikuta KFR: n arvioon; heidän painonsa on nolla. Siksi potilastason ryhmittelyä ei tarvitse ottaa huomioon KFR: n laskemiseksi, ja potilaat, joilla ei ole positiivista löydöstä, voidaan jättää huomiotta.

Huom .KFR: n yhtälö vastaa fleissin kuvaamaa spesifisen (positiivisen) sopimuksen osuutta. Vaikka yhtälö on identtinen, tarkoitus ja tulkinta ovat erilaiset. Fleissin osalta erityinen myönteinen sopimus (ja myös erityinen kielteinen sopimus) on täydentävä tilastotieto, joka tehostaa kokonaissopimuksen tulkintaa. Kaksinkertaisten kielteisten huomautusten jättäminen pois on ennakkopäätös. Tärkeää on, että Fleiss on kiinnostunut havaitusta yhteisymmärryksestä, ei sattumalta korjatusta sopimuksesta. Lopuksi Fleiss ei käsittele vapaan vastauksen kontekstia.

vapaan vasteen Kappan varianssi

koska KFR: ää sitovat 0 ja 1, normalisoimme estimaattorin ensin ottamalla KFR: n logit eli Ln (KFR / (1-KFR)). Delta-menetelmällä saadun estimoidun logitin (KFR) varianssi (Lisäys 1) on:

$$ V a R\left( logit\left({K}_{FR}\right)\right)=\frac{\left( b+ c+ d\right)}{\left( b+ c\right) d} $$
(3)

näin voidaan saada luottamusväli logit (KFR), ja alemman ja ylemmän luottamuksen rajat takaisin-muunnetaan alkuperäiseen asteikkoon.

vaihtoehtoisena lähestymistapana on käyttää KFR: n suoraa suhdetta kongruenttien havaintoparien osuuteen kaikista käytettävissä olevista havainnoista, p = d / (b + c + d). On helppo osoittaa, että KFR = 2P / (1 + p). Tämän vuoksi p: lle voidaan saada 95%: n luottamusväli käyttäen mitä tahansa binomiosuuksille käytettävissä olevaa menetelmää, mukaan lukien tarkat menetelmät, ja luottamusvälit voidaan muuntaa takaisin KFR-asteikolle.

olemme simuloineet riippumattomien havaintojen kolmen luottamusvälimenetelmän toimivuuden KFR-arvoilla 0, 3, 0, 5, 0, 7 ja 0.9, ja otoskokojen (n = b + c + d) osalta 20, 50, 100 ja 200. Jokaista ehtoa varten tuotimme 50 ’ 000 satunnaisnäytettä binomijakaumasta parametreineen N ja p, jossa p määriteltiin KFR/(2-KFR), joka on yhtälön KFR = 2p/(1 + p) käänteisarvo. Kunkin näytteen laskimme 95% luottamusväli käyttäen Eq. (3) KFR: n logitille ja myös käyttämällä 2 menetelmää binomiparametrille p, jotka soveltuvat pienille näytteille , joissa asymptoottiset estimointimenetelmät voivat tuottaa vääriä tuloksia: Agresti-Coull-menetelmä ja Clopper-Pearson-menetelmä . Kunkin tilanteen osalta raportoimme KFR: n simuloidun keskiarvon, todellisen arvon sisältävien luottamusvälien osuuden ja luottamusvälien keskimääräisen leveyden.

kaikki kolme menetelmää suoriutuivat hyvin (Taulukko 1). Ekv: hen perustuvat luottamusvälit. (3) oli pienempi kattavuus (0,932), kun otoskoko ja KFR olivat molemmat pieniä. Tämä johtuu siitä, että tässä tapauksessa 2% näytteistä oli degeneroituneita (d = 0 tai d = N) ja Eq. (3) ei voitu soveltaa (jos olisimme jättäneet nämä näytteet kattavuus olisi ollut 0,951). Clopper-Pearson-menetelmä tuotti korkeimman kattavuuden, mutta tämä tapahtui tarpeettoman laajojen luottamusvälien kustannuksella. Luottamusvälit olivat Eq: lle kapeammat. (3) ja Agresti-Coull-menetelmän osalta.

Taulukko 1 vapaasti reagoivan Kappan 95%: n luottamusvälien kattavuuden ja keskimääräisen leveyden simulaatiot valituissa otoskooissa (20, 50, 100, 200) ja Kappan arvoissa (0.3, 0.5, 0.7, 0.9), käytetään kolmea menetelmää: delta-menetelmä (ekv. 3), Agresti-Coull-luottamusrajat ja Clopper-Pearson-luottamusrajat

todettujen KFR-arvojen keskiarvot olivat hieman parametriarvojen alapuolella erityisesti pienissä otoskooissa. Tämä johtuu siitä, että simuloimme kiinteällä parametrilla p, ja KFR = 2p / (1 + p) on kovera funktio. Jensenin epäyhtälön mukaan P: n koveran funktion odotus (eli havaittu keskiarvo KFR) on tällöin pienempi kuin P: n odotuksen funktio (eli parametria p vastaava KFR).

jotta nämä estimointimenetelmät olisivat päteviä, niiden on oltava toisistaan riippumattomia. Tätä voidaan soveltaa joissakin olosuhteissa: esimerkiksi jos paritestiä sovelletaan suureen populaatioon ja vain ne, joilla on vähintään yksi positiivinen tulos, lähetetään jatkotutkimuksiin. Mutta useimmissa kuvantamismenetelmissä tiedot ovat luonnollisesti ryhmitelty potilaiden sisällä. Silloin KFR: n ehdotettu asymptoottinen varianssi olisi puolueellinen. Ryhmittelyn yhteydessä luottamusväli voidaan määrittää bootstrap-menetelmällä (KS.Lisäys 2).

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *