Articles

카파는 통계를 측정하는 계약을 넘어에 기회가 무료로 반응 평가

의 유도 무료로 대응 카

두 개의 평가자,일반적인 카파는 통계가(Po-Pe)/(1-Pe)를 포는 비율의 조화 된 평가 및 Pe 가 예상되는 비율의 조화 된 등급으로 인해 기회를 혼자입니다. 등급이 이분법 일 때 데이터는 2×2 표로 요약 될 수 있습니다. 저희에게 나타내기 위해 수의 연구 결과는 등급으로 부정적인 모두에 의해 평가,b 및 c 숫자의 연구 결과를 평가 긍정적으로 중 하나에 의해 평가자 하지만 부정적인에 의해 다른 d 수 연구 결과의 정격으로 긍정적인 모두에 의해 평가. 따라서 N 쌍의 관측치 중 a+d 일치 쌍의 등급과 b+c 불일치 쌍이 있습니다. 관측치가 상호 독립적이라고 가정하면 Po 는(a+d)/N 에 의해 추정되고 Pe 는/N2 에 의해 추정됩니다. 그런 다음 카파 통계(이 경우 코헨의 카파)는 다음에 의해 제공됩니다:

$$K=\frac{2\left(ad-bc\오른쪽)}{\left(b+c\right)N+2\left(ad-bc\오른쪽)}$$
(1)

경우 환자에 기여할 수 있는 하나 이상의 관찰,데이터는 클러스터링이 적용됩니다. 양 et al 제안 카파의 통계에서 얻은 일반적인 수식(Po-Pe)/(1-Pe)는 곳이 가중평균의 비율의 계약을 통해 클러스터(환자)및 Pe 에서 얻어진 가중평균의 한계 비율의 평가의 각각의 평가자. 이 접근법을 사용하면 클러스터 된 데이터에 대한 카파는 클러스터링이 무시 될 때와 동일한 추정치를 갖습니다. 따라서 기본 2×2 테이블은 클러스터 된 데이터에 대한 합의 추정에도 적합합니다.

자유 응답 평가의 경우,각 평가자는 긍정적 인 결과 만보고하며 숫자 a 는 알려지지 않았습니다. 그것은 잘못된 것을 바꾸기에 0,는 경우로 평가했다 동의하지 않에 어떤 부정적인 관찰,모두 관찰된 협약 및 카파 것이 과소평가된다. 그것은 또한 잘못된 것은 단순히 교체하여 환자의 수는 없이 모든 긍정적인을 찾는 것이기 때문에,여러 잠재적 병변이트에 존재하는 각 환자입니다. 일반적으로,하는 것으로 가정할 수 있 높이에서 이미징 시험이기 때문에,각 출력을 표시합의 큰 숫자를 해부학적 또는 기능적인 구조물 또는 하부 구조,각각의 잠재적으로 긍정적 또는 부정적이다. 따라서 주어진 환자에서 양성 소견의 수는 일반적으로 발생할 수있는 잠재적 인 이상 수와 비교하여 작습니다.

우리는 여기서 코헨의 카파를 무한대에 접근하는 것으로 묘사하는 카파 통계를 제안합니다. Eq 에 정의 된 카파 통계의 부분 파생물입니다. (1)a 와 관련하여:

$$\frac{\부분\widehat{K}}{\부분적인}=\frac{2\left(b+c\right)\left(b+d\오른쪽)\left(c+d\오른쪽)}{{\left}^2}$$

이 부분 파생은 긍정적이다,따라서 카파는 통계 단조롭게 증가와 함께. 또한 이 유도체 null 제한적으로 접근한 의미의 카파는 통계가 제한적으로 접근한다. 우리는이 제한을 자유 응답 카파(KFR)라고 부릅니다. Eq 당. (1),현재 연결의 비율은 두 가지 기능의,f(a)=2(ad-bc)g(a)=(b+c)(a+b+c+d)+2(ad-bc),이는 모두 접근을 무한으로 무한대에 접근,그는 자신의 비율을 결정할 수 없습니다. L’Hôpital 규칙,재생 목록과 같은 제한의의 비율 부분의 유도체 f(a)g(a)으로 접근하는 것으로 밝혀졌

$${K}_{FR}=\frac{2}{b+c+2d}$$
(2)

속성에의 응답 카

KFRhas 몇 가지 흥미로운 특성. 그것은 a 에 의존하지 않고 긍정적 인 관찰 b,c 및 d 에만 의존합니다. 따라서 불확실성에 대한 배제하지 않는다는 추정을 넘어 계약의 기회가있는 경우의 번호를 부정적인 결과를 수 있는 매우 큰 것으로 간주.

KFR 을 해석 할 때 각 평가자가 작성한 평가의 수를 개별적으로 고려하는 것이 도움이됩니다. 첫 번째 평가자는 c+d 양성 관찰을했고 두 번째 평가자는 b+d 양성 관찰을했습니다. 따라서 분모 b+c+2d 은 총 수의 긍정적인 개인 관찰에 의해 만들어진 2 개 평가,2d 은 수의 긍정적인 관찰 중 하나에 의해 평가자가에 의해 확인되었다,다른 그리고 b+c 은 수의 긍정적인 관찰 중 하나에 의해 평가자들에 의해 확인되지 않습니다. 따라서 KFR 은 모든 긍정적 인 개별 관찰 중에서 확인 된 긍정적 인 개별 관찰의 비율입니다. 0.5 의 KFR 통계는 긍정적 인 결과의 절반이 평균으로 간주 될 수있는 반면 0 인 다른 평가자에 의해 확인되었음을 의미합니다.8 은 매우 좋은 것으로 간주 될 수 있습니다. 이것은 코헨의 카파에 대한 출판 된 해석 지침과 일치합니다.

데이터가 클러스터링되면 모든 클러스터의 2×2 테이블을 단일 2×2 테이블로 축소하고 Eq 를 적용하여 kfr 을 직접 얻을 수 있습니다. (2). 풀링 된 KFR 은 적어도 하나의 긍정적 인 관찰을 가진 환자의 개별 자유 반응 kappa 통계의 가중 평균입니다(각 환자는 k 로 색인됩니다):

$${K}_{FR}={\displaystyle\sum_k}{v}_k\frac{2{d}_k}{b_k+{c}_k+2{d}_k}$$

어디에서 각각의 중량 vk 나타내는 비율의 긍정적인 평가에서 환자 중 k 모든 긍정적 평가:

$${v}_k=\frac{b_k+{c}_k+2{d}_k}{b+c+2d}$$

그것이 다음과 같이 없는 환자에서 발견된 병에 기여하지 않습의 추정 현재 연결;그들의 무게에 포함되어 있습니다. 따라서 환자 수준의 클러스터링이 필요하지 않습을 계정으로 수를 계산하는 재생 목록과 환자들지 않고 긍정적인을 찾는 무시할 수 있습니다.참고로,KFR 에 대한 방정식은 Fleiss 에 의해 설명 된 바와 같이 특정(양의)계약의 비율에 해당합니다. 방정식은 동일하지만 목적과 해석은 다릅니다. Fleiss 의 경우 특정 긍정적 계약(및 특정 부정적인 계약)은 전체 계약의 해석을 향상시키는 보완 통계입니다. 이중 부정적인 관찰의 누락은 선험적 인 결정입니다. 중요한 것은 Fleiss 가 기회에 대해 수정 된 합의가 아니라 관찰 된 합의에 관심이 있다는 것입니다. 마지막으로 Fleiss 는 자유 응답 컨텍스트를 다루지 않습니다.

자유 응답 카파의 분산

KFR 은 0 과 1 로 묶여 있기 때문에 먼저 kfr 의 logit,즉 ln(KFR/(1-KFR))을 취하여 추정기를 정규화했습니다. 의 분산을 추정 로짓(현재 연결)하여 얻은 델타 방법(Appendix1):

$$V r\left(로짓\left({K}_{FR}\right)\오른쪽)=\frac{\left(b+c+d\오른쪽)}{\left(b+c\right)d}$$
(3)

따라서 신뢰 구간을 얻을 수 있습 로짓(현재 연결)고 하한 및 상한 자신감을 경계를 다시 변형하여 원본 규모입니다.

대체 접근법을 사용하는 것의 사이에 직접적인 관계 현재 연결과의 비율이 적합하의 쌍을 관찰 중에서 사용 가능한 모든 관찰,p=d/b(+c+d). KFR=2P/(1+p)임을 쉽게 알 수 있습니다. 따라서는 95%의 신뢰 간격을 얻을 수 있습 p,를 사용하여 어떤 사용할 수 있는 방법에 대한 이항 비율을 포함한 정확한 방법이며,신뢰를 범할 수 있음-변하는 현재 연결 규모입니다.

우리는 0.3,0.5,0.7 및 0 의 KFR 값에서 독립적 인 관측에 대한 세 가지 신뢰 구간 방법의 성능을 시뮬레이션했습니다.그리고,샘플 크기(N=b+c+d)의 경우 20,50,100,및 200. 각 조건에 대해 우리가 생성되 50’000 무작위 샘플에서 이항 분포 매개 변수와 함께 N 및 p 에 의해 정의되었 현재 연결/(2-현재 연결)는 역함수 방정식의 현재 연결=2p/(1+p). 각 샘플에 대해 Eq 를 사용하여 95%신뢰 구간을 계산했습니다. (3)로짓의 현재 연결하고,또한 사용하는 방법 2 대한항 p 매개 변수에 대한 적절한 작은 샘플에서는 asymptotic 추정 방법 얻을 수 있습니다 잘못된 결과:Agresti-Coull 방법 및 Clopper-피어슨 방법입니다. 각 상황에 대해 KFR 의 평균 시뮬레이션 값,참 값을 포함하는 신뢰 구간의 비율 및 신뢰 구간의 평균 너비를보고합니다.

세 가지 방법 모두 잘 수행되었습니다(표 1). Eq 에 따른 신뢰 구간. (3)은 표본 크기와 KFR 이 모두 작을 때 적용 범위가 낮아졌습니다(0.932). 이것은이 경우 샘플의 2%가 퇴화(d=0 또는 d=N)였고 Eq 였기 때문입니다. (3)을 적용 할 수 없었습니다(이 샘플을 제외했다면 적용 범위는 0.951 이었을 것입니다). 클로퍼-피어슨 방법은 최고 수준의 커버리지를 생성했지만 불필요하게 넓은 신뢰 구간을 희생했습니다. 신뢰 구간은 Eq 에 대해 더 좁았습니다. (3)및 Agresti-Coull 방법.

테이블 1 시뮬레이션의 범위와 의미 폭 95%의 신뢰 간격으로 무료로 응답 카파에 선택한 표본 크기(20,50,100,200)값의 kappa(0.3, 0.5, 0.7, 0.9), 를 사용하여 세 가지 방법:델타 방법(Eq. 3),Agresti-Coull 자신감을 제한 및 Clopper-Pearson 신뢰 한계

,노트의 평균 값의 관찰 현재 연결이 약간 아래로 매개 변수 값에 특히 저렴한 샘플 크기입니다. 이는 고정 된 매개 변수 p 로 시뮬레이션하고 KFR=2p/(1+p)는 오목 함수이기 때문입니다. Jensen 의 불평등에 의해,p 의 오목 함수(즉,평균 관찰 된 KFR)의 기대는 p 의 기대 함수(즉,매개 변수 p 에 해당하는 KFR)보다 작을 것이다.

유효하려면 이러한 추정 방법은 관측치가 상호 독립적이어야합니다. 이 적용될 수 있음 일부 상황에서:예를 들어,경우에는 짝 심사 테스트가 적용되는 큰 인구,그리고 사람만이 하나 이상에 긍정적인 결과를 참조에 대한 추가적인 검사를 받게 됩니다. 그러나 대부분의 이미징 절차의 경우 데이터는 자연스럽게 환자 내에서 클러스터됩니다. 그런 다음 kfr 의 제안 된 점근 적 분산이 편향 될 것입니다. 클러스터링이 존재하면 신뢰 구간을 얻기 위해 부트 스트랩 프로 시저를 사용할 수 있습니다(부록 2 참조).

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 항목은 *(으)로 표시합니다