您好,欢迎来到吉趣旅游网。
搜索
您的当前位置:首页如何利用变异数成份估计一致性相关系数

如何利用变异数成份估计一致性相关系数

来源:吉趣旅游网
如何利用變異數成份估計一致性相關係數

蔡秒玉 彰化師範大學統計資訊所/副教授

一致性相關係數的定義

在生物醫學研究中,若有一個新的測量方法要與黃金標準或是早期慣用的測量方法進行比較時,我們希望新的方法與黃金測量或是早期慣用的方法兩者之間具有相當程度的一致性(agreement),這樣才能證明新的測量法具有一定的準確性。若針對類別型資料(categorical data),最廣為大家接受的是kappa統計量,其中Cohen’s kappa及weighted kappa分別是使用在二元(binary data)及有序的判讀資料(ordinal data)上(Cohen, 1960; 1968)。當判讀結果為連續型資料時,組內相關係數(Intraclass correlation coefficient; ICC)則是常用來評估家庭或集群判讀資料組內的相關性大小,亦即用來反映連續資料上的一致性(Bartko, 1966; Shrout and Fleiss, 1979);另一個針對連續型資料,可用來估計兩種判讀方法或儀器的一致性指標為一致性相關係數(concordance correlation coefficient; CCC),其為測量任兩對判讀資料相距於經原點的45度線的變異(variation of the linear relationship between each pair of data from the 45 line through the origin) (Lin, 19)。此一致性相關係數有兩方面的優點,其第一項優點為可以評估每一筆判讀資料離所配適的迴歸線多遠,此即代表精確度(precision),另一項優點為評估所配適的迴歸線離經原點的45度線多遠,此即代表準確度(accuracy) (King and Chinchilli, 2001)。本文章主要是針對一致性相關係數的估計進行探討。

根據Lin (19)提出針對兩個連續型變數Y1和Y2的一致性相關係數定義如下:

E[(Y1Y2)2]212c1, 2E[(Y1Y2)2|Y1 and Y2 are uncorrelated]122(12)22Var(Y2),12Cov(Y1,Y2)。由其中1E(Y1),2E(Y2),12Var(Y1),21

此定義可知,c的值域落在-1與1之間,若為-1則表示兩儀器之間完全不一致 (perfect disagreement);為0則表示彼此間互相獨立;為1則表示兩者之間完

2全一致(perfect agreement)。當12與122時,c則相當於皮爾森相關係數

(Pearson correlation coefficient);而一致性相關係數的95%的信賴區間可用

ˆc1ˆ1lnFisher’s Z變數變換得到(Fisher’s Z transformation),即Z會近似常cˆc21ˆc代表c的估計式,因此一致性相關係數的95%的信賴區間可經態分配,其中ˆc)ˆ1.96Var(Zˆ)轉換得到,其中Var(Zˆ)Var(由Z (Lin, 19)。 ccc22ˆc)(1利用變異數成份進行一致性相關係數的估計

Carrasco & Jover (2003)提出了在線性混合模式(linear mixed model; LMM)下,利用變異數成份(variance components; VC)估計一致性相關係數,其模式假設為

Yijije, i (1) 其中Yij代表第i個個體(subject)被第j個儀器(observer)所測量的觀測值;為總體平均;i是第i個個體的隨機效應(subject random effect),令其分配為

2i~N(0,);j是第j個儀器的固定效應(observer fixed effect);eij是第i個個

體被第j個儀器所測量觀測值的隨機誤差(random error),令其分配為

eij~N(0,e2),i1,,n,j1,,J。令隨機效應與隨機誤差項彼此之間皆互

相獨立,因此在這些前提假設下,Carrasco & Jover (2003)證明了組內相關係數與一致性相關係數兩種一致性測度估計式相同,則此一致性相關係數可經由變異數成份表示成

2 c2, (2) 22e2

1J2其中j。 J1j12利用變異數成份進行重複測量加權一致性相關係數的估計

針對長期追蹤重複測量資料,Carrasco et al. (2009)則將第(1)式的線性混合模型中加入時間屬性的固定效應及其與個體及判讀方法效應的交互作用,如此可將第(1)式的線性混合模型改寫為

Yijt, t (3) ijtijitej其中Yijt代表第i個個體被第j個儀器所測量的第t次判讀觀測值;t是第t次時間的固定效應t1,2,...,p;ij是第i個個體和第j個儀器間交互作用的隨機效應

2(random subject-observer interaction effect),令其分配為ij~N0,;it是

第i個個體和第t次測量時間交互作用的隨機效應(random subject-time interaction

2effect),令其分配為it~N0,;jt是第j個儀器和第t次測量時間交互作

用的固定效應(fixed observer-time effect);eijt是第i個個體第j個儀器第t次測量的隨機誤差項(random error)。同時假設所有隨機效應i、ij、it與隨機誤差

eijt皆互相獨立(mutually independent)。

除此之外,為了考慮在不同時間點觀測值之間的相關程度,Carrasco et al. (2009)依循King et al. (2007)所提出的加權方法,在任一個時間點測量的觀測值給予權重,其方法即為將一致性相關係數的估計式中加入一個權重矩陣D在重複的觀測值上,若D為一個單位矩陣(identity matrix),則組內相關係數與一致性相關係數的估計式相同,即在第(3)式的線性混合模型下的一致性相關係數估計式則可由個體屬性、個體和儀器間交互作用與個體和測量時間交互作用的隨機效應、儀器與測量時間交互作用固定效應以及隨機誤差項的變異數表示。如此,第(2)式的一致性相關係數估計式則可改寫為

3

crm其中222, 2222e2pJ211jtt,jt為第j個儀器在第t次時間點測量觀測值pJ1t1j1的總平均,t為第t次時間點測量觀測值的總平均。若D為一個對角矩陣(diagonal matrix),則此長期追蹤資料之加權重複測量一致性相關係數則可表示成

crm22tp1dttp222et1dtt211pt1Jj1dttjttpJ12,

其中dij表示為加權矩陣D中第i列第j行的元素。

利用R程式執行一致性相關係數的估計

目前已有R軟體的cccrm套件可以進行一致性相關係數的估計(Carrasco et al., 2013),以下皆用R軟體內設的重複測量資料作為R程式估計一致性相關係數的範例(在附錄中亦有SAS程式估計一致性相關係數的介紹)。在此將以R軟體提供血壓重複測量資料(bpres)作為分析資料,此資料共有384位個案(以ID變數標示),每位個案皆被兩種儀器(METHOD)進行舒張壓(DIA)的測量,每種儀器各測量兩次,並記錄每位個案的年齡(AGE)與性別(SEX)兩變數,此資料型態如下表:

ID 1 1 1 1 2 2 2 2 … AGE 70 70 70 70 29 29 29 29 … SEX 2 2 2 2 1 1 1 1 … DIA 84 92 83 98 70 70 76 76 … 4

METHOD 1 1 2 2 1 1 2 2 … 針對第(1)式的線性混合模型,可利用R軟體的cccvc函數進行一致性相關係數的估計,而此函數中需放入的參數如下: 1. dataset:資料名稱 2. ry:反應變數 3. rind:個案身份變數 4. rmet:儀器方法變數 5. covar:個案解釋變數 【cccvc程式碼】

cccvc(dataset=bpres, ry=\"DIA\【結果】

CCC 0.818829 Subject 77.8245

LL CI95% 0.791561 Observer 0.0995

UL CI95% 0.842843

Random Error 17.1197

SE CCC 0.013056

Z 1.100336

SE Z 0.039426

Variance Components:

此資料的分析結果為兩種血壓測量儀器的一致性程度為0.8188,95%的信賴區間為(0.7916, 0.8428),其估計結果顯示兩種血壓測量儀器有高度的一致性,其中個體隨機效應變異數估計值高達77.8245,代表個人異質性程度高,儀器效應變異數估計值為0.0995,隨機誤差變異數估計值為17.1197。

此cccrm函數亦可以將個案相關的解釋變數加入模式中進行調整,將bpres資料中的年齡及性別兩變數加入模式後,其程式及分析結果如下: 【cccvc程式碼】

cccvc(dataset=bpres, ry=\"DIA\covar=c(\"AGE\【結果】

5

CCC 0.800620 Subject 69.1441

LL CI95% 0.771111 Observer 0.0995

UL CI95% 0.826696

Random Error 17.1197

SE CCC 0.0141

Z 1.1532

SE Z 0.039622

Variance Components:

在調整了年齡及性別兩變數後,兩種血壓測量儀器的一致性程度仍高達0.8006,而個體隨機效應變異數估計值降低為69.1441。

利用R統計軟體套件cccrm中的ccclonw函數可以進行長期追蹤資料之重複測量加權一致性相關係數的估計。在此仍以R軟體內設的bfat資料來進行crm的估計,bfat資料為有82位個案(SUBJECT),每位個案皆被兩種儀器(METHOD)分別進行了3次的重複測量(VISITNO),所測得的反應變數為體脂肪(bf),其中設定的3×3加權矩陣D的對角線元素為(2,1,1),同時假設同一位個案的觀測值之間的相關性結構為compound symmetry,此資料型態如下表: SUBJECT 101 101 101 101 101 101 102 102 102 102 102 102 … VISITNO 2 3 4 2 3 4 2 3 4 2 3 4 … bf 21.67627 23.135 26.31943 17.46278 18.79371 19.91578 21.67627 20.84363 23.88159 15.60228 16.76827 18.25625 … METHOD 1 1 1 2 2 2 1 1 1 2 2 2 … 針對第(3)式的線性混合模型,利用R軟體的ccclonw函數進行長期追蹤資料之重複測量加權一致性相關係數的估計,此函數中需放入的參數如下:

6

1. dataset:資料名稱 2. ry:反應變數 3. rind:個案身份變數 4. rtime:重複測量時間變數 5. rmet:儀器方法變數 6. vecD:加權矩陣對角線向量 7. covar:個案解釋變數

8. rho:同一位個案觀測值之間的相關性結構;rho=0代表compound symmetry,

rho=1代表autoregressive order one

【cccvc程式碼】

ccclonw(dataset=bfat,ry=\"bf\rmet=\"METHOD\ 【結果】 CCC 0.565884

LL CI95% 0.459258

UL CI95% 0.6535

0.9204

SE CCC 0.050317

17.6777

Z Error 0.7698

SE Z

0.1447 0.074020

Variance Components: 8.5920

2.1082

Subjects Subjects-Method Subjects-Time Method-Time

此資料的分析結果為兩種體脂肪測量儀器的一致性程度為0.5659,95%的信賴區間為(0.4593, 0.65),表示兩種體脂肪測量儀器有中等程度的一致性,其中個體隨機效應變異數估計值為8.5920,隨機誤差變異數估計值為0.7698。此外,個案與儀器及個案與測量時間交互作用隨機效應的變異數估計值分別為2.1082及0.9204,儀器與測量時間交互作用效應變異數估計值為17.6777。

附錄:

在線性混合模式下,利用變異數成份估計一致性相關係數亦可使用SAS macro rm_ccc來進行估計,而此SAS macro rm_ccc中需放入的參數如下:

7

1. DATA:資料名稱 2. Y:反應變數

3. METHOD:儀器方法變數 4.TIME:重複測量時間變數 5. SUBJECT:個案身份變數

6. NL:重複測量的資料型態;NL=0代表長期追蹤資料(原始設定),NL=1代表

非長期追蹤資料

7. TYPE:同一位個案觀測值之間的相關性結構;TYPE=0代表沒有此相關性結

構(原始設定),TYPE=1代表autoregressive order one,TYPE=2代表compound symmetry

8. DIAG:加權矩陣對角線向量

針對第(1)式的線性混合模型,可利用SAS macro rm_ccc進行一致性相關係數估計的程式碼如下:

【SAS macro rm_ccc程式碼】

%rm_ccc(DATA= bpres, Y=DIA, METHOD=METHOD, TIME= VISITNO, SUBJECT=ID, NL=1) 針對第(3)式的線性混合模型,可利用SAS macro rm_ccc進行長期追蹤資料之重複測量加權一致性相關係數估計的程式碼如下: 【SAS macro rm_ccc程式碼】

%rm_ccc(DATA= bfat, Y=bf, METHOD=METHOD, TIME= VISITNO, SUBJECT=SUBJECT, NL=0, TYPE=2, DIAG=(2,1,1)) 參考文獻:

Bartko, J.J., 1966. The intraclass correlation coefficient as a measure of reliability. Psychological Reports 19, 3–11.

8

Carrasco, J.L., Jover, L., 2003. Estimating the generalized concordance correlation coefficient through variance components. Biometrics 59, 849–858.

Carrasco, J.L., King, T.S., Chinchilli, V.M., 2009. The concordance coefficient for repeated

measures

estimated

by

variance

components.

Journal

of

Biopharmaceutical Statistics 19, 90–105.

Carrasco, J.L., Phillips, B.R., Puig-Martineza, J., King, T.S., Chinchilli, V.M., 2013. Estimation of the concordance correlation coefficient for repeated measures using SAS and R. Computer Methods and Programs in Biomedicine 109, 293–304. Cohen, J., 1960. A coefficient of agreement for nominal scales. Educational and Psychological Measure 20, 37–46.

Cohen, J., 1968. Weighted kappa: nominal scale agreement with provision for scaled disagreement or partial credit. Psychological Bulletin 70, 213–220.

King, T.S., Chinchilli, V.M., 2001. A generalized concordance correlation coefficient for continuous and categorical data. Statistics in Medicine 20, 2131–2147. King, T.S., Chinchilli, V.M., Wang, K.L., Carrasco, J.L., 2007. A class of repeated measures concordance correlation coefficients. Journal of Biopharmaceutical Statistics 17, 653–672.

Lin, L.I., 19. A concordance correlation coefficient to evaluate reproducibility. Biometrics 45, 255–268.

Shrout, P.E., Fleiss J.L., 1979. Intraclass correlations: uses in assessing rater reliability. Psychological Bulletin 86, 420–428.

9

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- jqkq.cn 版权所有 赣ICP备2024042794号-4

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务