下載 - 義守大學

Report
存活分析與臨床應用
義守大學財金系教授
許碧峰
電話:6577711-5717
e-mail:[email protected]
講次大綱

存活函數、危險函數、累積危險函數

存活分析之非參數法- Kaplan-Meier survival curve

存活分析之半參數法- Cox proportional hazard model

存活分析之參數法-假設事件發生前時間的分配符合某一
特定類型,如Weibull分配,指數分配,Loglogist分配,
Lognormal分配, Gamma分配等
2
何謂存活分析?
分析事件發生前的”期間”之統計方法
(the length of time until an event occurs)
e.x.結婚發生前的
e.x.出院發生前的
時間長度
時間長度
事件發生前
的時間長度
e.x.倒閉發生前的
e.x.復發發生前的
時間長度
時間長度
3
檢定”期間”的差異或影響因素
檢定期間的
差異
•不同學歷在結婚前的時間長度
•不同醫院在出院前的時間長度
•不同處置在復發前的時間長度
•不同產業在倒閉前的時間長度
估計期間的
影響因素
•影響結婚前時間長度的因素
•影響出院前時間長度的因素
•影響復發前時間長度的因素
•影響倒閉前時間長度的因素
4
存活分析中的幾個函數:都可由S(t)函數轉換
• S(t) = 1 − F(t) =
Pr(T > t)
存活函數:至少
可以存活至t時
點的機率(至t時點
尚未發生該事件的
機率)
危險函數:至少可以存活
至t時點的前提下,t時點
瞬間發生死亡的機率
累積危險
函數:危
險函數t
時點以下
累加機率
6
Kaplan-Meier Survival Curve
Time
tj
# of risk
set
nj
# of
death
dj
# of
censored
dj
0
Cj
1
Pr(T>t)
S(t)
[0,3)
10
[3,5)
9
1
1
S(3)=1*8/9=0.89
[5,7)
7
2
1
S(5)=1*8/9*5/7=0.64
[7,8)
4
2
2
S(7)=1*8/9*5/7*2/4=0.32
KM formula (1958)→
S (t ) 
S(0)=1

t
j
t
n
j
 d
n
j
j
7
Kaplan-Meier Survival Curve: S(t)
1.00
Kaplan-Meier survival estimates, by drug
0.00
0.25
0.50
0.75
以下累加機率為
0.5發生的時間點
0
10
20
analysis time
drug = 0
30
40
drug = 1
中位數存活時間(無用藥)=8個月
 中位數存活時間(用藥)=28個月

8
以下累積危險函數 H(t)=-lnS(t)
0.00
0.25
0.50
0.75
1.00
Kaplan-Meier failure estimates, by drug
0
10
20
analysis time
drug = 0
30
40
drug = 1
存活期間≤t的以下累加機率
F(t) = Pr(T ≤ t)=1-S(t)
9
危險函數 h(t)=-S’(t)/S(t)
0
.05
.1
.15
Smoothed hazard estimates, by drug
0
10
20
analysis time
drug = 0

30
40
drug = 1
危險函數:以存活至時點t的前提下,瞬間發生死亡的機率
h(t)=-S’(t)/S(t)
10
以下累積危險函數 H(t)=-lnS(t)
0.00
1.00
2.00
3.00
4.00
Nelson-Aalen cumulative hazard estimates, by drug
0
10
20
analysis time
drug = 0

30
40
drug = 1
累積危險函數:危險函數t時點以下累加機率
H(t)=-lnS(t)
11
存活曲線在癌症病例之應用
定義事件=1
Overall survival
Disease free survival
t(月) 轉移,復發或死亡=1,反之=0
t(月)
死亡=1, 反之=0
27
0 (alive)
27
0 (alive)
41
0 (alive)
41
0 (alive)
27
0 (alive)
25
1 (復發)
40
1 (死亡)
37
1 (轉移)
8
1 (死亡)
5
1 (轉移)
15
1 (死亡)
12
1 (轉移)
9
1 (死亡)
9
1 (死亡)
37
0 (alive)
37
0 (alive)
12
0.00
0.25
0.50
0.75
1.00
癌症病患之Kaplan-Meier Survival Curve
overall survival
0
10
20
30
40
Time (months)
disease free survival
50
60
Figure 4
 中位數存活時間(disease
free survival )=38個月
50%的病患無轉移、復發、死亡的存活期為38個月13
Log-Rank test:
檢定存活曲線間是否有差異
0.00
0.25
0.50
0.75
1.00
Kaplan-Meier survival estimates, by drug
0
10
20
analysis time
drug = 0
30
drug = 1
40
• Log-rank test
2

= (1 )  28 . 27
(p值<0.001)
所以具顯著差異
Note:
• 存活曲線不可相交
• 可檢定多條存活曲線
14
哪些因素將影響事件發生的危險率:
COX比例危險模型
冠狀動脈繞道手術病患死亡危險率之影響因素
醫師年手術 醫院型態
Carlson
共併症指數 量
住院
天數
死亡
年齡
處置方式
3
1
79
OP3615
5
45
0
20
0
56
OP3614
2
102
1
22
0
60
OP3612
3
88
1
18
0
45
OP3612
1
102
1
16
0
62
OP3613
1
88
1
2
1
77
OP3614
5
38
0
5
1
68
OP8856
4
38
0
15
COX比例危險模型
設有n名病人(i=1,2,…,n),第i名病人的生存時間為ti,
xi1 ,xi2 , xi3, …, xip等解釋變數將影響事件發生的危險率:
將t時點發生事件的危險率表示成如下三種型式:
ln h(t,X)  ln h0 (t )  ( 1 X 1   2 X 2 
h(t,X)  h0 (t ) exp( 1 X 1   2 X 2 
ln
h(t,X)
h0 (t )
 1 X 1   2 X 2 
 pX p)
 pX p)
 pX p
Cox比例危險模型
因H (t)無任何限定函數型式-半參數模型
0
h ( t )  h0 ( t ) exp(  1 X 1   2 X 2     k X k )

被解釋變數為任何時點t瞬間發生事件的危險率。

h 0 ( t ):時間點t時的基本危險函數(baseline hazard function),
表示當解釋變數均為0時的事件機率。

多增加一單位X將使事件的發生增加 exp(  ) 倍,若 exp(  )
<1則危險率下降。
17
COX比例危險模型估計結果
冠狀動脈繞道手術病患死亡危險率之影響因素
係數(b) exp(b)
z値
P值
0.031 **
1.032
(10.89)
<0.001
-0.193 **
0.825
-(6.00)
<0.001
冠狀動脈繞道一條(3611)
0.541 **
1.718
(3.20)
0.001
冠狀動脈繞道三條(3613)
0.265
------
(1.63)
0.102
內乳動脈繞道手術
-0.783 **
0.457
-(11.70)
<0.001
主動脈內氣球幫浦
0.060 **
1.060
(20.02)
<0.001
瓣環成形術
0.982 **
2.669
(7.13)
<0.001
AIC
23528
樣本數
19908
年齡
ln(手術量)
18
COX比例危險模型估計結果
19
COX比例危險模型
.03
.02
0
.01
hazard
.04
.05
病2發生死亡的危險率是病1的五倍
0
50
100
150
analy sis time
Patient 1
Patient 2
200
COX比例危險模型之假設
Cox假設:
各變 數 對危 險 率
之影響不隨時間
而改變(在任何時
間點都是一樣的)
21
COX比例危險模型
治療組與安慰劑病患發生的死亡危險率在任何時間下並非固定比例
COX比例危險模型之估計
部分概似函數(partial likelihood function,Lp)
d (非 删 失 时 点 数 )
Lp 

h0 ( t i ) e x p (  1 X
d (非 删 失 时 点 数 )
qi 
i 1

i 1

i1

h0 ( t i ) e x p (  1 X
j1
 
p
X
 

p
ip
X
)
jp
)
j Ri
d (非 删 失 时 点 数 )


i 1
exp( 1 X

i1

exp( 1 X
j1
 

p
X
 
p
ip
X
)
jp
)
j Ri
分母:j∈Ri表示在ti時點未發生該事件所有樣本危險率和
(包括設限樣本)
分子在ti時點發生該事件樣本的危險率
COX比例危險模型之估計
d (非 删 失 时 点 数 )
Lp 

h 0 ( t i ) ex p (  1 X i 1 
d (非 删 失 时 点 数 )

qi 
i 1

i 1
h 0 ( t i ) ex p (  1 X
j1
  p X ip )

 pX
j Ri
d (非 删 失 时 点 数 )


ex p (  1 X i 1 

i 1
ex p (  1 X
j1
  p X ip )

 pX
jp
)
j Ri
n
为 了 计 算 机 计 算 , Lp 

i 1






ex p (  1 X i 1 
  p X ip )


 e x p (  1 X j 1    p X jp ) 
j Ri

1
其 中  i= 
0
第 i个 体 死 亡
第 i个 体 删 失
i
jp
)
病人
是否 性别 生存 發生死
處理 (男=1) 天数 亡=1)
危險函數
(因人而異)
h(t)=h0(t) e
Name
x1
x2
t
d
病一
1
1
18
1
h0(t) e
病二
0
0
48
1
h0(t)
病三
0
1
70
0
h0(t) e
b2
h0(t) e
b1
病四
1
0
90
1
條件死亡危險率 q i  hi ( t )  h j ( t ) ,
(第 i 个死亡時點)
部分概似函數
( 條件死亡危險率
連乘)
L p  q1q 2  q k ,
危險率(每個時點)
b1 x 1  b 2 x 2
18 天
b1  b2
48 天
h0(18) e
q i:
e
e
Lp 
b1  b 2
e
b1  b2
h0(18) e
0
h0(48) e
0
h0(18) e
b2
h0(48) e
b2
h0(18) e
b1
h0(48) e
b1
b1  b 2
e e
0
e
b1  b2
90天
b2
e
b1
e e e
b2
b1
h0(90) e
1
,
e e
0
b1  b2
0
+

b2
e
b1
1
e e e
0
b2
b1
b1
,

e
b1
e
b1
e
b1
e
b1
COX比例危險模型之估計
对数偏似然函数
d

 ( x
1 i1
i 1
令
d l(  )
d
l(  )  ln L p
d

  p x ip )  
i 1

ln   (  1 x j 1 
 j Ri
 0, 求 解 回 归 参 数 。
( 求 解 方 法 类 似 Logistic 回 归 )

  p x jp ) 

當模型不符合COX比例危險模型之假設
27
參數存活模型-指數分配
a. Exponential Distribution
The probability density function
f (t )  
dS ( t )
dt
 e  t
 
0
, t  0,
, t  0
The survivorship function
S(t)  e
-t
,t  0
The hazard function
h (t )  
,t  0
 0
參數存活模型-Weibull分配
b. Weibull Distribution
The probability density function
 1  (  t )
dS ( t )   (  t ) e
f (t )  

dt
 0

, t  0,  ,   0
, t0
The survivorship function
S(t)  e
-(  t)

,t  0
The hazard function
h ( t )   (  )
 1
,t  0
參數存活模型-Lognormal 分配
c. Lognormal Distribution
The probability density function
f (t )  
dS ( t )
dt
1
1

exp[ 

  t 2 π
2
0

(ln t   ) ]
2
2
, t  0,
 0
, t0
The survivorship function
S (t ) 
1

2π
t

1
exp[ 
x
1
2
(ln x   ) ]dx
2
2
The hazard function
h (t ) 
(1 t 
2 π ) exp[  (ln at )
1  G ( ln at  )
2
2
2
]
參數存活模型-Gamma分配
d. Gamma Distribution
The probability density function
 
 -1   t
( t ) e
dS ( t ) 
f (t )  
   ( )
dt
0

, t  0,
  0,
 0
, t 0
The survivorship function
S (t ) 

t


 ( )
( x )
 -1
e
x
dx
, t  0,
The hazard function
h (t ) 

t


 -1
t
(  t)
e
 ( )

 -1
x
( x )
e
dx
 ( )
  0,
 0
參數存活模型-log-logistic分配
e. Log-Logistic Distribution
The probability density function
  t   1
dS ( t )

f (t )  
  (1   t  ) 2
dt
0

, t  0,
  0,
, t  0
The survivorship function
S(t) 
1
1  t
, t  0,

  0,
 0
The hazard function
h (t ) 
 t
 1
1  t

, t  0,
  0,
 0
  0
參數存活模型之估計-概似函數
概似函數可寫為:

ln L 
uncensored
 ln S ( t  )
ln f ( t  ) 
observatio ns
censored
observatio ns
因f(t)=h(t)S(t)

ln L 
uncensored
observatio ns
 ln S ( t  )
ln h ( t  ) 
all
observatio ns
謝謝聆聽!

similar documents