尤度・尤度比・事前確率 法数学勉強会(京大法医学講座) 2012/02/18

Report
尤度・尤度比・事前確率
法数学勉強会(京大法医学講座)
2012/02/18
京都大学 統計遺伝学
山田
臨床検査と尤度・尤度比
検査値が高いと「病気である」と診断
検査値が低いと「病気ではない」と診断
病気Xの診断をするために
検査Tを実施する
Xである
Xではない
•
•
•
•
•
•
Tが陽性
a
c
u
Tが陰性
b
d
v
s
t
1
a/s : 病気であるときの検査の陽性率(感度)
d/t : 病気でないときの検査の陰性率(特異度)
a/u : 検査が陽性のときに病気である確率(PPV)
d/v : 検査が陰性のときに病気でない確率(NPV)
s : 対象集団のうちの病気である割合(病気である事前確率)
t : 対象集団のうちの病気でない割合(病気でない事前確率)
Tが
陽性
受診した、検査した
Tが
陰性
Xで
ある
a b
s
Xで
はな
い
c
t
• 検査が陽性だった
d
u v 1
– 病気であったとしたら a/s の確率で陽性になる
• 感度
• 病気であるという仮説の下での尤度
– 病気でなかったとしたら c/t の確率で陽性になる
• 1-特異度
• 病気でないという仮説の下での尤度
– 尤度の比
• (a/s) / (c/t) = (at)/(cs)
• 病気である・病気でない の事前確率を等しいとした場合
Tが
陽性
検査した、診断する
• 検査が陽性だった
– 病気である確率は a/u
• 「Xであると診断」する確率
• PPV
– 病気でない確率は 1-a/u=c/u
• 「Xではないと診断」する確率
• 1-PPV
Tが
陰性
Xで
ある
a b
s
Xで
はな
い
c
t
d
u v 1
Tが
陽性
検査した、診断する
• 検査が陽性だった
Tが
陰性
Xで
ある
a b
s
Xで
はな
い
c
t
d
u v 1
– 病気である確率は a/u
– 病気でない確率は 1-a/u=c/u
– 比をとる → 尤度比
•
•
•
•
a/c =(s x a/s) / (t x c/t)
s x a/s : (病気である事前確率) x (病気である仮説での尤度)
t x c/t : (病気でない事前確率) x (病気でない仮説での尤度)
事前確率を持ち込んだ尤度比
– 事前確率を等しいとした尤度比は
» (a/s) / (c/t)
Tが
陽性
2つの診断
• 高いPPV : a/u
– 「病気Xです」と診断
– 『ルール・インする』
• 高いNPV : d/v
– 「病気Xではないです」と診断
– 『ルール・アウトする』
Tが
陰性
Xで
ある
a b
s
Xで
はな
い
c
t
d
u v 1
病気Xの診断をするために
検査Tを実施する
Xである
Xではない
Tが陽性
a
c
u
Tが陰性
b
d
v
s
t
1
Aさんが、夫婦Xの子xであるかどうか
ジェノタイプ
が一致する?
Xの子xのジェ
ノタイプ
Aのジェノタイプ
Aのジェノタイプ以
外のジェノタイプ
a
b
s
c
d
t
u
v
1
一般人のジェ
ノタイプ
x
A
Aさんが、夫婦Xの子xであるかどうか
確率
Aのジェノタイプ
Aのジェノタイプ以外のジェノタイプ
Xの子xのジェノタイプ
a
c
u
b
d
v
一般人のジェノタイプ
•
•
•
•
s
t
1
a/s, b/s は計算できる → 感度の計算が可能
c/t, d/t も計算できる → 特異度の計算が可能
尤度比 (a/s)/(c/t) は計算できる
判断のためのPPV,NPVはs,t(事前確率)を与えな
いと計算できない
x
A
Tが
陽性
2つの判定
• AさんはX夫婦の子供である
Tが
陰性
Xで
ある
a b
s
Xで
はな
い
c
t
d
u v 1
– PPV : a/u で判断
• AさんはX夫婦の子供ではない
– NPV : d/v で判断
x
A
判定例
• xのDNAが得られている場合
Tが
陽性
Tが
陰性
Xで
ある
s
0
s
Xで
はな
い
c
d
t
u v 1
– a=s, b=0
» Aさんのジェノタイプがxさんのそれと一致すれ
ば
• PPV : a/u = s/u = s/(s+ct) で「A=x」と判断
» Aさんのジェノタイプがxさんのそれと一致しな
ければ
• NPV : d/v = d/d = 1 で「Aさん以外の人がx
である~Aさんはxではない」と判断
– 事前確率s,t によらない
x
A
Tが
陽性
判定例 2
Tが
陰性
Xで
ある
a b
s
Xで
はな
い
c
t
d
• xのDNAが得られていない場合
u v 1
– a/s はそこそこ小さく、b/s はそれなりに大きい
– c/t はかなりちいさく、d/t はそれなりに大きい
» PPV は大きくなりえるが
• Aさんがxさんであるという判定はできるが
» NPV は大きくなりにくい
• Aさんがxさんではない、という判定は難し
い
x
A
Tが
陽性
どれくらいのPPVが必要?
• PPV : a/u (事前確率込み)
Tが
陰性
Xで
ある
a b
s
Xで
はな
い
c
t
d
u v 1
診断する、治療する
• 診断名の重みで必要なPPV, NPVが変わる
• 治療の判断は、診断があいまいなまま、行える
(行う)
– 心筋梗塞
• PPVが低くても、酸素投与は開始する
– 急性腹症
• それなりに高いPPVが出れば、開腹手術してみてから診断
が確定することもある(試験開腹)
– 肺がん
• 片肺摘出は「確定診断」がついてから
PPVの大きさの基準は
判断後の行動が左右する
• DNA鑑定という判断後の行動とは?
– 「親子なのか、そうでないのか」
– 「犯人なのか、そうでないのか」
– どのレベル?
• 酸素吸入?
• 試験開腹?
• 肺切除?
もう少し臨床診断に即して
考えてみる
臨床診断
• H1:「Aさんは病気Xである」
• H2:「Aさんは病気Xではない」
• 仮説は2つしかない
– H1 ∪ H2 = Ω
– H1 ∩ H2 = ∅
• 尤度とその比
– 事前確率を均等に
• (a/s) / (c/t) = (at)/(cs)
– 事前確率を持ち込んで
• a/c =(s x a/s) / (t x c/t)
少し複雑にする
AさんとBさんとが受診した
•
•
•
•
H1:「Aさんが病気X、Bさんも病気X」
H2:「Aさんは病気X、Bさんは病気Xではない」
H3:「Aさんは病気Xではない、Bさんは病気X」
H4:「Aさんは病気Xではなく、Bさんも病気Xではな
い」
• 事前確率は?
– H1=H2=H3=H4=1/4 ??
– H1=ss,H2=H3=st,H4=tt ??
Aさんは男、Bさんは女
A(男)用
Xである
Xではない
Tが陽性
a
c
u
Tが陰性
b
d
v
s
t
1
B(女)用
Xである
Xではない
Tが陽性
a’
c’
u’
Tが陰性
b’
d’
v’
s’
t’
1
事前確率は
H1=ss’, H2=st’, H3=s’t, H4=tt’
Aさんが受診した
病気Xの検査Txと病気Yの検査Ty
•
•
•
•
H1:「Aさんが病気Xであり、病気Yでもある」
H2:「Aさんは病気Xであり、病気Yではない」
H3:「Aさんは病気Xではなく、病気Yである」
H4:「Aさんは病気Xではなく、病気Yでもない」
• 事前確率は?
– H1,H2,H3,H4
Aさんが受診した
病気Xの検査Txと病気Yの検査Ty
X用
Xである
Xではない
Txが陽性
a
c
u
Txが陰性
b
d
v
s
t
1
Y用
Yである
Yではない
Tyが陽性
a’
c’
u’
Tが陰性
b’
d’
v’
s’
t’
1
Aさんが受診した
病気Xの検査Txと病気Yの検査Ty
• XとYとは紛らわしい病気
• XとYとの両方ということはない
•
•
•
•
H1:「Aさんが病気Xであり、病気Yでもある」
H2:「Aさんは病気Xであり、病気Yではない」
H3:「Aさんは病気Xではなく、病気Yである」
H4:「Aさんは病気Xではなく、病気Yでもない」
• 事前確率は
– H1 : H2 : H3 : H4 = 0 : st’ : s’t : tt’
• Aさん、Bさん、2人のXの診断は独立して下し
た
– 2人のための確率計算表は異なった
• 1人の人に考えられる複数の診断名は相互
に独立していなかった
– 事前確率が0の仮説があった
DNA鑑定という判断
• いくつかの例を
取り違え事件
• 夫婦Xの子x
• 夫婦Yの子y
• 親がわからなくなった子供AとB
個人識別のためのテスト
• xさん/yさんのジェノタイプは確率的に予想さ
れる
x用
Aのジェノタイプである確率
p(A=x)
Aのジェノタイプではない確率
1-p(A=x)
1
Bのジェノタイプである確率
p(B=x)
Bのジェノタイプではない確率
1-p(B=x)
1
Aのジェノタイプである確率
p(A=y)
Aのジェノタイプではない確率
1-p(A=y)
1
Bのジェノタイプである確率
p(B=y)
Bのジェノタイプではない確率
1-p(B=y)
1
y用
取り違え事件
• 夫婦Xの子x
• 夫婦Yの子y
• 子供AとB
B=x
B=y
A=x
H1:
A=x & B=x
H3:
A=x & B=y
A=y
H2:
A=y & B=x
H4:
A=y & B=y
取り違え事件
• 夫婦Xの子x
• 夫婦Yの子y
• 子供AとB
B=x
B=y
事前確率は
H1 = H4 = 0
H2=H3 = 0.5
A=x
H1:
A=x & B=x
H3:
A=x & B=y
A=y
H2:
A=y & B=x
H4:
A=y & B=y
『割り付け』するときには
あり得ない仮説がある
事前確率は
取り違え事件 H1 = H4 = 0
H2=H3 = 0.5
• 事前確率込みの尤度の比較
– H1 = 0
– H2 = P(A=x)P(B=y)
– H3 = P(A=y)P(B=x)
– H4 = 0
B=x
B=y
A=x
H1:
A=x & B=x
H3:
A=x & B=y
A=y
H2:
A=y & B=x
H4:
A=y & B=y
事前確率は
取り違え事件 H1 = H4 = 0
H2=H3 = 0.5
• 事前確率込みの尤度の比較
– H1 = 0
– H2 = P(A=x)P(B=y)
– H3 = P(A=y)P(B=x)
– H4 = 0
• 尤度比としていくつが適当?
PPVの大きさの基準は
判断後の行動が左右する
• DNA鑑定という判断後の行動とは?
– 「親子なのか、そうでないのか」
– 「犯人なのか、そうでないのか」
– どのレベル?
• 酸素吸入?
• 試験開腹?
• 肺切除?
事前確率は
取り違え事件 H1 = H4 = 0
• 事前確率込みの尤度の比較
H2=H3 = 0.5
–
–
–
–
H1 = 0
H2 = P(A=x)P(B=y)
H3 = P(A=y)P(B=x)
H4 = 0
• 尤度比としていくつが適当?
• P(A=x)P(B=y) : P(A=y)P(B=x)
• 自分なら、いくつの値で決断するか
• 決断に困ったら・・・現実的に考えるために
–
「値段で考えてみる」というのも一つのやり方
» 尤度比100なら10万円
» 尤度比1000なら100万円
» 尤度比10000なら1000万円
» 尤度比100000なら1億円・・・かかるとしたら、どこで手を打つ?
取り違え大事件
• 夫婦X1の子x1
• 夫婦X2の子x2
• ...全部でN夫婦のN人の子
• 親がわからなくなった子供A1,...,AN
個人識別のためのテスト
• xiさんのジェノタイプは確率的に予想される
x1用
p(A1=x1)
1-p(A1=x1)
1
p(A2=x1)
1-p(A2=x1)
1
・・・・・・・・・
・・・・・・・・・・・・
1
p(A1=x2)
1-p(A1=x2)
1
p(A2=x2)
1-p(A2=x2)
1
・・・・・・・・・
・・・・・・・・・・・・
1
p(A1=x3)
1-p(A1=x3)
1
p(A2=x3)
1-p(A2=x3)
1
・・・・・・・・・
・・・・・・・・・・・・
1
x2用
x3用
いろんな割り付けがある
• A1=x1 A2=x1 のような割り付けは許されないので、
書くのを省略する
• 許されない割り付けを書かないのは、『事前確率が
0だから』
A1
A2
A3
...
AN
H1
X1
X2
X3
...
XN
H2
X2
X1
X3
...
XN
H3
X3
X2
X1
...
XN
...
...
...
...
...
...
HN!
XN
XN-1
XN-2
...
X1
A1
A2
A3
...
AN
H1
X1
X2
X3
...
XN
H2
X2
X1
X3
...
XN
H3
X3
X2
X1
...
XN
...
...
...
...
...
...
HN!
XN
XN-1
XN-2
...
X1
• どの割り付けが最も適当か?
• Xi = Aj であるかどうかの判断はどうしたらよい
か
• 大規模災害時の割り付け問題(前回・前々回
の話)
取り違え大事件
• L1=尤度(Ai = xj, あとの組合せはなんでもあり)
• L2=尤度(Ai != xj, あとの組合せは相変わらず何でもあり)
• L1 : L2 尤度比としていくつが適当?
• N人のうち、xj である尤度が一番大きく、それ
以外の尤度のすべてを併せたものと比べて、
L倍だったら、信じよう
• どれくらいの L が必要?
PPVの大きさの基準は
判断後の行動が左右する
大
– 「取り違え事件」と「取り違え
事件」とでは、判
断後の行動は同じなのでは?
取り違え大事件
• 判断後の行動が同じなら、
• L は同じでよいのでは??
島の子ザル
• 絶海の孤島
– ボス(雄)ザルが倒れ序列が崩壊
– N頭の雄ザル
• 1頭だけ、『血統書付き』
– 1頭の雌ザルから1頭の子ザルが生まれた
– 父ザルは『血統書付き』か否か!
島の子ザル
• 雄ザルのDNA
– 『血統書付き』の雄ザルのDNAはある
– それ以外はマーカーの『頻度』だけ
• 事前確率
– すべての雄ザルが 1/N
島の子ザル
• 雄ザル
– S1,S2,...,SN
– S1:血統書付き
– 尤度比
• p(1) : (N-1)p(2)
雄ザル
子ザルのジェノタイプの子
が産まれる確率
S1
p(1)
S2
p(2)
S3
P(3) = P(2)
...
...
SN
P(N) = P(2)
島の子ザル
• 雄ザル
– 個体別の尤度比
• p(1) : p(2)
– 個体別の尤度比として、どれくらいの大きさで納
得するか
– 「取り違え事件」の1/N ?
雄ザル
子ザルのジェノタイプの子
が産まれる確率
S1
p(1)
S2
p(2)
S3
P(3) = P(2)
島の子ザル
• 実は
– すべての雄ザルと雌ザルには「GPS」がつけられ
ていて、「近くに居た時間」が計測されていた!
– 近くに居た時間に比例して『事前確率』を変更し
よう!
GPS搭載のウミガメ
父親鑑定
島の子ザル
• 絶海の孤島
– ボス(雄)ザルが倒れ序列が崩壊
– N頭の雄ザル
• 1頭だけ、『血統書付き』
– 1頭の雌ザルから1頭の子ザルが生まれた
– 父ザルは『血統書付き』か否か!
日本列島の子
• 絶海の孤島
– N人の候補者
• 1人だけ、『お墨(戸籍)付き』
– 父親は『お墨付き』か否か!
日本列島の子
• 候補者のDNA
– 『お墨付き』候補者のDNAはある
– それ以外はマーカーの『頻度』だけ
• 事前確率
– すべての候補者が 1/N ???
–N
• ~5000万(半数) ?
• ~4000万(成人男性) ?
日本列島の子
• 実は
– すべての候補者と母親には「GPS」がつけられて
いて、「近くに居た時間」が計測されていた!!!
• 近くに居た時間に比例して『事前確率』を変更
しよう!
日本列島の子
• 候補者個体別の尤度比は計算できる
– p(1) : p(2)
• さすがに、GPS記録はないけれども・・・
• それに準じて、事前確率の重みはつけられる
か・・・
GPS記録はないけれども・・・
• 事前確率
– 妊娠時期の見積もりずれが30-60日??として
• N~30-60?? (単位は『日』)
• N~30-60 x 24 (単位は『時間』)
• N~30-60 x 24 x 60 (単位は『分』)
– 『近くに居た時間』という重みづけは、もう少し、考えら
れそう
• 事前確率「込み」での尤度比が L なら信用する
のなら、
– Lは2体取り違えと大差ない・・・?
GPS記録はないけれども・・・
• N~30-60??
• 事前確率「込み」での尤度比が L なら信用す
るのなら、
– Lは2体取り違えと大差ない・・・?
– 要求される候補者個体別の尤度比 p(1) / p(2)
は
• p(1) / (p(2)xN) = L
• p(1) / p(2) = NxL
今日はここまで
次回?
マルチプルテスティング問題
• ペテン師団が
– 手を変え品を変えて、100人を候補者として順繰
りに送り込んできて、100人目で「当たった」とす
る
次回?
マルチプルテスティング問題
• カタログと照合するときのこと
– それらしいカタログ、それらしくないカタログ
• 事前確率の高いカタログ、そうでもないカタログ
• そのときの尤度・尤度比の評価
• カタログの大きさ(母集団に占めるカタログ上
サンプルの比率)の影響・・・
肉親を求めて
• 記憶喪失で発見された。天涯
孤独?
• いとこはいそうだ
肉親を求めて
• 事前確率は 1/N : Nは人口?
• 可能性のあるジェノタイプは
K 種類、それぞれの確率はpi,
i=1,2,...,K
• 世界でそれぞれのジェノタイ
プの頻度はqi
• 尤度が pi の人が Nxqi 人
肉親を求めて
• ペテン師が登場
– 「私の持つ100人のリストの中に探しているいと
こが含まれている、と自信があります!」
– その100人のジェノタイプが、いとこのジェノタイ
プである確率が ri, i=1,2,...,100
– その100人のジェノタイプが、一般集団に占める
割合を ti, i=1,2,...,100
• ペテン師のリストに本当のいとこが含まれて
いるか、いないか、という尤度比はどう考え
る?
肉親を求めて
• H1
– ペテン師のリストに本当のいとこが含まれている
• H2
– ペテン師のリストに本当のいとこが含まれていな
い
肉親を求めて
• H1
– ペテン師のリストに本当のいとこが含まれている
– 100人のうち1人が「本物」で、残りの99人を「偽物」とし
た上で、すべての場合について、生起確率を計算して合
算する
– L1 = Σi ri Πj != i tj
• H2
– ペテン師のリストに本当のいとこが含まれていない
– 100人のうち全員の100人を「偽物」とし、N-100人の中
の1人がいとこである、生起確率を計算して合算する
– L2 = Πj tj
• L1/L2 = Σi ri / ti
肉親を求めて
• 『親切な人』が登場
– 「私の持つ100人のリストの中に探しているいとこが含ま
れている、と自信があります!」
– その100人のジェノタイプが、いとこのジェノタイプである
確率が ri, i=1,2,...,100
• 『親切な人』のリストに本当のいとこが含まれているか、
いないか、という尤度比はどう考える?
• 『ペテン師』と『親切な人』の差は
– リストに含まれている、と信じる「事前確率」が異なること
• ペテン師の場合、100/N
• 親切な人の場合、 >100/N
– 『親切』な程度の『根拠』に応じて事前確率を上げる
熟考すべきは
事前確率か

similar documents