メカニズムデザインと最適化

Report
メカニズムデザインと最適化:ゲー
ム理論的制度設計への最適化技
術の応用
岩崎敦
九州大学
e-mail: [email protected]
URL: https://sites.google.com/site/a2ciwasaki
Twitter: @a2c_iwasaki
オークションメカニズム
第二価格入札
第一価格入札
正直に入札
自分が入札
$201を入札
$250を入札し,
することで
した$250を
すれば利益が
支払いは$200
一番得する
支払う
増える
になる
A IR
L IN
E
$250
$201
$150
$200
第一価格入札
最高額の入札者が
最高額で落札
第二価格入札
(Vickrey 入札)
最高額の入札者が
2番目に高い額で落札
正直が最良の策
2
どんな最適化?
• 誘因制約付き組合せ最適化 (Combinatorial
optimization with incentive constraint)
• 何を最適化する?
– 商品(財)やサービスを一番欲しい(≒お金を払う気があ
る)人達に割当
– 人々の選好/評価値/費用が正確に把握できるなら,a
weighted set packing problemと等価
• 誘因制約とは?
– 人々は自分の利益のために,割当や支払額を操作する
ために戦略的に嘘をつくかもしれない(利己的エージェン
ト/戦略的エージェント).
– 人々が正直に振る舞う誘因をもつように割当を決定する
必要がある.
ゲーム理論的制度設計(メカニズムデ
ザイン)
• 複数の戦略的エージェンに対して,望ましい
結果をもたらすメカニズム/ルール/アルゴ
リズムの設計
• あるメカニズムが戦略的操作不可能
(strategy-proof) とは, 各エージェントにとって
正直に振る舞うことで,各エージェントの利益
が最大化される.
代表的な実践例
• オークション
– 周波数オークション
– 国債の販売
– キーワード広告
• マッチング
– 研修医マッチング
– 学校選択制
– 臓器移植ネットワーク
要約
• 架空名義入札/操作の影響を受けない組合
わせオークションメカニズムを自動的に設計
する手法を紹介
• 架空名義入札/操作
– 1人が複数の名義を用いて入札することで不正
に利益を増加させる行為
• メカニズムの自動設計(自動メカニズムデザ
イン)
– メカニズム設計の問題を最適化問題として表現
アウトライン
• 組合せオークションと架空名義操作
– Vickrey-Clarke-Groves メカニズム (VCG)
• 既存の架空名義操作不可能なメカニズム
• 適応的留保価格 (Adaptive reserve price,
ARP) メカニズム
• 自動メカニズムデザインによるARPメカニズム
の発見
組合せオークション
(複数種類の財のオークション)
• 複数種類の財を同時に販売
• 財の価値の間に依存関係が存在
– 補完的: パソコンとメモリ
– 代替的: VAIOとThinkPad
• 財の組合せに対する入札を許すことにより,
社会的余剰/売手の収入が増加
–
–
–
–
社会的余剰:売り手も含めた参加者の利益の総和
FCC周波数帯域オークション
Googleなどのキーワード広告オークション
Combinatorial auctions, Cramton et al., 2006
架空名義操作
架空名義操作
入札
• 1人が複数の名義から入
札をすること
• ネットワーク環境では検出
することは事実上不可能
• 架空名義操作不可能性
(false-name-proofness)
• 架空の名義を用いて
申告しても効用が増加
しない
• 戦略的操作不可能性
(strategy-proofness) の
一般化
本研究の動機
• Vickrey-Clarke-Groves メカニズムはパレート効率性と戦
略的操作不可能性を同時に満たす優れたメカニズムだ
が,架空名義入札により操作可能
• 戦略的操作不可能性と架空名義操作不可能性を同時
に満たしつつパレート効率的な割当を実現するメカニズ
ムは存在しない (Yokoo et al., GEB, 2004)
• 架空名義操作不可能性を実現するためには,効率性を
犠牲にする必要がある.
– 競合比 (competitive ratio): パレート効率的な割当てとの比
の最悪値
• できるだけ競合比が高いメカニズムのヒントを得るため
に自動メカニズムデザインを利用
各バンドル/財に対する最大入札額
bidder 0
bidder 1
bidder 2
• 3人の入札者がAとBの2財
のオークションに参加
• 全ての入札者はは単一バ
ンドル指向とする.
– 各入札者は{A,B}, {A}のみ,
{B}のみのいずれかに入札
v{A,B}
v{A}
v{B}
• 各バンドル/財に対する最
大入札額をv{A,B}, v{A}, v{B} と
し,それぞれは入札者0, 1,
2が入札する.
• W.l.o.g. v{A} ≧ v{B}.
Vickrey-Clarke-Groves メカニズム (VCG)
• Grovesメカニズムのあるインスタンス,一般化ヴィッ
クレーとも呼ばれる.
• VCGでは,財を社会的余剰が最大化されるよう割り
当てる.
• 支払額には,勝者のクリティカル値 (critical value) を
計算する.
– (他者の入札を固定して)勝者が勝てる入札額の下限
• VCGは戦略的操作不可能,パレート効率的,かつ個
人合理的であるが,架空名義操作不可能ではな
い.
VCGの例(その1)
bidder 0
bidder 1
$3
bidder 2
$1
• 入札者1と2に{A} と{B}をそ
れぞれ割り当てるのがパ
レート効率的
• 入札者0と2の入札を固定し
た時,入札者1は勝てる入
札額の下限である$3を支
払う.
– $3が入札者1のクリティカル
値
$5 $3
$4 $1
$2
v{A,B}
v{A}
v{B}
• 入札者2は,そのクリティカ
ル値である$1を支払う.
VCGの例(その2)
bidder 0
bidder 1
$5
$5 $6
v{A,B}
v{A,B}
• AとBの2財のオークション
• 入札者1に{A,B}を割り当て
るのがパレート効率的.
• 入札者0の入札を固定した
時,入札者1が勝者となる
入札の下限である$5を入
札者1は支払う.
• もし,入札者1が2つの名義
を使って入札を {A}に$4, {B}
に$2のように分割すると何
が起こるか?
VCGの脆弱性
bidder 0
bidder 1
$3
$5
bidder 2
$1
≧
$4
$5 $6
$4 $2
v{A,B}
v{A}
v{B}
• 例(その1)となる.
• 入札者1が入札を分割する
と,{A,B} が割り当てられ,
$3+$1=$4 を支払う.
• 分割しなくても, {A,B} が割
り当てられるが,$5 を支払
わなければならない.
• VCGにおいて,入札者1は
入札を分割することで利得
が増加する.
• このような操作を「架空名
義入札/操作」と呼ぶ.
アウトライン
• 組合せオークションと架空名義操作
– Vickrey-Clarke-Groves メカニズム (VCG)
• 既存の架空名義操作不可能なメカニズム
• 適応的留保価格 (Adaptive reserve price,
ARP) メカニズム
• 自動メカニズムデザインによるARPメカニズム
の発見
VCGの何が問題か?
• VCGでは,財{A} への支払いと財{B} への支払い
の合計がバンドル{A,B}への支払いより小さくな
ることがある.
• では,支払額を調整するだけで,架空名義入札
による不正な利益の増加を防ぐことができる
か?
• それはパレート効率性を犠牲にしない限り不可
能.
• そこで,いくつかの場合において,効率的でない
割り当てを選ぶメカニズムを考えなければならな
い.
効率的でない割り当て
bidder 0
bidder 1
bidder 2
$4
$5 $4 $2
v{A,B}
v{A}
v{B}
• 全ての財をまとめて販売する
セットメカニズムを考える:
– 入札者1が入札を分割する
と,入札者0に{A,B}を割り当
てて,$4を支払わせる.
効率的でない割り当て
bidder 0
bidder 1
$5
$5 $6
v{A,B}
v{A,B}
• 全ての財をまとめて販売する
セットメカニズムを考える:
– 入札者1が入札を分割すると,
入札者0に{A,B}を割り当てて,
$4を支払わせる.
– 分割しなければ,入札者1に
{A,B}を割り当てて,$5を支払
わせる.
• 明らかに入札者1は入札を分割
する誘因をもたない.
• 組合せオークションの問題を単
一財のオークションにすることで
回避する.
セットメカニズム
(単純な架空名義操作不可能なメカニズム)
bidder 0
bidder 1
bidder 2
$5
$5 $4.9 $4.9
v{A,B}
v{A}
v{B}
• セットは常に全ての財を単
一のバンドルにして販売す
るため,架空名義操作不可
能となるが,無駄が多い.
• この場合,セットは全ての
財を入札者0に割り当てる
が,その余剰は$5となる.
• 一方で,パレート効率的な
余剰は$4.9+$4.9=$9.8.
• 効率性の比は ½.
• 勝者は常にただ一人である
ため,最悪の効率性の比
はm財の組合せオークショ
ンの場合,1/m となる.
留保価格メカニズム
$6
bidder 0
bidder 1
bidder 2
$4
$3
$3
$4
$3
$2
$5 $4 $3
v{A,B}
v{A}
v{B}
• 留保価格rのもと,もし v{A,B} ≧
2r ならば, このメカニズムは
{A,B} を入札者0に割り当てる.
• さもなければ,財を個別に販
売しようとするが,このとき,
それぞれの支払額は少なくと
もrでなければならない.
• もし r=$2 ならば, {A,B} を入札
者0に割り当てる(v{A} ≧ 2 か
つ v{B} ≧ 2 だったとしても).
• もし r=$3 ならば, {A} と {B} を
入札者1と2に個別に割り当て
る.
留保価格メカニズム
$6
bidder 0
bidder 1
bidder 2
$3
$5 $4 $3
v{A,B}
v{A}
v{B}
• {A}, {B} それぞれの支払額
の合計は{A,B}への支払額
と少なくとも等しいため,架
空名義操作不可能になる.
留保価格メカニズム
$6
bidder 0
bidder 1
bidder 2
$0
$3
$5 $2 $2
v{A,B}
v{A}
v{B}
• {A}, {B} それぞれの支払額
の合計は{A,B}への支払額
と少なくとも等しいため,架
空名義操作不可能になる.
• しかし,どの入札も留保価
格以下であった時,どの財
も販売されることはない.
• したがって,効率性の比は
最悪の場合0となる.
アウトライン
• 組合せオークションと架空名義操作
– Vickrey-Clarke-Groves メカニズム (VCG)
• 既存の架空名義操作不可能なメカニズム
• 適応的留保価格 (Adaptive reserve price,
ARP) メカニズム
• 自動メカニズムデザインによるARPメカニズム
の発見
適応的留保価格
(adaptive reserve price, ARP)
bidder 0
bidder 1
bidder 2
$4
2v{B}
v{A,B}/2
$5 $4 $2
v{A,B}
v{A}
v{B}
• 今度は留保価格を入札に応じ
て決定する.
• もし v{A,B} ≧ 2v{B} ならば,入札
者0が{A,B}を獲得し,$4を支
払う.
• そうでなければ,財を個別に
販売しようとするが,このと
き,それぞれの支払額は少な
くともv{A,B}/2 = $2.5でなければ
ならない.
• 後者の場合,v{A,B} < 2*v{B} が
成立するため,ARPがAとBの
両方を販売できることが保証
される.
2v{B}
適応的留保価格
(adaptive reserve price, ARP)
bidder 0
bidder 1
bidder 2
$2.5 $2.5
v{A,B}/2
$5 $4 $3
v{A,B}
v{A}
v{B}
• 次に,入札者1と2がそれぞ
れ$4と$3を入札した場合,
{A} と {B} が個別に割り当て
られ,$2.5 を支払う.
適応的留保価格
(adaptive reserve price, ARP)
bidder 0
bidder 1
$5
$5 $7
v{A,B}
v{A,B}
• 次に,入札者1と2がそれぞ
れ$4と$3を入札した場合,
彼には {A} と {B} が個別に
割り当てられ,$2.5 を支払
う.
• このとき,入札者1が入札を
分割しなければ,$5を支払
うことになる.
• したがって, {A}, {B} それぞ
れの支払額の合計は{A,B}
への支払額と少なくとも等
しいため,架空名義操作不
可能になる.
ARPの効率性の比の最悪値
bidder 0
2v{B}
bidder 1
bidder 2
v{A,B}/2
$5 $4.9 $2.4
v{A,B}
v{A}
v{B}
• ARPメカニズムは入札者0に
全てを割り当てるため,そ
の余剰は$5となる.
• 一方で,パレート効率的な
割当てにおける余剰は
$7.3 となる.
• 効率性の比の最悪値は2/3.
• この結果はm財の組合せ
オークションに一般化でき,
その場合の比は2/(m+1)と
なる.
ARPを思いつくには?
• セットメカニズム
– 常にセットを優先して割り当てる
• 留保価格メカニズム
– 基本はセットを優先して割り当てる
– 名義を分割しても支払額が減らない場合に限り,個別に
割り当てる.
• ARPメカニズム
– v{A,B} ≧ 2v{B} のときにセットを割り当てる
– v{A,B} < 2v{B} のときに個別に割り当てる
• キーパラメータとなる2v{B}にどうやって気づくか?
→自動メカニズムデザイン
アウトライン
• 組合せオークションと架空名義操作
– Vickrey-Clarke-Groves メカニズム (VCG)
• 既存の架空名義操作不可能なメカニズム
• 適応的留保価格 (Adaptive reserve price,
ARP) メカニズム
• 自動メカニズムデザインによるARPメカニズム
の発見
メカニズムデザイン
• メカニズムとは,
入力
入力と結果の関係を (参加者の表明したタイプ)
示す関数
• 戦略的操作不可能性
などの制約を課す
メカニズム
• 制約を満す範囲で,
(オークション方式)
望ましい性質を達成す
るメカニズムを求める
– 社会的余剰の最大化
• 従来は一般的な状況に
おける入力に対して
手作業で設計
結果
(勝者と支払額)
31
自動メカニズムデザイン
(Automated mechanism design, Conitzer & Sandholm 2002)
• メカニズム設計を最適化問題(混合整数計画法問
題)として表現
– 入力に対して結果を表す変数を定義
– 目的関数:社会的余剰や主催者収入の最大
– 制約条件:戦略的操作不可能性,架空名義操作不可能性
• 可能な入力の範囲に特化してきめ細かい制御を行
うことで,手作業で設計される一般的なメカニズムと
比較して,社会的余剰の改善に期待
• メカニズム設計に必要な労力を人間から機械へ移
行することが可能
32
モデル (1/2)
• 参加者の集合:N={1,…,n},財の集合M={1,…,m}
• 入札者iの評価値v(qi, B)
– B⊆M: 財の組合せ(バンドル)
– qi∈Q: 評価値を決定するパラメータ(タイプ)
• 目的関数: g(o) + S pi
– 割当てo∈O: o = (o1,...,on), oi⊆M, ∀i≠j, oi∩oj=f
– 支払額pi∈R+: p = (p1,..., pn)
• メカニズムM(o, p): Qn → <O, Rn>
– 各入札者が申告した(q1,...,qn)∈Qnに対して
• 割当て規則: o(q1,...,qn)=(o1,...,on)
• 支払い規則: p(q1,...,qn)=(p1,..., pn)
– 各入札者は真のqiを申告するとは限らない
• 従来はQを連続空間で定義する一方で,本論文では離散空
間で定義
モデル (2/2)
• Maximize S(q1,...,qn) gn{g(o) + S pi }
– g: qiの生起確率
– g(o)=0: 主催者収入の最大化
– g(o)= S(vi(qi,oi)-pi): 社会的余剰(参加者の
効用の総和)の最大化
• 制約も目的関数も線形の式で表現可能
• 各種制約を満たすよう,目的関数を最適化す
る割当ておよび支払額の変数を決定
2人1財オークションへの適用
•
•
•
•
入札者1と2が1つの財をオークションで競り合う
財への評価値: \100 or \50
財の割当て: win or lose
ありうる入札:
(q1, q2) = (100, 100), (100, 50), (50, 100) or (50, 50)
• ありうる割当て:
(o1, o2) = (win, lose), (lose, win) or (lose, lose)
• 支払額(正の実数): (p1, p2)
• ありうる入札に対応する割当てと支払額を決定
– (q1, q2) → (o1, o2) , (p1, p2)
混合整数計画法における変数
• 全ての入札および割当ての組合せが生起する確率:
prob_(q1, q2)_(o1, o2)
– (q1, q2)の入札に対して割当て(o1, o2)となる確率
– prob_(100, 50)_(win, lose): (100, 50) の入札に対して割当てが
(win, lose) となる確率
– 各確率が0もしくは1のどちらをとるか決定
• 全ての入札の組合せに対する支払額: pi_(q1, q2)
– (q1, q2)の入札に対するi (1 or 2)の支払額
– pi_(100, 50): 入札(100, 50)に対する入札者1の支払額
– 正の実数の範囲で決定
混合整数計画法における制約式
(割当て可能性)
• 1組の入札に対する割当ては一意に定まる
• (win, lose), (lose, win), (lose, lose)のそれぞれ
の割当てが生起する確率の合計は常に1と
なる
• 例えば,(100, 50) という入札に対して
– prob_(100,50)_(win,lose) +
prob_(100,50)_(lose,win) +
prob_(100,50)_(lose,lose) = 1
混合整数計画法における制約式
(戦略的操作不可能性)
• 入札において嘘をついても効用が増加しない
• 入札が (100, 50) のときの入札者1の期待効用
– 100*prob_(100,
+ 0*prob_(100,
+ 0*prob_(100,
– p1_(100,
50)_(win, lose)
50)_(lose, win)
50)_(lose, lose)
50)
• 嘘をついて\50を入札したときの期待効用
– 100*prob_(50,
+ 0*prob_(50,
+ 0*prob_(50,
– p1_(50,
50)_(win, lose)
50)_(lose, win)
50)_(lose, lose)
50)
自動メカニズムデザインの結果
• 目的関数を変数 prob あるいはpを用いて,
線形の式で表現
• 制約条件を満たすよう,目的関数を最適化
する変数を決定
社会的余剰最大化
主催者収入最大化
(100, 100) (win, lose), (100, 0) (win, lose), (100, 0)
(100, 50)
(win, lose), (50, 0)
(win, lose), (100, 0)
(50, 50)
(win, lose), (50, 0)
(lose, lose), (0, 0)
第二価格入札と同じ
留保価格を用いた場合と同じ
自動メカニズムデザインの利点
• 制約はどう選んでも良い: 戦略的操作不可能
性,ベイジアン誘因両立性,budget
balance/non-negative, 個人合理性(ex post,
interim, ex ante), ...
• 目的関数もどう選んでも良い: 社会的余剰,売
手の収入,競合比, ...
• メカニズムの種類も選択可能: 決定的/確率的
• 与えられたタイプの範囲に特化して最適化され
た,カスタムメイドのメカニズムが設計可能
自動メカニズムデザインの問題点
• 組合せ最適化なので,タイプは離散化する必要があ
る
– e.g., 0から100の実数値→0から100の整数値
• 混合整数計画法の問題のサイズがすぐに爆発
• 参加者数がn, 可能なタイプの数をtとすると,タイププ
ロファイルの総数はtn
• 組合せ入札で,財の数をmとすると,可能な割り当て
方法は(n+1)m
• 割当てに関する変数の数はtn ・ nm
• 4人,3財,9タイプで82万以上
• PCがいくら速くなっても,この規模だとちょっと無理
自動メカニズムデザインの(現実的
な)使い方
• 一般的なメカニズム/ルールの設計のヒントとしてなら使える
• 入力に関して,離散化された代表的な値を選択(high, middle, low
等)
• 少ない参加者数で自動メカニズムデザインを実行
• 結果の表から,特徴的な部分を選び出す(例えば,既存のメカニ
ズムと異なる出力をしている部分)
• 人間がひたすら眺めて割当て/支払額の決定ルールを抽出
• 抽出したルールを検証
• うまくルールが抽出できなければ,入力値を変更して再実行
• 論文では言及しないが,ARPメカニズムはこ
のプロセスを通じて発見!
適用事例:架空名義入札の影響を受
けないメカニズムの設計
Known Results:
• 架空名義入札が可能な場合,戦略的操作不可能で,
均衡においてパレート効率的な割当てを実現するメ
カニズムは存在しない (Yokoo, et al. GEB-2004)
• かつ,財の数が2の場合,戦略的操作不可能なメカニ
ズムが達成する社会的余剰の競合比は2/3以下
Question: 競合比が2/3のメカニズムはある?
43
自動メカニズムデザインの適用結果
• A,Bの2財
• タイプ/評価値:
– ABセットに120, 80, 0,
– A,B単独に119, 79, 59, 0
• ABセットへの入札の勝敗
に着目(右の表)
• セットへの入札が勝つの
は,単独の二番目の入札
額の二倍以上の時?
• キーパラメータとなる2v{B}
を発見→ARPメカニズム
44
自動メカニズムデザインの課題
• タイプを離散化するのがボトルネック --- 一次元等の単純な
場合なら,離散化しなくても扱えないか?
• 戦略的操作不可能なメカニズムが必ず満たす性質がいくつ
か知られている
– 例えば,タイプが一次元なら,あるクリティカル値未満なら
必ず負け,クリティカル値を超えれば必ず勝つ
• 実は求めるべきパラメータは一つだけ (クリティカル値)
• このような問題を離散化して,非常に多くの決定変数を導入
するのは,あまり筋が良くない?
• 異なる最適化手法が使えないか?
– 限量記号消去法([email protected]/九大)
– 半無限計画問題?
45
計算機科学と経済学/ゲーム理論の
collaboration
• 境界領域での応用分野/研究テーマが広がっている
→ 今がチャンス?ネタの宝庫?
• 経済学/ゲーム理論屋さんは計算量や実行可能性
を考慮しない
• 経済学/ゲーム理論で得られたメカニズムを実証す
る,計算量等の実現可能性を考慮した新しいメカニズ
ムや均衡を設計/探索する等の場面で,
collaborationが有効
• 自分は何でも屋,新しい領域を苦にしない
→ 経済学/ゲーム理論と,計算機科学の橋渡し?
→ 横尾基盤Sにセミナーにいらしてください!
46
参考文献
• Vincent Conitzer & Tuomas Sandholm. Complexity of Mechanism
Design, In Proceedings of the 18th Annual Conference on
Uncertainty in Artificial Intelligence (UAI-02), pp. 103-110, 2002.
• Atsushi Iwasaki, Vincent Conitzer, Yoshifusa Omori, Yuko Sakurai,
Taiki Todo, Mingyu Guo, & Makoto Yokoo, Worst-case efficiency
ratio in false-name-proof combinatorial auction mechanisms, Ninth
International Joint Conference on Autonomous Agents and MultiAgent System (AAMAS-2010), 2010.
• Makoto Yokoo, Yuko Sakurai, & Shigeo Matsubara, The Effect of
False-name Bids in Combinatorial Auctions: New Fraud in Internet
Auctions, Games and Economic Behavior, Volume 46, Issue 1, Pages
174-188, 2004.
47

similar documents