Wykład 4

Report
Metody Analizy Decyzji
Wykład 4
Dyskusja spójności i atrakcyjności reguł
wyboru
1) Reguła maximin – jej minusem jest pesymizm
A1
A2
s1
0
0.1
s2
1000
0.1
2) Reguła Hurwicza:
a) Jak wybrać α?
b) Krytka – przykład 1
s1
A1 0
A2 1
0.5A1+0.5A2 0.5
s2
1
0
0.5
s3
0
0
0
A1
A2
s1
0
x
s2
1
x
A1 jest optymalne, A2 także, ale
kombinacja losowa dwóch już nie
2) Reguła Hurwicza
b) Krytyka – przykład 2
s1
A1 0
A2 1
s2
1
0
s3
1
0
…
…
…
s100
1
0
• Obie akcje optymalne
• A1 wygląda dużo lepiej
• Zupełna ignorancja: powyższa sytuacja jest strategicznie równoważna tej:
s1'
A1 0
A2 1
s2'
1
0
3) Reguła minimax regret (Savage)
a) Zaproponowana jako ulepszenie Maximin
b) Krytyka 1: Czy różnice w użyteczności mierzą
dobrze żal?
c) Krytyka 2: Mała korzyść w jednym stanie
przewyższa dużą w drugim stanie
Tabele wypłat:
Tabele żalu:
A1
A2
s1
s2
0 1000
0.1 0.1
A1
A2
s1
s2
0.1
0
0 999.9
A1
A2
s1
s2
0.01 1000
0.1 999.9
A1
A2
s1
0.09
0
s2
0
0.1
3) Reguła minimax regret (Savage)
a) Zaproponowana jako ulepszenie Maximin
b) Krytyka 1: Czy różnice w użyteczności mierzą
dobrze żal?
c) Krytyka 2: Mała korzyść w jednym stanie
przewyższa dużą w drugim stanie
Tabele wypłat:
Tabele żalu:
A1
A2
s1
s2
0 1000
0.1 0.1
A1
A2
s1
s2
0.1
0
0 999.9
A1
A2
s1
s2
0.01 1000
0.1 999.9
A1
A2
s1
0.09
0
s2
0
0.1
3) Minimax regret (Savage)
• Trzy rodzaje transportu ratunkowego:
– Jednostki powietrzne
• Krótkiego zasięgu
• Długiego zasięgu
– Ciężarówki
• Baza: Walia
• Trzy obszary zagrożenia trzęsieniem ziemi:
– Walia
– Półwysep Iberysjki
– Azerbejdżan
3) Reguła minimax regret (Savage)
d) Krytyka 3: Obecność niechcianej akcji może mieć
wpływ na optymalny wybór
Tabela
wypłat:
Tabela
żalu:
Tabela
wypłat:
Tabela
żalu:
Półwysep Iberyjski
Azerbejdżan
Walia
Helikopter
100
40
30
Samolot
70
80
20
Ciężarówki
0
0
110
Helikopter
Samolot
Ciężarówki
Półwysep Iberyjski
0
30
100
Azerbejdżan
40
0
80
Walia
80
90
0
Helikopter
Samolot
Półwysep Iberyjski
100
70
Azerbejdżan
40
80
Walia
30
20
Helikopter
Samolot
Półwysep Iberyjski
0
30
Azerbejdżan
40
0
Walia
0
10
Max regret
80
90
100
Max regret
40
30
3) Reguła minimax regret (Savage)
d) Krytyka 3: Obecność niechcianej akcji może mieć
wpływ na optymalny wybór
Tabela
wypłat:
Tabela
żalu:
Tabela
wypłat:
Tabela
żalu:
Półwysep Iberyjski
Azerbejdżan
Walia
Helikopter
100
40
30
Samolot
70
80
20
Ciężarówki
0
0
110
Helikopter
Samolot
Ciężarówki
Półwysep Iberyjski
0
30
100
Azerbejdżan
40
0
80
Walia
80
90
0
Helikopter
Samolot
Półwysep Iberyjski
100
70
Azerbejdżan
40
80
Walia
30
20
Helikopter
Samolot
Półwysep Iberyjski
0
30
Azerbejdżan
40
0
Walia
0
10
Max regret
80
90
100
Max regret
40
30
Rozwiązanie problemu: Zamiast porównywać wszystkie razem, porównuj
je parami
Helikopter
Samolot
Półwysep Iberyjski
100
70
Azerbejdżan
40
80
Walia
30
20
Helikopter
Samolot
Półwysep Iberyjski
0
30
Azerbejdżan
40
0
Walia
0
10
Helikopter
Ciężarówki
Półwysep Iberyjski
100
0
Azerbejdżan
40
0
Walia
30
110
Helikopter
Ciężarówki
Półwysep Iberyjski
0
100
Azerbejdżan
0
40
Walia
80
0
Samolot
Ciężarówki
Półwysep Iberyjski
70
0
Azerbejdżan
80
0
Walia
20
110
Samolot
Ciężarówki
Półwysep Iberyjski
0
70
Azerbejdżan
0
80
Walia
90
0
Max regret
40
30
Samolot lepszy niż
helikopter
Max regret
80
100
Helikopter lepszy
niż ciężarówki
Max regret
90
80
Ciężarówki lepsze
niż samolot
4) Reguła Laplace’a (zasada niedostatecznego powodu)
Helikopter
Samolot
Półwysep Iberyjski
100
70
Azerbejdżan
40
80
Laplace
0.5*100+0.5*40=70
0.5*70+0.5*80=75
Helikopter
Samolot
Hiszpania
100
70
Portugalia
100
70
Azerbejdżan
40
80
Laplace
80
73.33
Stany/zdarzenia powinno się starannie dobierać
5) Decydent nie może się zdecydować, które kryterium wybrać:
Maximin, Hurwicz (α=0.75) oraz Laplace
– Decyduje się wybrać tą akcję, która wygrywa głosowanie parami
A1
A2
A3
s1
2
5
0
s2
12
5
10
s3
-3
-1
-2
Maximin
Hurwicz
Laplace
-3
3
0.75*(-3)+0.25*12=0.75
2
3.667
1
-1
1
0.75*(-1)+0.25*5=0.5
3
3.000
2
-2
2
0.75*(-2)+0.25*10=1
1
2.667
3
Znowu nietranzytywne
4) Reguła Laplace’a (zasada niedostatecznego powodu)
Helikopter
Samolot
Półwysep Iberyjski
100
70
Azerbejdżan
40
80
Laplace
0.5*100+0.5*40=70
0.5*70+0.5*80=75
Helikopter
Samolot
Hiszpania
100
70
Portugalia
100
70
Azerbejdżan
40
80
Laplace
80
73.33
Stany/zdarzenia powinno się starannie dobierać
5) Decydent nie może się zdecydować, które kryterium wybrać:
Maximin, Hurwicz (α=0.75) oraz Laplace
– Decyduje się wybrać tą akcję, która wygrywa głosowanie parami
A1
A2
A3
s1
2
5
0
s2
12
5
10
s3
-3
-1
-2
Maximin
Hurwicz
Laplace
-3
0.75*(-3)+0.25*12=0.75 3.667
-1
0.75*(-1)+0.25*5=0.5
3.000
-2
0.75*(-2)+0.25*10=1
2.667
Znowu nietranzytywne
Przykład do samodzielnego
rozwiązania
• Potrzeba/cel:
– przyjemnie spędzić czas przy minimalnym wysiłku podróży i
kosztach
• Warianty:
– wyjazd na narty w Dolomity samolotem
– wyjazd na narty w Dolomity samochodem
– wyjazd na narty do kraju
• Niepewność:
– czasem słońce, czasem śnieg
Strukturyzacja problemu
• Konsekwencje:
–
–
–
–
–
za granicę samolotem (+ śnieg/słońce)  drogie super ferie
za granicę samochodem + śnieg  fatalna podróż, super narty
za granicę samochodem + słońce  super podróż, super ferie
na narty do kraju + śnieg  umiarkowana przyjemność
na narty do kraju + słońce  herbatka z prądem + karty
• Oceny konsekwencji:
–
–
–
–
+20 za ferie
uciążliwość podróży (-8 za jazdę po śliskim za granicą)
jakość stoków (-5 za stoki w Polsce, -3 jeśli nie da się jeździć)
cena (-4 za zagranicę, dodatkowo -3 za samolot)
a) Wersja wyjściowa
Znajdź optymalne akcje wg poniższych reguł
Słońce
Śnieg
Dolomity samochodem
16
8
Dolomity samolotem
13
13
W kraju samochodem
12
15
Słowacja samochodem
10
18
maximin
maximax
Laplace
Savage
Reguły – zestawienie
• Niech wi,j oznacza wypłatę przy i-tym wariancie i j-tym stanie świata
• Niech I oznacza zbiór wariantów, J – zbiór stanów
Reguła
Wzór
Decyzja
Maximin
arg max(min wi , j )
Dolomity
samolotem
Maximax
arg max(max wi , j )
Dolomity
samochodem
r. Savage’a
jJ
iI
Polska
samochodem
arg max( wi , j )
r. Laplace’a
r. Hurwicza
jJ
iI
iI
jJ
arg max((1   ) min wi , j   max wi , j )
Zależy od 
arg min(max(max wl , j  wi , j ))
Dolomity
samolotem
jJ
iI
iI
jJ
jJ
lI
b) Wpływ innego podziału stanów
Znajdź optymalne akcje wg poznanych kryteriów. Czy
decyzje są te same w obu przypadkach?
Słońce w
kraju i za
granicą
Słońce w
kraju, śnieg za
granicą
Śnieg w
kraju,
słońce za
granicą
Śnieg w
kraju i za
granicą
Za granicę samochodem
16
8
16
8
Za granicę samolotem
13
13
13
13
W kraju samochodem
12
12
15
15

Załóżmy, że albo chmury śniegowe znajdą się albo nad Polską, albo nad
zagranicą – znajdź optymalne decyzje dla poznanych reguł
Słońce w kraju, śnieg
za granicą
Śnieg w kraju,
słońce za granicą
Za granicę samochodem
8
16
Za granicę samolotem
13
13
W kraju samochodem
12
15
c) Wpływ dodatkowej akcji
Znajdź optymalne akcje i porównaj z optymalnymi z
punktu a). Gdzie występuje niespójność?
Słońce
Śnieg
Dolomity samochodem
16
8
Dolomity samolotem
13
13
W kraju samochodem
12
15
Słowacja samochodem
10
18
maximin
maximax
Laplace
Savage
Heurystyki wykorzystywane w wyborze
z wieloma kryteriami
• Rekompensująca
– Np. bezawaryjność oraz szybki procesor
komputera może rekompensować wysoką cenę
– Wymaga więcej wysiłku poznawczego
• Nierekompensująca
Reguły bez wspomagania - szybkie i oszczędne
heurystyki [fast and frugal heuristics]
Jak ludzie podejmują decyzje z
wieloma kryteriami?
Heurystyki nierekompensujące:
1.
Heurystyka rozpoznawalności [the recognition heuristic]
–
–
–
2.
Np. Kierownik decyduje, który z dwóch konkurujących produktów
wybrać
Skuteczność zależy od związku poziomu jakości i rozpoznawaności
marki
Może nagradzać ignorancję
Strategia minimalistyczna [the minimalist strategy]
– Wybierz na podstawie pierwszego lepszego atrybutu
– Na przykład: z dwóch aparatów wybierz ten, który ma opcję
wyzwalacza reagującego na uśmiech
3.
Wybierz tak, jak ostatnio [take the last]
–
Wybierz na podstawie atrybutu, który umożliwił ci decyzję przy
ostatnim wyborze
1. Strategia leksykograficzna [the lexicographic strategy]
– Jak w leksykonie lub w słowniku
– Ranking atrybutów
– Np. wybór samochodu: cena, rozmiar, prędkość
maksymalna
2. Strategia pół-leksykograficzna [the semi-lexicographic
strategy]
–
–
–
Jeśli wynik na danym atrybucie jest podobny, to
stwierdzamy remis i przechodzimy do następnego
Np. Jeśli cena różni się mniej niż 50 groszy, wybierz
produkt o wyższej jakości, jeśli nie, wybierz tańszy
Marka
Cena
Jakość
A
B
C
3.00
3.60
3.40
Niska
Wysoka
Średnia
A>B, B>C, ale A<C: nietranzytywna/nieprzechodnia
6. Eliminacja poprzez aspekty [elimination by
aspects (EBA)]
– Np. http://homebroker.pl/
7. Sekwencyjne podejmowanie decyzji:
zadowalanie się [sequential decision making:
satisficing]
– Zadowalanie się – poziom aspiracji
– Przykłady:
• Sekwencyjne otrzymywanie ofert pracy
• Sprzedaż lub kupno domu
• Kupno używanego samochodu
8. Wybór poprzez uzasadnienie [reason-based
choice]
– Dwa różne pytania:
• Który kandydat powinien zostać WYBRANY?
• Który kandydat powinien zostać ODRZUCONY?
Poziom
Komunikacji w
piśmie
Obecności w pracy
Umiejętności
komputerowych
Zdolności
interpersonalnych
Umiejętności
operacji na liczbach
Umiejętności w
rozmowie
telefonicznej
Kandydat A
Kandydat B
średni
nadzwyczajny
satysfakcjonujący
bardzo dobry
średni
nadzwyczajny
średni
słabo dogaduje się z
ludźmi
średni
słaby
średni
słaby
– Wybór może nie być niezależny od sformułowania [framing]
8. Wybór poprzez uzasadnienie [reason-based
choice]
– Wybór może nie spełniać Niezależności
Nieistotnych Alternatyw [Independence of
Irrelevant Alternatives]
Czynniki wpływające na to, jak ludzie
dokonują wyboru
•
•
•
•
•
Czas na podjęcie decyzji
Wysiłek, którego wymaga dana strategia
Wiedza decydenta o otoczeniu decyzyjnym
Istotność podjęcia dobrej decyzji
Czy decydent musi usprawiedliwić swój
wybór wobec innych
• Chęć by minimalizować konflikt

similar documents