קבלת החלטות בסביבה דינאמית

83
הההה הההההה הההההה ההההההה ההההה1# 1

description

קבלת החלטות בסביבה דינאמית. שיעור 1#. סרטון. Golden balls. שאלה (1). מגפת "שפעת הזברות" התפרצה לאחרונה במדינות הסביבה ומאיימת גם על ישראל הצפי הוא ל- 600 קורבנות מהמחלה משרד הבריאות מציע לממשלה שתי דרכי התמודדות אפשריות: תוכנית A , באמצעותה ינצלו בודאות 200 קורבנות פוטנציאליים - PowerPoint PPT Presentation

Transcript of קבלת החלטות בסביבה דינאמית

Page 1: קבלת החלטות בסביבה דינאמית

1

דינאמית בסביבה החלטות קבלת

1#שיעור

Page 2: קבלת החלטות בסביבה דינאמית

2

A Motivating Example

• The Big Bang Theory - Sheldon can't choose between PS4 and Xbox One S07E19

Page 3: קבלת החלטות בסביבה דינאמית

3

ההחלטות …• בקבלת רציונלי מאוד הוא ושלדוןשלו

רציונליות • מחוסר גם מושפעים האנשים רוב... שלהם ההחלטות בקבלת

Page 4: קבלת החלטות בסביבה דינאמית

4

(1שאלה )•" הזברות " שפעת במדינות מגפת לאחרונה התפרצה

ישראל על גם ומאיימת הסביבה• - ל הוא מהמחלה 600הצפי קורבנותהתמודדות • דרכי שתי לממשלה מציע הבריאות משרד

אפשריות:בודאות, Aתוכנית – ינצלו קורבנות 200באמצעותה

פוטנציאליים- Bתוכנית – ה, כל ינצלו תצליח 600באמצעותה אם

בהסתברות( 1/3הסתברות) כלל 2/3אולם תועיל לא•? לאמץ תמליץ התוכניות משתי אלו

Tversky & Kahneman (1981)

Page 5: קבלת החלטות בסביבה דינאמית

5

(2שאלה )חטף • טרור מפשע 20ארגון חפים אזרחיםחילוץ" • תוכניות שתי לממשלה מציע ל צה

אפשריות:אבל, Aתוכנית – החטופים אחד יהרג בודאות בה

היתר כל ינצלושל, ) Bתוכנית – גבוה סיכוי תצליח ינצלו( 90%שאם

החטופים, כל יהרגו תיכשל אם אבל כולם•? לאמץ תמליץ התוכניות משתי אלו

Page 6: קבלת החלטות בסביבה דינאמית

6

(3שאלה )• " קערת " וקנית החדש הדרדסים לסרט הלכת

- ב . 20פופקורן " ח ש•. , נשפך והפופקורן מעדת שלך למושב בדרכך• - ב ) פופקורן קערת עוד ותקנה תחזור 20האם

?) ח" ש

Page 7: קבלת החלטות בסביבה דינאמית

7

(4שאלה )לפני • בפילוסופיה ראשון תואר סיימה . 5דרורית שנים

" תקופה " ועבדה הירוקים בארגון פעילה היתה היא , . לימודיה במהלך אונס לנפגעות במרכז מסויימת

הטריד שלטענתה פרופסור על חרם לארגן ניסתה. סטודנטיות מספר מינית

לפי ) • האפשרויות את דרג כיום דרורית עושה מה?) לנכונותן הסיכוי

מורה–בנק – פקידתבמשטרה – קצינהפמיניסטית – בנק פקידתסוציאלית – עובדת

Page 8: קבלת החלטות בסביבה דינאמית

8

(5שאלה )•" הזברות " שפעת לאחרונה מגפת התפרצה

ישראל על גם ומאיימת הסביבה במדינות• - ל הוא מהמחלה 600הצפי קורבנותדרכי • שתי לממשלה מציע הבריאות משרד

: אפשריות התמודדות- Aתוכנית – מ, מנוס יהיה לא קורבנות 400בהבהסתברות, Bתוכנית – אף 1/3באמצעותה נאבד לא

ובהסתברות - 2/3חולה ה ימותו 600כל•? לאמץ תמליץ התוכניות משתי אלו

Tversky & Kahneman (1981)

Page 9: קבלת החלטות בסביבה דינאמית

9

(6שאלה )• " וכשפתחת " החדש הדרדסים לסרט הלכת

פחות לך שיש גילית הארנק " 20את ממה ח ש. לך שיש שחשבת

• - ב פופקורן קערת לקנות .20תכננת " ח ש•? תקנה עדיין האם

Page 10: קבלת החלטות בסביבה דינאמית

10

(7שאלה )חטף • טרור מפשע 20ארגון חפים אזרחים• " שתי הציעו והם החוטפים עם דן מ מו צוות

חלופות:ישחררו, Aחלופה – אבל אחד חטוף להורג יוציאו הם בה

היתר כל אתעם, Bתוכנית – רולטה גלגל יסובב הוגן מתווך 10בה

המספר, " ואם יוציאו" 7מספרים הם בגורל יעלהתביא אחרת תוצאה כל אבל החטופים כל את להורג

החטופים כל לשחרור•? לאמץ תמליץ החלופות משתי אלו

Page 11: קבלת החלטות בסביבה דינאמית

11

ניתוח(:5 + )(1שאלות )•

נציל" – האם?" " 200האם ?"400לעומת ימותו

(:7( + )2שאלות )•השניה – בחלופה חטופים יותר נאבד בממוצעחילוץ – פעולת לעומת ברולטה שימוש

(:6( + )3שאלות )•–" " "? פופקורן" עוד נקנה האם לעומת פופקורן נקנה האם

•) פמיניסטית – ) האפשרויות באחת מכוון רמז דרורית

חלופה יעדיפו'ב

חלופה יעדיפו'א

נשאלים

28% 72% 152 1שאלה 78% 22% 155 5שאלה

Page 12: קבלת החלטות בסביבה דינאמית

12

ההחלטה בעיית הבנת• , ( , אלטרנטיבות ההחלטה בעיית הסיטואציה הבנת

– )' להצלחה, קריטית וכו כללים תועלות•:) חשמל ) חברת מכרז דוגמה

• , ( - הרשת – על עבודה למשל טריידינג אלגו נוספת דוגמה) פרסומו לפני המדד וחישוב הבורסה של המקומית

Page 13: קבלת החלטות בסביבה דינאמית

13

הקורס רציונאל• " של " העיקריים לקונספטים דרך מורה להוות

- ודאות אי בתנאי ההחלטות קבלת תורת•: ספציפיים וכלים נושאים לעומק להכיר

אינפורמציה – של וערך החלטה עצי– - ו בייסיאניות influence diagramsרשתות–Voting, Allocationמוגבלת )– (bounded rationalityרציונליותהתועלת – תורת

•: זמן יישאר אם–Bandit problemsובעיות – המזכירה optimal stoppingבעיית

Page 14: קבלת החלטות בסביבה דינאמית

14

המחשב למדעי הקשר ?מה•: מומלץ מאמר

• Marko Bohanec, DECISION MAKING: A COMPUTER-SCIENCE AND INFORMATION-TECHNOLOGY VIEWPOINT

http://www.indecs.eu/2009/indecs2009-pp22-37.pdf

•: המרכזי הרעיון– , משאלות אחת ואפילקציות מחשוב מערכות מתכננים אנחנו כאשר

של החלטות קבלת במצבי לתמוך המחשב יכול כיצד היא המפתח , - מהר ) יותר טובות החלטות שיקבלו מנת על מערכות ושל אדם בני

:) אפקטיבית, יותר בצורה יותרטיסה • נתיבי הקצאתליעד • ניווטוחסכונות • השקעהלימודים • מוסד בחירתריצה • אימון בניית

איך – על לא הוא הקורס של תומכת לתכנתהפוקוס מערכת יותר טובאיך" אלא ח כזאת לעצבקבה אחת

Page 15: קבלת החלטות בסביבה דינאמית

15

הקורס תוכניתמס'

השיעורהשיעור נושא הערות

1 החלטות על ההסתברות השפעת  2 מול המצבים מטריצת

החלטה, עצי אלטרנטיבות 

3 החלטות בקבלת מידע ערך  4 על הסיכון והשפעת התועלת תורת

ההחלטה קבלת 

5 בייסיאניות רשתות  6 Influence diagrams  7 Multi-armed bandits  8 Voting  9 Fair Division  

10 Apportionment  11 מוגבלת רציונליות  12 מוגבלת רציונליות  13 וחזרה סיכום  

Page 16: קבלת החלטות בסביבה דינאמית

16

בשיעור ...היום

הקורס • נהלי•? ? הימור מהו החלטה מהיהסתברות • ללא החלטות קבלתוסטטיסטיקה • הסתברות בנושאי חזרה

Page 17: קבלת החלטות בסביבה דינאמית

17

Course Procedures

•: הקורס אתר:// . . . . /~ / / /http www cs biu ac il sarned Courses DM

סרנה: • דודי : [email protected])מרצה קבלה( שעותראשון (216בבניין 02חדר 15:00-16:00יום מראש ) לתאם נא

סופית – • 100%בחינה• , הפתרונות – עם באתר נמצאים תרגילים

Page 18: קבלת החלטות בסביבה דינאמית

18

? המזל סיפור טובה החלטה מהיוהשכל

חשוב" יותר מי בדרך והתוכחו ביחד לטייל שהלכו והשכל המזל על מסופר . המשיכו מדבר למקום והגיעו בדרך תעו שהם לב שמו לפתע השכל או המזל

והשכל ההגיון לפי ללכת צריך בחיים דבר שבכל טען השכל ולהתוכח ללכת . דבר שום יעזור לא שבלעדיו טען והמזל הישר

אם שכן כך על שמחו סלול כביש לעיניהם נגלה המאוחרות הערב בשעות. טרמפ אותם יקח אולי רכב לכביש יעבור קרוב אך הדרך בצד שכב השכל

אותו יראה אולי גם רכב יעבור שאם לעשות הגיוני הכי שכך למזל השכל הסביר . הוא הכביש באמצע שכב זאת לעומת המזל סכנה לכלל מכניס לא הוא וגם

. ההגיון לפי פועל שוכב לא המזל את הנהג ראה לפתע במהירות מכונית נסעה הלילה באמצע "   הכביש בצידי ששכב השכל את ודרס מהכביש במהירות סטה הכביש באמצע

) באינטרנט) גרסאות מגוון

.1" " מזל ה של ההחלטה טיב על להגיד תוכל של מה זו ועל?" שכל" ה

של 2. רב מספר ההחלטה על חוזרים היו אם קורה היה מהפעמים?

.3 " " החלטות " קבלת תהליך או טובה החלטה כזה דבר יש האםטוב"

Page 19: קבלת החלטות בסביבה דינאמית

19

Page 20: קבלת החלטות בסביבה דינאמית

20

Page 21: קבלת החלטות בסביבה דינאמית

החלטה• שונות דרכים בין הפיכה בלתי בחירה

• " " באנגלית המונח לעומת החלטות קבלת“decision making”

Source: dictionary.com

Page 22: קבלת החלטות בסביבה דינאמית

החלטות אלו ?האם

לחולה • מסויימת תרופה לרשום השוקל רופאלו • תגרום לחולה שרשם תרופה האם המתלבט רופא

לוואי לתופעותהמנה • את יעדיפו הנוסעים האם מתלבט בטיסה דייל

הצמחונית או הבשריתאו • הבשרית המנה את לקחת האם מתלבט בטיסה נוסע

הצמחוניתלבחינה • לימוד לצורך יקדיש זמן כמה מתלבט סטודנטלבחינה • להתכונן יש ימים כמה להעריך מנסה סטודנט

" עובר " ציון קבלת לצורך

Page 23: קבלת החלטות בסביבה דינאמית

23

החלטות בקבלת גישותאנשים / – • כיצד דסקריפטיבית פוזיטיבית גישה

? רציונאלית ) בצורה האם החלטות מקבלים)? רציונאלי מה

לקבל – • צריכים אנשים איך נורמטיבית גישההחלטות

וניגע הנורמטיבית הגישה את בקורס נבחן אנחנוהפוזיטיבית בגישה קצת

Page 24: קבלת החלטות בסביבה דינאמית

24

ההחלטה קבלת תהליך של המורכבות מידת

אלטרנטיבות • ריבוילתוצאות • באשר ודאות איהזמן • מימדהמתחרים • תגובתההחלטה • מקבלי מספרסותרות • מטרותברורות • לא תוצאותידועות • לא אלטרנטיבותברורות • לא מטרות

Page 25: קבלת החלטות בסביבה דינאמית

25

החלטה בעיית ?מהי

•: ב מאופיינת ההחלטה בעייתלבחור ) – יכול בהן האסטרטגיות אלטרנטיבות

) ההחלטה מקבל– ( / עתידיים מצבים אפשריים טבע עולם מצבי

) ההחלטה מקבל בשליטת שלאתוצאות/ – (payoffs)תמורות

Page 26: קבלת החלטות בסביבה דינאמית

26

דיור – קומפלקס בניית דוגמהשהוא • הדיור קומפלקס גודל על להחליט נדרש יזם

. , נגזרת – הרווחיות גדול או בינוני קטן להקים עומדבקומפלקסים לדירות העתידית הדרישה מרמת

•: ההחלטה קבלת של האלמנטים– , גדול – או בינוני קטן קומפלקס אלטרנטיבותגבוהה – / – דרישה נמוכה דרישה הטבע מצביטבע – – מצב כל בהינתן אלטרנטיבה מכל הרווח תמורות

אפשריהטבע (states of nature)מצבי

אלטרנטיבות Low High

Small 8 8

Medium 5 15

Large -11 22

Page 27: קבלת החלטות בסביבה דינאמית

27

שולטת אסטרטגיההטבע (states of nature)מצבי

אלטרנטיבות Low High

Small 8 8

Medium 5 15

Medium + 5 20

Large -11 22

האחרות כל על ששולטת אסטרטגיה קיימת אם ?מה

שולטת אסטרטגיה אין לרוב ...במציאות

Page 28: קבלת החלטות בסביבה דינאמית

28

הסתברויות ללא החלטות קבלתכאשר • עיקריים החלטה כללי מספר

: ידועה אינה הטבע למצבי ההסתברותאופטימיסטית – עם- גישה האלטרנטיבה בחירת

) מבין ) המינימלית העלות או המקסימלית התמורההאפשריות התמורות

הטבע (states of nature)מצביאלטרנטיבות Low High

Small 8 8

Medium 5 15

Large -11 22

Page 29: קבלת החלטות בסביבה דינאמית

29

הסתברויות ללא החלטות קבלתכאשר • עיקריים החלטה כללי מספר

: ידועה אינה הטבע למצבי ההסתברותאופטימיסטית – עם- גישה האלטרנטיבה בחירת

) מבין ) המינימלית העלות או המקסימלית התמורההאפשריות התמורות

קונסרבטיבית – עם– גישה האלטרנטיבה בחירתמבין המקסימלית המינימלית התמורה

הטבע האלטרנטיבות (states of nature) מצבי

אלטרנטיבות Low High

Small 8 8

Medium 5 15

Large -11 22

Worst Profit

8

5

-1129

Page 30: קבלת החלטות בסביבה דינאמית

30

הסתברויות ללא החלטות קבלתההסתברות • כאשר עיקריים החלטה כללי מספר

: ידועה אינה הטבע למצביאופטימיסטית – עם- גישה האלטרנטיבה בחירת

) מבין ) המינימלית העלות או המקסימלית התמורההאפשריות התמורות

קונסרבטיבית – עם– גישה האלטרנטיבה בחירתהאלטרנטיבות מבין המקסימלית המינימלית התמורה

– - ה טבע– minimax regretגישת מצב כל עבור חישוב , האלטרנטיבה ובחירת אלטרנטיבה בכל החרטה מהי

מינימלית היא המקסימלית החרטה שבה

Page 31: קבלת החלטות בסביבה דינאמית

31

) המשך ) דוגמה•Min-regret:

הטבע (states of nature)מצביאלטרנטיבות Low High

Small 8 8

Medium 5 15

Large -11 22

Best Profit for Low

8

Best Profit for High

22

הטבע (states of nature)מצביאלטרנטיבות Low High

Small 0 14

Medium 3 7

Large 19 0

Max regret

14

7

19

Page 32: קבלת החלטות בסביבה דינאמית

32

הסתברויות ללא החלטות קבלתלמצבי • ההסתברות כאשר עיקריים החלטה כללי מספר

: ידועה אינה הטבעאופטימיסטית – התמורה- גישה עם האלטרנטיבה בחירת

) התמורות ) מבין המינימלית העלות או המקסימליתהאפשריות

קונסרבטיבית – התמורה– גישה עם האלטרנטיבה בחירתהאלטרנטיבות מבין המקסימלית המינימלית

– - ה מהי– minimax regretגישת טבע מצב כל עבור חישוב , שבה האלטרנטיבה ובחירת אלטרנטיבה בכל החרטה

מינימלית היא המקסימלית החרטה– - ה לכל– insufficient reasoningגישת סיכוי אותו שיש מניח

כל של התמורות את סוכם ולכן הטבע ממצבי אחדביותר הגבוה הסכום עם זו את ובוחר אלטרנטיבה

Page 33: קבלת החלטות בסביבה דינאמית

33

) המשך ) דוגמה•Insufficient reasoning

הטבע (states of nature)מצביאלטרנטיבות Low High

Small 8 8

Medium 5 15

Large -11 22

sum

16

20

11

Page 34: קבלת החלטות בסביבה דינאמית

34

הסתברויות עם החלטות קבלת

הטבע (states of nature)מצביאלטרנטיבות Low High

Small 8 8

Medium 5 15

Large -11 22

0.3 0.7

... הסתברות על מהירה חזרה

Page 35: קבלת החלטות בסביבה דינאמית

35

ומאורעות מדגם מרחב•W , ניסוי : של תוצאה מדגם מרחב

פעמיים, • מטבע בהטלת = Wלדוגמה{HH,HT,TH,TT}

של: • חלקית קבוצה Wמאורעראשונה, • הטלה H = {HH,HT}לדוגמה

•S , מאורעות : סט מאורעות מרחב

Page 36: קבלת החלטות בסביבה דינאמית

36

הסתברות סוגי שנישל • - 50%סיכוי ב תסתיים מטבע הטלת Hכי

) דגימה) מבוססת הסתברותשל • ינחתו 0.00001%סיכוי הקרובה שבשנה

) סוביקטיבית ) הסתברות הארץ כדור על חייזריםבהסתברות • להשתמש שלא נוטים רבים

הסוביקטיבית:•) קרה ) לא שהוא או קרה שהמאורע או אותה לאמת ניתן לאלאותו • שונות סוביקטיביות הסתברויות יתנו שונים מומחים

מאורע• , בכל נמצאת הסוביקטיבית ההסתברות זאת עם

מקום:ביטוח • פוליסות לצרכי אדמה לרעידות סיכויהימורים • לצרכי בספורט לאירועים סיכוי

Page 37: קבלת החלטות בסביבה דינאמית

37

נוספות דוגמאותשל • ממין 50.7%סיכוי יהיה בישראל שיוולד הבא התינוק כי

נקבהשל • באליפות 20%סיכוי חיפה מכבי תזכה הבאה שבעונה

המדינה

לא • להיות יכולות דגימה מבוססות הסתברויות גםמדויקות:

היסטורי • מידע על מבוססות אם מגמה בחשבון מביאות לא• ' כהן ) גב של הבא התינוק של ההסתברות מה מדי כללי מדגם על מבוססות

?(130מדיזינגוף " נקבה ממין להיות א בת• " מבוססות " להיות יכולות סוביקטיביות הסתברויות גם

מודל:הקבוצה • ביצועי של אגרגטיבי מודל ובניית שחקן כל של המשחק ניתוח

Page 38: קבלת החלטות בסביבה דינאמית

38

ההסתברות מדדעל • :W,S)מוגדר התנאים( תחת

•P(a) >= 0 לכלa - Sב •P(W) = 1:a, bאם • אזי תלויים בלתי

•P(a U b) = p(a) + p(b)

A is true

WP(W) = 1 P(A)

Page 39: קבלת החלטות בסביבה דינאמית

39

להסתברות בנוגע חשובות נקודות• ( , בין מדד היא הסתברות פורמלי בלתי - 0באופן לאי( 1ל

למאורע בנוגע ודאותכאחוזי • מיוצג להיות יכול למאורע בנוגע שלנו הודאות אי

יקרה שהארוע סיכוישל • סיכוי לנו כשנותנים בהימורים כי לב לשים 1:4יש

שפי היא שלא 4הכוונה מאשר יקרה שהאירוע סביר יותרכלומר ) - 20%יקרה ל (25%ולא

• - מ גדול יהיה לא לעולם יקרה שהאירוע 100%הסיכוי(100%.) מוחלטת = ודאות

• - ב " בזה בטוח אני לשמוע ששכיח "200%למרותלמאורע • - משליםההסתברות ל ההסתברות 1שווה פחות

P(E)=1-P(not E)למאורע:

Page 40: קבלת החלטות בסביבה דינאמית

40

) משלים ) במאורע שימוש דוגמאשה • ההסתברות בגודל מינימוםמה מדגם קטן Nשל יהיה

?xמ-

חישוב ישיר:•

חישוב דרך מאורע משלים:•

iNN

i

i xXPxXPiN

=

)()(1

NxXP )(1

? אחידה התפלגות עם באקסל דוגמה מדגם של מינימום זה מה

Page 41: קבלת החלטות בסביבה דינאמית

41

בהסתברות פעולות•: כללי באופן

P(X or Y) = P(X) + P(Y) - P(X and Y)

? לב: או מלך יהיה מחבילה אקראית שנבחר שקלף ההסתברות מה דוגמהP(King or Heart) = P(X or Y) = 4/52 + 13/52 - 1/52 = 30.77%

בין • חפיפה אין :Y ו- XוכאשרP(X or Y) = P(X) + P(Y)

מ'?2 מ' או מעל 1.5דוגמה: מה ההסתברות שגובה אדם אקראי יהיה מתחת ל-

Page 42: קבלת החלטות בסביבה דינאמית

42

מותנית הסתברות•P(F|H) = המקרים סך מתוך המקרים אחוז

גם Hשבהם שבהם נכון Fנכון

H

)(),(

)()()|(

HpHFp

HpHFpHFp =

=

F

Page 43: קבלת החלטות בסביבה דינאמית

43

מאורעות מתוך ההסתברות חישוב

= ii BAPBPAp |

1B2B

3B4BA

Page 44: קבלת החלטות בסביבה דינאמית

44

משותפת הסתברותההסתברות • את מכמתת המשותפת ההסתברות

: זמנית בו מאורעות מספר להיקרותP( X= x, Y= y) = P(x, y)

• : לחישוב הדרכים P(X and Y) = P(X) P(Y|X)אחתיש: • שקית בתוך . 10דוגמא . 3גולות מה פגומות מתוכן

אחרי אחת פגומות גולות שתי להוציא ההסתברותהשניה?

P(X and Y) = (3/10) (2/9) = 7%•: השרשרת חוק

P(x,y,z) = p(x) p(y|x) p(z|x, y) = p(z) p(y|z) p(x|y, z)

=…

Page 45: קבלת החלטות בסביבה דינאמית

45

Making Sense of Probability

בה • , 23בכיתה שלפחות ההסתברות מה ילדים? בשנה היום באותו הולדת יום יש ילדים לשני

• - אבל שלנו ההחלטות לקבלת חשוב כל כל לא " ח קבה על שמשפיעים קשיים מדגים בהחלט

שלנומשפיעה • הסתברות להבין שלנו היכולת חוסר

שלנו הביצועים על רבות

Page 46: קבלת החלטות בסביבה דינאמית

46

בלבד באשליה מדובר ?האם

Page 47: קבלת החלטות בסביבה דינאמית

47

ההולדת ימי בעיתיהיה • מהילדים אחד שלכל ההסתברות את נחשב

" " משלימה ) ה ההסתברות אחר בתאריך הולדת יוםמחפשים אנחנו שאותה ?<להסתברות למה> (משלימה

ההסתברות • לנו ידועה אז pאם משלים מאורע שלהיא לנו הנדרש המאורע p-1הסתברות

• , לא הבא שהילד ההסתברות שנבחר ילד כל עבורהיא היום באותו 364/365נולד

ילד • כל באחד iעבור נולד שלא ההסתברות - ה של היא )i-1מהימים i+1/)365-365הקודמים

Page 48: קבלת החלטות בסביבה דינאמית

48

ההולדת ימי בעית•: היא, המשלים המאורע הסתברות כלומרילד • כל באחד iעבור נולד שלא ההסתברות

- ה של :i-1מהימים היא הקודמים

באותו • יומולדת ילדים לשני שלפחות וההסתברותהיא 0.51היום

היו • אם ההסתברות ? 40מה עם מה 60ילדיםילדים?

= 0.49

באקסל דוגמה

Page 49: קבלת החלטות בסביבה דינאמית

49

לטעות אפשריים מקורותההסתברות • מה לחשב מנסים אנשים לרוב

. שלהם בתאריך הולדת יום יהיה מישהו שלעודלהאמין • נוטים אנחנו צורה באותה

היא בחיינו אחרים למאורעות שההסתברותגבוהה די היא כשלמעשה נמוכה יחסית

Page 50: קבלת החלטות בסביבה דינאמית

50

The Monty Hall Problemבשעשועון משתתף אתה

מאחורי ומוצב 3טלביזיהמהן. אחת מאחורי דלתות

, הפרס מכונית נמצאתיש האחרות השתיים ומאחורי

הדלתות. באחת בוחר אתה עז , לך יסייע תיפתח בטרם אולם - פתיחת ידי על התוכנית מנחההאחרות הדלתות משתי אחת

. כעת עז מאחוריה אשראת להחליף באפשרותך

. כדאי האם שבחרת הדלתלהחליף?

Page 51: קבלת החלטות בסביבה דינאמית

51

xx x

xx x

xx x

win lose loselose win win

stay switch stay switch stay switch

Page 52: קבלת החלטות בסביבה דינאמית

52

בייס נוסחת• ) כלשהי ) אמונה היפותזה לנו שיש .Hנניח•. נכונה לא או נכונה להיות יכולה שלנו ההיפותזה• , נכונות לגבי ודאי אי אופי בעלת הערכה לנו יש אדם כבני

H- ש – ההסתברות את להעריך יודעים , Hאנחנו נכונה .P(H)ומסמנים

נוסף • מידע בסיס על שלנו ההערכה את לעדכן ניתן כעתE (Evidence). מקבלים שאנחנו

שההיפותזה • ההסתברות את לעדכן לנו עוזרת בייס נוסחתמידע, ידוע אם : Eנכונה .P(H|E)קרי,

את • להעריך לנו קשה האמיתיים לנו. P(H|E)בחיים קלהמידע לקבלת ההסתברות את להעריך - Eיותר ש בהינתן

H : , את כלומר .P(E|H)נכון

Page 53: קבלת החלטות בסביבה דינאמית

53

בייס חוקמאורע" • של המותנית הסתברות בהינתן Aה

של " Bמאורע להתרחשותו הסיכוי , Aהיא - ש התרחש Bבהנחה אכן

בייס • שבה חוק הסתברות לחשב מאפשרמאורע של התרחשות בעזרת, Aמניחים

של אחרים Aהסתברויות במאורעות המותנות

Page 54: קבלת החלטות בסביבה דינאמית

54

בייס נוסחת עם הול מונטי בעיית פיתרון

• - ב - A, Bנסמן נמצאת Cו בה הדלת אתהמכונית

• - ב - MA, MBנסמן מונטי MCו שפתח הדלת אתדלת • שבחרנו :Aנניח

p(MA|A) = 0, p(MA|B) = 0, p(MA|C) = 0;p(MB|A) = 1/2, p(MB|B) = 0, p(MB|C) = 1;p(MC|A) = 1/2, p(MC|B) = 1, p(MC|C) = 0.

• : כי p(A) = p(B) = p(C) = 1/3ידוע

33.033.0*133.0*033.0*5.0

33.0*5.0)(|)(|)(|

||)|(

=

=

=

==CPCMBPBPBMBPAPAMBP

APAMBPMBP

APAMBPMBAP

Page 55: קבלת החלטות בסביבה דינאמית

55

הול מונטי של הפרדוקס• , דלתות אלף עם משחק אותו שמתקיים נניח

מסתתר מהן אחת של השני בצידה כאשרומאחורי, נמצאות 999פרס הנוספות הדלתות

, עוד. יפתח והמנחה דלת נבחר בתחילה עזים998 . , האם עזים השני שבצידן נוספות דלתות

? להחליף כדאי

Page 56: קבלת החלטות בסביבה דינאמית

56

) המשך ) בייס נוסחתמכל • בלב 1000אחד מולד מפגם סובל אישהפגם • את לגלות יכולה אשר בדיקה קיימת• - ב מדויקת הפגם 100%הבדיקה את להם שיש לאנשים

- ב ומדויקת הפגם 95%המולד את להם שאין אלו עובר , (5%כלומר) להם שיש ככאלו יאובחנו להם שאין

• , מה חיובית שהבדיקה ומצאנו אדם אקראית בדקנו אם? המולד הפגם את לו שיש הסיכוי

עם • :60בבדיקה " הרווארד של לרפואה ס מביה סטודנטים– - ש סברו 95%חציהיה – 56%הממוצעהנכונה 11רק – התשובה את ענו

Page 57: קבלת החלטות בסביבה דינאמית

57

Confusing P(H|E) with P(E|H) מכל • גיל 100לאחת מעל ממוגרפיה 40נשים לבדיקת שמגיעה

. רק מגלה הממוגרפיה בדיקת השד סרטן ממקרי 80%יש - . ב השד חולה 9.6%סרטן אינה הנבדקת בהם מהמקרים

. גיל מעל שאישה הסיכוי מה חיובית תשובה כן גם 40מתקבלתבסרטן חולה אכן ממוגרפיה בבדיקת חיובית תשובה שקיבלה

השד?

Page 58: קבלת החלטות בסביבה דינאמית

58

Confusing P(H|E) with P(E|H) מכל • גיל 100לאחת מעל ממוגרפיה 40נשים לבדיקת שמגיעה

. רק מגלה הממוגרפיה בדיקת השד סרטן ממקרי 80%יש - . ב השד חולה 9.6%סרטן אינה הנבדקת בהם מהמקרים

. גיל מעל שאישה הסיכוי מה חיובית תשובה כן גם 40מתקבלתבסרטן חולה אכן ממוגרפיה בבדיקת חיובית תשובה שקיבלה

השד?

• P(positive|cancer) = 80%, but what we're interested in is P(cancer|positive) – this is not the same thing!!!

Page 59: קבלת החלטות בסביבה דינאמית

59

המולד הפגם לבעיית פיתרון•0.001 - . ב מדויקת הבדיקה מהפגם סובלת לאנשים 100%מהאוכלוסיה

- ב ומדויקת הפגם את להם . 95%שיש הפגם את להם שאין אלו עבור , לו שיש הסיכוי מה חיובית שהבדיקה ומצאנו אדם אקראית בדקנו אם

? המולד הפגם את•: מאורעות נגדיר

–A – המולד הפגם את יש לאדם–B – חיובית בדיקה תוצאת

–P(not A)=0.999–P(B|not A)=0.05–P(B|A)=1

notAPnotABPAPABP

APABPBP

APABPBAP||

|||

==

01963.0999.0*05.0001.0

001.0| =

=BAP

באקסל הדגמה - כאלה – בדיקות פי על תרופות להתוות ממהרים רופאים הבעיה

Page 60: קבלת החלטות בסביבה דינאמית

60

תלות אילוטו•ברולטה • הכפלה

Page 61: קבלת החלטות בסביבה דינאמית

61

לוטו הגרלות•? לוטו בטופס למלא עדיף מה

–1 2 3 4 5 6–4 12 33 36 41 44

Page 62: קבלת החלטות בסביבה דינאמית

62

) המשך ) לוטו הגרלות•? לוטו בטופס למלא עדיף מה

–1 2 3 4 5 6–4 12 33 36 41 44

את • לשפר ניתן אבל הזכיה סיכוי את לשפר ניתן לאזכיה של במקרה הפרס גודל תוחלת

בטפסים 1-31מספרים – יותר גבוהה בסבירות יופיעו- 1,2,3,4,5,6הרצף – בכ בבריטניה 7000מופיע בממוצע טפסים

הוא • הגדול הפרס :5אם מיליון הזוכה – הרצף .714נקבל 1,2,3,4,5,6עבור פאונד בטווח – רצף - 1.6נקבל 32-49עבור כ ) שיש בהנחה 3מליון

זוכים(

Page 63: קבלת החלטות בסביבה דינאמית

63

Page 64: קבלת החלטות בסביבה דינאמית

64

קודם יגיע רצף ?איזה

• . בתורו מכם אחד כך חבר מול משחק משחק אתהמראש שנקבע של רצף שיוצא עד מטבע זורק

– : שלך H T Hהרצף– : החבר של H T Tהרצף

• - מנת על בממוצע הטלות פחות נדרשות היו למישלו לרצף ?1000להגיע פעמים

לך–לחבר–בממוצע – הבדל אין

Page 65: קבלת החלטות בסביבה דינאמית

65

) ( ? המשך קודם יגיע רצף איזהלחבר – • הנכונה התשובה•: האינטואיטיבי ההסבר

רצף – צריכים השחקנים היעד H Tשני לרצף שיגיעו לפנישרצף – התרחש H Tנניח אכןשל – הסתברות יש זו להגיע 50%בנקודה מהם אחד לכל

שלהם היעד לרצףרצף – כרגע יש לך אז היעד לרצף הגיעו לא אם אבל

H T T רצף יש H T Hולחברלפחות – במרחק נמצא החבר מטבע שתיכלומר הטלות

לפחות, של במרחק ואתה מזכיה שלושמזכיה הטלות

Page 66: קבלת החלטות בסביבה דינאמית

66

ברולטה משחקנולדתה כן אם אלא פעמים הרבה כך כל להפסיד אפשר שאי ההנחה על בהסתמך

. , אני שאמרנו כפי בתוספת הכסף את לעצמך תחזיר שתזכה הפעמים באחת נחס במזלכך להמר מתחיל הייתי ואז כסף לשים מבלי פעמיים לטעות ומחכה בקזינו יושב הייתי

. . להרויח שזמנך ההגיון מן ועכשיו פעמיים כסף ולהפסיד לטעות לך חסכת מקרה שבכלדבר בעצם שזה פעמיים לעצמי אטעה שאני עד הרבה לחכות רוצה הייתי לא שאם או

אני אז זמן אורך אבל יום לאותו ברולטה הטמון הפוטנציאל על ומראה מאד נחמדתוצאות של סטטיסטי חישוב ידי על ברולטה קודמות תוצאות לפי אבל מכה כל משחק

: . אז רצוף ירוק פעמיים ברולטה יצא אם לדוגמה הקודמות לתוצאות בהתאם אפשריותירוק בא אם ולהפך מהרצף לשינוי מצפה אני עכשיו שכן האדום על להמר אתחיל אני

. הסיכויים לרצף אצפה אני עכשיו כי הירוק על מהמר אני אז אדום לאחריו ומידשהסיכויים שונים פיס במשחקי כמו ושלא הקזינו מול אתה שוים כמעט הם ברולטה

. נניח ביצוע בר שהוא דבר זה בקזינו יפה זכייה להביא לכן לטובתם יותר הרבה נוטיםהקזינו לטובת המשחק אפס המספר את ברולטה שאין האוזן את לסבר בשביל

. לשתיים אחד היו אחד בהימור להפסיד שלך הסיכויים לאחד אחד ממש היו והסיכויים . הסיכוי מה אבל מהשניים אחד אדום או ירוק או לבוא יכול שהרי פשוט הוא החישוב

? צירופים ארבעה לבוא שיכולים מפני וזאת לארבע אחד היא התשובה פעמיים לטעות . הסיכוי למה ועדיין ואדום ירוק וירוק ירוק וירוק אדום ואדום אדום והם מכות בשני

" בשיטת " ברולטה מכות חמש לשחק גב לך שיש נניח לארבע אחד הוא לטעותלזה ונוסיף פעמים חמש רק לטעות לעצמך להרשות יכול שאתה אומרת זאת ההכפלה

שיעלה מסוים צבע על בדעתך חשבת רק אלא שיחקת לא שבהם טעויות שני עודשלך הסיכויים מה קודם שלמדנו כפי מפסיד היית אז משחק היית שאם ומסתבר

? היו להפסיד

Page 67: קבלת החלטות בסביבה דינאמית

67

ברולטה משחקעל פעמים בהסתמך הרבה כך כל להפסיד אפשר שאי נולדתה ההנחה כן אם אלא

. , אני שאמרנו כפי בתוספת הכסף את לעצמך תחזיר שתזכה הפעמים באחת נחס במזלכך להמר מתחיל הייתי ואז כסף לשים מבלי פעמיים לטעות ומחכה בקזינו יושב הייתי

פעמיים כסף ולהפסיד לטעות לך חסכת מקרה להרויח . שבכל שזמנך ההגיון מן . ועכשיודבר בעצם שזה פעמיים לעצמי אטעה שאני עד הרבה לחכות רוצה הייתי לא שאם או

אני אז זמן אורך אבל יום לאותו ברולטה הטמון הפוטנציאל על ומראה מאד נחמדתוצאות של סטטיסטי חישוב ידי על ברולטה קודמות תוצאות לפי אבל מכה כל משחק

הקודמות לתוצאות בהתאם : אפשריות אז לדוגמה. רצוף ירוק פעמיים ברולטה יצא אםמהרצף לשינוי מצפה אני עכשיו שכן האדום על להמר אתחיל ירוק ולהפך אני בא אם

לרצף אצפה אני עכשיו כי הירוק על מהמר אני אז אדום לאחריו הסיכויים. ומידשהסיכויים שונים פיס במשחקי כמו ושלא הקזינו מול אתה שוים כמעט הם ברולטה

. נניח ביצוע בר שהוא דבר זה בקזינו יפה זכייה להביא לכן לטובתם יותר הרבה נוטיםהקזינו לטובת המשחק אפס המספר את ברולטה שאין האוזן את לסבר בשביל

. לשתיים אחד היו אחד בהימור להפסיד שלך הסיכויים לאחד אחד ממש היו והסיכויים . הסיכוי מה אבל מהשניים אחד אדום או ירוק או לבוא יכול שהרי פשוט הוא החישוב

? צירופים ארבעה לבוא שיכולים מפני וזאת לארבע אחד היא התשובה פעמיים לטעות . הסיכוי למה ועדיין ואדום ירוק וירוק ירוק וירוק אדום ואדום אדום והם מכות בשני

" בשיטת " ברולטה מכות חמש לשחק גב לך שיש נניח לארבע אחד הוא לטעותפעמים חמש רק לטעות לעצמך להרשות יכול שאתה אומרת זאת לזה ההכפלה ונוסיף

שיעלה מסוים צבע על בדעתך חשבת רק אלא שיחקת לא שבהם טעויות שני עודשלך הסיכויים מה קודם שלמדנו כפי מפסיד היית אז משחק היית שאם ומסתבר

היו ?להפסיד

Page 68: קבלת החלטות בסביבה דינאמית

68

למשחק דוגמאBet 1 Bet 2 Bet 4 Bet 8 Bet 16 Bet 32 …

2 4 8 16 32 64

זכיה זכיה זכיה זכיה זכיה זכיה

:זכיה

1 3 7 15 31 63:השקעה(=2^1-1) (=2^2-1) (=2^3-1) (=2^4-1) (=2^5-1) (=2^6-1)

הסתברותהפסדים p p^2 p^3 p^4 p^5 p^6:לרצף

1 1 1 1 1 1:רווח

p=0.6:0.6 0.36 0.21 0.13 0.08 0.046עבור

Page 69: קבלת החלטות בסביבה דינאמית

69

בשיטה בעיותלבצע • שניתן הסבבים במספר חסומים אנחנו

) / , הימור) מקסימום מינימום אשראי דומה> קו בעיה> במטח השקעות של במינוף

הוא • דבר של בסופו שלנו 1הרווח

אפשריים פתרונותיותר )• קטן בהימור (1להתחיל סנט ושוב • שוב ההימור על לחזור

הקזינו את לנצח השיטה נמצאה ?האומנם

Page 70: קבלת החלטות בסביבה דינאמית

70

סימפסון פרדוקסדוגמה: •• . אחת כל וגאס בלאס לחופשה טסו ודליה רותי

לעצמה . 100הקציבה להלן יום בכל להימורים דולר: יום בכל שלהם הרווח אחוזי

•? כסף יותר עם הביתה חזרה מהן מי

דליה רותיק' בלקג רולטה ק' בלאקג רולטה60% 25% 50% 20% א 'יום40% 40% 40% 30% ב 'יום65% 20% 60% 5% ג 'יום

Page 71: קבלת החלטות בסביבה דינאמית

71

) המשך ) סימפסון פרדוקס• - ה מתוך בכמה תלויה הימרה 100$התשובה

מהמשחקים אחד בכל מהן אחת כל( -< 50:50שתיהן – דליה ) לשתיהן זהה חלוקה כל אורותי -< 20:80ודליה 80:20רותי –

Page 72: קבלת החלטות בסביבה דינאמית

72

confirmation bias

•? בתמונה רואה אתה מה

•? בכך בטוח אתה כמה עד

Page 73: קבלת החלטות בסביבה דינאמית

73

confirmation bias

Page 74: קבלת החלטות בסביבה דינאמית

74

confirmation bias

•? בתמונה רואה אתה מה

•? השתנתה הסוביקטיבית ההסתברות האםעוד • הסופית המטרה את רואים אנחנו לעיתים

, משפיע וזה הבעיה את לנתח שהתחלנו לפנישלנו הסוביקטיבית ההסתברות הערכת על

Page 75: קבלת החלטות בסביבה דינאמית

75

הסתברות עם אקראיות ערבובמוטל • . 10מטבע סביר רצף איזה ברצף פעמים

? שנראה יותר–H H T H T H T T H T–T T T T T T T T T T

• " מהשני " אקראי יותר נראה הראשון הרצףהיא • מהרצפים אחד לכל 1/1024ההסתברות

Page 76: קבלת החלטות בסביבה דינאמית

76

דגימה•: מלונות על המלצות

•- ל הבסיס זהו multi-armed bandit

מלון המלצות

38 17543 16444 16325 15831 15847 15811 15523 15548 15540 1537 15130 1516 1509 14933 14919 14810 14712 14732 1472 14627 14642 14628 14535 145

מלון המלצות

49 14545 14446 1431 14218 14222 14126 1414 14014 14029 14039 1398 1385 13617 13634 1363 13424 13336 13137 13115 13021 13016 12813 12020 116

Page 77: קבלת החלטות בסביבה דינאמית

77

מנוגדות השפעות•? דרכים מתאונת להיפגע סיכוי יותר יש מתי

יותר, – נוחים הנהיגה כשתנאי בקיץ–? יותר, קשים הנהיגה כשתנאי בחורף

•? לדיסנילנד ללכת עדיף מתיoffseasonב- –בעונה–

•? בסופר בקופה זמן יותר נחכה מתיאנשים, – מעט כשיש בלילהאנשים, – הרבה כשיש ביום

Page 78: קבלת החלטות בסביבה דינאמית

78

סוף

Page 81: קבלת החלטות בסביבה דינאמית

81

Bandit Problems

Page 82: קבלת החלטות בסביבה דינאמית

82

התועלת תורת

0 10 20 30 40 50 60 70 80 90100

110120

130140

150160

170180

190200

0.00

2.00

4.00

6.00

8.00

10.00

12.00

14.00

16.00

xxU =

Page 83: קבלת החלטות בסביבה דינאמית

83

מוגבלת רציונליותקושי ) • אופטימלית פעולה לחשב יכולת חוסר

חישובי(רציונליות • לא פעולותפסיכולוגיות • השפעות