קחו ענף. נניח, ענף המשאיות. נניח כי הצרכנים רוכשים את המשאית שמניבה להם את התועלת הרבה ביותר. כמו כן נניח כי בכל רבעון, יצרני המשאיות מכריזים על מחירי המשאיות באופן סימולטני, קרי, בעת ובעונה אחת, על מנת למקסם את הרווח באותו רבעון בלבד.
לכאורה חטאנו כאן בכל חטא יוהרה אפשרי. בצד הביקוש, הנחנו כי רוכשי המשאיות הינם רציונליים, חשופים לכל המידע הרלבנטי, ומסוגלים לעבד אותו באופן מדוייק. בצד ההיצע, התעלמנו מתמחור דינמי המביא בחשבון השלכות על ביקוש עתידי, ותארנו מנגנון סימולטני הנשמע מגוחך: במציאות, פירמות אינן מודיעות על החלטות התמחור שלהן באופן שכזה.
אבל מה תגידו, כתב כריס קונלון בשבוע שעבר בטוויטר, אם אספר לכם שמודל אווילי שכזה מסביר 90 אחוז מהשונות התוך-תקופתית במחירי המשאיות?
הציוץ של כריס, ידיד המערכת וחבר לספסל הלימודים, נועד בכלל להגן על הנחת מקסום הרווח, נושא בו כבר עסקנו כאן בעבר. אבל הוא פותח כמה שאלות מעניינות: כיצד נגדיר הצלחה או כשלון של מודל אקונומטרי? מהן נקודות המפגש והסינרגיה בין הגישה האקונומטרית-הסגפנית, השואפת להסביר את העולם עם מודל התנהגותי פשוט ודל-משתנים, לבין המודלים האימתניים של עולם למידת המכונה? ומהם האפיקים המבטיחים במידול הביקוש והתמחור בעתיד הקרוב?
מק'גייור מכה שנית. השאלה הראשונה שעל הפרק היא: כיצד יתכן שמודל שנראה כמו שני חוטי תיל מודבקים במסטיק משומש מצליח להסביר חלק כה ניכר מהשונות במחירי המשאיות?
אבחנה ראשונה היא שמודל הביקוש אינו כה תמים כמו שהוא נשמע. מצד אחד, הוא מניח שהעדפות הצרכן מוגדרות על מספר מצומצם יחסית של תכונות, נניח, מותג המשאית, כח סוס, צריכת דלק והיבטים של המפרט הטכני. מנגד, המודל מכיל גם "הפרעות מקריות" העשויות לשקף הטיות אינדיבידואליות לטובת מוצרים מסוימים (לדוד שלי היתה משאית כזו אז גם אני רוצה), וכן אפקטים שיטתיים של מאפיינים חמקמקים כמו עיצוב נאה, או אמינות המוצר והשירות. כך מצליח המודל גם לתפוס את הממדים העיקריים שמנחים את הצרכן באופן שיטתי, וגם להכיר בקיומם של היבטים אמורפיים וקשים-לכימות בהעדפותיו.
אבחנה שניה נוגעת לצד ההיצע: מודל הביקוש מניב אומדן אמפירי של גמישויות הביקוש מולן ניצבים יצרני המשאיות. אינטואיטיבית, ככל שהביקוש למשאית שאני מוכר יותר קשיח, כך אוכל להינות משולי רווח גבוהים יותר בשיווי המשקל. זה רעיון פשוט המוכר לנו היטב: אנו נתקלים בו בכל פעם שאנו קונים קרטיב מגזלן בשטח ו"נדהמים לגלות" שהמחיר כפול ממה שהיינו משלמים על אותו קרטיב ממש בסופר. מודל ההיצע שתארנו – הכרזת מחירים סימולטנית – הינו פשטני להחריד, אבל תופס את הרעיון הזה בצורה טובה, ומאפשר לנו להסביר בצורה טובה למדי את התפלגות המחירים הנצפית במדגם.
לבסוף, נציין גם שהמודל אכן מסביר בין 86 ל-94 אחוזים מהשונות התוך-תקופתית במחירי המשאיות, אך רק 50-60 אחוזים מהשונות במחיר של משאית ספציפית על פני זמן. זה עדיין כושר הסבר מרשים עבור מודל התנהגותי-כלכלי המסתמך על שיווי משקל נאש, אך הוא כמובן מצביע על כך שגם את המודל הפשוט הזה ניתן לשפר. ואכן, הספרות האמפירית המודרנית במחקר שווקים מציעה התאמות ושיפורים במודל הפשוט שנבחן בעבודה אליה התייחס כריס.
תחזית או הסבר? נקודה עדינה יותר נוגעת למטרתם של מודלים אקונומטריים בתחום התמחור. להסביר 90 אחוז מהשונות במחיר זה הישג נאה – אין הרבה מודלים במדעי החברה שמסבירים נתח כה ניכר מהתופעה הנחקרת. אבל האם זוהי בכלל המטרה?
עבורי כאקונומטריקאי התשובה שלילית. אם מטרתי היתה למקסם את כח ההסבר של המודל הסטטיסטי שלי, הייתי יכול להשיג אותה על ידי הכללתם במודל של מספר עצום של משתנים "מסבירים", גם בהעדר משנה סדורה לגבי השפעתם הצפויה. אבל מה שבאמת מעניין אותי הוא לספר סיפור – נראטיב פשוט יחסית על הכוחות הכלכליים בפעולה – ולבדוק האם הסיפור הזה "שורד" את מבחן הדאטה.
בהיבט הזה, לאו דווקא 90 אחוזי ההסבר הם הנתון המרשים במחקר המשאיות אודותיו צייץ כריס – אלא דווקא העובדה שמודל התמחור הפשטני נבחן, ולא נדחה על ידי הנתונים (למרחיקי לכת: הדרך לבחון מודל כזה היא לאמוד משוואת תמחור ולבחון את ההשערה שהמקדם על שולי הרווח המשתמעים מהמודל שווה ל-1). משמעותה של תוצאה זו אינה שהמודל "נכון" – בהגדרה, הוא פשטני ולא מדוייק – אלא שיתכן וניתן להסתמך עליו כקירוב סביר לאופן בו מתקבלות החלטות התמחור בפועל.
במקרה זה, המודל הופך לכלי נשק איכותי, לא בזכות יכולת ההסבר של המחירים שנצפו במציאות, אלא בזכות יכולתו לנתח תרחישים היפותטיים. אם המודל סביר, הרי שאני יכול להשתמש בו כדי לבחון כיצד יגיבו הצרכנים והפירמות לשינויים כגון: השקת מוצרים חדשים, כניסת מתחרה חדש, גריעת מתחרה קיים באמצעות מיזוג וכו'. ואכן, הספרות האקונומטרית המודרנית בתחום התחרות רוויה ביישומים כאלו.
ניקח את זה לפרקטיקה: נניח שאתם מוכרים משקאות קלים, וידוע לכם שבחודש הקרוב יגרע מתחרה מהשוק כך שתתמודדו מול שתי פירמות מתחרות, במקום שלוש. כיצד ניתן לחזות את השינויים בהתנהגות התמחור בענף, ולהיערך לכך מבעוד מועד? במידה ואמדנו את המודל שתואר למעלה, התשובה פשוטה: אין צורך לחזור כלל לנתונים, אלא להשתמש בפרמטרים שכבר אמדנו ולחשב מחדש את מחירי שיווי המשקל בהנתן שלושה שחקנים בענף. מאחר והמודל פשוט, גם החישוב פשוט ומניב מסקנה מידית.
תן למכונות ללכת במקומך. נעמוד כעת על ההבדל בין המידול הכלכלי-אקונומטרי שתארנו למעלה לבין הגישה הסטטיסטית המאפיינת את תחום למידת המכונה. למידת מכונה אינה מבוססת על מודל התנהגותי-כלכלי, אלא על אפיון מודל סטטיסטי המקסם את איכות התחזיות שהוא מייצר תוך שימוש בכמות עצומה של נתונים ומשתנים. למידת המכונה משתמשת בטכניקות רגולריזציה על מנת לאזן בין הרצון להסביר כמה שיותר מהשונות בנתונים, לבין הרצון להמנע מלייחס משמעות יתרה לרעש הדגימה בנתונים בעזרתם "מאמנים" את המודל.
בעולם דיגיטלי בו אני צופה במספר עצום של משתנים המאפיינים את בעיית הצרכן (מתי קיבל את ההחלטה, באלו מוצרים צפה קודם לכן באתר וכו') יש ערך עצום לשימוש באלגוריתמים כאלו לצורך תמחור ומיצוב מוצרים: הם מאפשרים לי לחזות ברמה גבוהה של דיוק כיצד המכירות שלי יושפעו ממיקום שונה של מוצר באתר, או מרמת מחירים שונה שלו.
היתרון של גישה זו הוא ביכולת לשאוב כח הסבר ממשתנים רבים, גם מבלי לנסח במפורש מהו הערוץ המדוייק דרכו הם משפיעים על התוצאה. כמו כל דבר בחיים, האגנוסטיות הזו מגלמת יתרונות אך גם חסרונות. בפשטות: יש הרבה מודלים שיכולים להסביר בצורה טובה את הנתונים, אך התוכן שלהם עלול להיות שונה באופן מהותי ורדיקלי. ללא תובנה תאורטית כלשהי, קשה לבחור במודלים "טובים" ולשחרר את ה"רעים" לדרכם.
קושי נוסף נוגע לאופי התחזיות שנרצה להפיק. נחזור לתרחיש גריעת המתחרה מן השוק. על מנת לחזות מה תהיה ההשפעה של תרחיש כזה ללא מודל התנהגותי, נצטרך "ללמד" את המכונה מה קורה במידה ומתחרה נעלם. אך לא תמיד יעמדו לרשותנו נתונים מתאימים לשם כך: לא סביר שיעמדו לרשותנו ארועים מתועדים רבים בהם הענף הספציפי שלנו הצטמצם מארבעה לשלושה מתחרים, ונתונים מענפים אחרים עלולים להיות בעלי רלבנטיות נמוכה לצורך הסקה לגבי הענף שלנו, בשל השונות העצומה ברקע המוסדי וההתנהגותי המאפיין אותם.
הגישה האקונומטרית הסגפנית, מנגד, אינה ממצה את התובנות שניתן להפיק מן הנתונים, מאחר והיא נסמכת על מודל התנהגותי המבוסס על הנחות פשטניות עד-גיחוך, ומשתמשת במספר קטן של משתנים. מנגד, היא מגדירה באופן מלא את התמריצים וההחלטות של כל שחקן בשוק, ולכן מותאמת באופן טבעי לניתוח תרחישים היפותטיים: מאחר והיא "יודעת" כיצד יגיבו הצרכנים והפירמות, היא יכולה ליישם את הידע הזה באופן פשוט למדי.
לגישות שונות יש יתרונות וחסרונות. מבט מחוייך על הנושא סיפק לנו בשבוע שעבר (בטוויטר, איך לא) ויקטור צ'רנוזהוקוב, איש MIT ודמות מובילה בשילוב גישת ההסקה הסיבתית האקונומטרית עם למידת המכונה:
I just came across this nice quote by Democritus c400 BC: “I prefer to discover a causality rather than become a machine learner”… Evidently, some people were far ahead of their time. What do you say, a random Twitted wanderer, so I can quote you in my lecture note?
— Victor Chernozhukov (@VC31415) January 1, 2021
https://platform.twitter.com/widgets.js
להינות מכל העולמות. כיצד נוכל לרתום יחדיו את כוחן של למידת המכונה, מצד אחד, ושל המידול הכלכלי-אקונומטרי, מצד שני, על מנת לשפר את יכולת קבלת ההחלטות של הפירמה? נצביע כאן על שני אפיקים עיקריים כאלו.
ראשית, ניתן להתחיל ממודל למידת מכונה קלאסי, ולהבנות לתוך תהליך הרגולריזציה שלו אילוצים הדורשים מההתנהגות הנחזית להיות עקבית עם מודל כלכלי. על הכיוון הזה הצביע לאחרונה (כן כן, בטוויטר) שון טיילור, שחלק עמנו את העובדה שהצוות שלו בחברת Lyft מיישם רעיונות כאלו בפועל. אילוצים כאלו יכולים לבוא לידי ביטוי כתנאי מונוטוניות או "מגבלות צורה" אחרות על פונקציות לגביהן יש לנו תובנה כלכלית. למשל: גם מבלי למדל את העדפות הצרכנים ואת עקומת הביקוש הנגזרת מהן, יתכן שנרצה לייצר תחזיות מהן משתמע כי עקומה זו יורדת "משמאל לימין" – עקרון כלכלי בסיסי.
שנית, ניתן להתחיל דווקא עם מודל ביקוש אקונומטרי מהסוג שתארנו למעלה בהקשר של ענף המשאיות, אך לרתום את האלגוריתמים של למידת המכונה כדי לטייב אותו. נניח למשל כי ארבעה משתנים – כח סוס, מרכב, צריכת דלק, ויכולת נשיאה מירבית – משפיעים על החלטות הצרכנים. אך באיזה אופן עלי להכניס את ארבעת המשתנים הללו למודל התועלת? הגישה המסורתית מכניסה אותן באופן אדיטיבי, ומוסיפה אינטראקציות וחזקות של משתנים אלו "לפי הרגש". אך ישנו מספר עצום של צורות פונקציונליות אפשריות, ואין לנו בדרך כלל תאוריה טובה שתעזור לנו לבחור מביניהן. אלגוריתמים מעולם למידת מכונה יכולים לבוא לעזרתנו במשימה זו, ואחרות הבאות לידי ביטוי בניתוח אקונומטרי של שווקים: למשל, בחירת השילוב האופטימלי של משתני עזר לשם טיפול בבעיית הסימולטניות של הביקוש וההיצע.
ניתן לצפות כי בעתיד הקרוב יגבר השילוב של גישות כאלו לצורך הבנת החלטות תמחור ומיצוב מוצרים, כמו גם לתמיכה בקבלת החלטות נוספות בזירה העסקית. לא נדרשת מידה רבה של דמיון כדי לראות כיצד גישות אלו יכולות לעזור, למשל, לביצוע סימולציית מיזוגים כפי שסיפרנו כאן בעבר, או לתמחר תמלוגים על שימוש בפטנט.
רוצים להמשיך בשיחה? ניתן להגיב למטה, לעקוב אחרי "על שווקים ותחרות" בטוויטר, להירשם בדף הבית לקבלת רשומות חדשות לתבת המייל, או ליצור קשר.
פורסם ב-9.1.2021. כל הזכויות שמורות לאלון איזנברג Ⓒ2019-2021