לתת לנתונים לדבר, ולעצמנו להקשיב

שלומות מליסבון, בה מסתיים היום כנס תלת-יומי של האגודה הבינלאומית לאקונומטריקה ישומית. בחדרים פנימה מוצגות עבודות המתארות התמודדות עדכנית עם שלל בעיות ישומיות. כיצד, למשל, נבצע הסקה סטטיסטית במקרה בו אנו צופים במשתנה התלוי ובמשתנה העזר בבסיס נתונים אחד, ובמשתנה העזר ובמשתנה המסביר בבסיס נתונים אחר? לבעיה זו קיים פתרון המבוסס על שיטת המומנטים הכללית. אם הייתם איתנו בכיתה בסמסטר א' של אקונומטריקה למוסמך, אף אחד מהמושגים האלה לא מפחיד אתכם יותר, ויש לכם יכולת מסויימת להפחיד באמצעותם אנשים אחרים (מומלץ להמנע מכך: תלמידי חכמים מרבים שלום בעולם).

איך אפשר לשבת ולהקשיב להרצאות כאלו בריכוז במשך יום שלם? התשובה פשוטה: האלקטרוניקה נשארת בתיק, מחברת ועט על השולחן. העיניים עוקבות, והיד רושמת. אינספור מחקרים מוכיחים שכתיבה וסיכום באמצעים אלו מביאה לתוצאות אקדמיות טובות בהרבה משימוש באמצעים אלקטרוניים, ומחקרים נוספים מצביעים על ההשלכות השליליות של גלילה בטלפון על קשב וריכוז, מוטיבציה ובריאות מנטלית. אין מתנה גדולה יותר לעצמנו ולאנשים שבאנו לשמוע מלהניח את האלקטרוניקה בצד לשעה או שתיים. בונוס: אחרי יום של שקידה מהסוג הזה, הבירה בפאב המקומי טעימה יותר ואפשר לחגוג את החמישיה של פורטוגל על אוזבקיסטן כמו ליסבונאי מצוי.

מחפשים תשובה בים הנתונים. ליסבון, יוני 2026. צילום: אלון איזנברג

החוט המחבר בין כל העבודות האמפיריות הוא השילוב הראוי בין הנחות לבין נתונים. המודל האקונומטרי הוא רשימת הנחות שלאורן אנו מנתחים את הנתונים. קיים מתח מתמיד בין שתי שאיפות: האחת, לכפות כמה שפחות הנחות ו"לתת לנתונים לדבר." השאיפה השניה היא לתת לעצמנו להקשיב: לרכוש ידע ותובנות איכותניות אודות התופעה הנחקרת, להניח הנחות המתחשבות במידע החשוב הזה (שלעתים נקרא "רקע מוסדי"), ואז לגשת לנתונים באופן מושכל יותר. את הידע המוסדי אנו עשויים לרכוש על בסיס שיחות עם אנשים הפועלים בתחום ומכירים אותו מבפנים, או באמצעות קריאה משמעותית של חומר קיים בנושא. חלק מהחומר מגיע ממקורות לא אקדמיים, או ממקורות אקדמיים מחוץ לדיסציפלינה שלנו.

המתח האיכותני-כמותי עולה בהקשרים רבים, וכאן אתייחס לאופן בו הוא משתקף בעבודה מאת מילנה אלמגרו, קנת' לאי ואלנה מנרסה שהוצגה הבוקר בכנס. עסקינן בסיטואציות בהן אנו מבקשים להשתמש בנתונים כדי לעמוד על מידת התחליפיות בין מוצרים שונים. למשל, בשוק התרופות משכחות-הכאבים, נבקש לדעת עד כמה משכחי כאבים המבוססים על חומרים פעילים שונים מהווים תחליפים קרובים מנקודת מבטו של הצרכן.

בשוק זה קיימות תרופות המבוססות על שלושה חומרים פעילים: פרצטמול (אקמול וחבריו), איבופרופן (אדוויל ואחיותיה) ואספירין. צרכנים עשויים להיות "נאמנים" לחומר פעיל: למשל, אם אני רגיש לאיבופרופן או שנאסר עלי לקחת תרופות מבוססות אספירין, יתכן שאני חייב לקנות משכחי כאבים מבוססי פרצטמול. מנגד, יתכן שצרכנים כלל אינם נאמנים לחומר פעיל, אלא למותג (למשל, "אקמול" של טבע). עבודה אמפירית יכולה לעזור לנו לבחון אלו מבין השערות "הנאמנות" הללו תואמת את הנתונים בצורה טובה יותר. לשאלות כאלו עשויה להיות חשיבות רבה: בשוק התרופות השבדי, התבקשה רשות התחרות ב-2009 לאשר מיזוג בין שתי חברות ששלטו ביחד בכלל התרופות מבוססות הפרצטמול. אם הצרכנים נאמנים לחומר פעיל, המיזוג מדאיג, שכן הוא יהפוך את צרכני הפרצטמול לשבויים בידיו של מונופול, במקום לראות מולם דואופול. אך אם הצרכנים נאמנים בעיקר למותג, המיזוג אינו מדאיג כלל. על המקרה עצמו ועל הניתוח האקונומטרי שלו כתבתי בעבר כאן.

כיצד אנו בוחנים השערות כאלו? אנו כותבים מודל אקונומטרי בו, בשלב ראשון, אנו מחלקים את המוצרים לקבוצות, המייצגות את האופן בו אנו תופסים את מבנה השוק. הנחות המודל גורסות שצרכנים הינם הטרוגניים בהעדפותיהם, אך שהעדפות אלו מתואמות בתוך הקבוצה. יתכן, למשל, שאני צרכן שמייחס תועלת גבוהה לכל המוצרים מבוססי הפרטצמול, או תועלת נמוכה מכולם (אם, למשל, אני אלרגי לחומר הזה). בשלב שני, אנו לוקחים את המודל לנתונים כדי לבדוק עד כמה הנתונים תומכים במודל שכתבנו, ובפרט, בחלוקה לקבוצות שכפינו על הניתוח.

ניתן לבצע ניתוח כזה מספר פעמים: למשל, פעם אחת כשהחלוקה לקבוצות היא על פי חומר פעיל, ופעם שניה כשהחלוקה היא לפי מותג. לרוב, נגלה שחלק מהחלוקות האלו נדחות על ידי הנתונים בצורה ברורה. המודל עשוי להדחות ככל שהוא מניב מסקנות שאינן סבירות (למשל, האמידה מניבה טווחי פרמטרים שאינם "חוקיים," כמו צרכנים שאינם רגישים למחיר או אפילו מעדיפים לשלם יותר על תרופות). באופן זה אנו יכולים לקחת לנתונים השערות מחקר קונקרטיות, המבוססות על ניתוח איכותני המבוצע על החוקרים או על ידי הרגולטור. למשל, יתכן שרשות התחרות שוחחה עם אנשים המכירים את הענף, וחלקם טענו שהצרכן נאמן בעיקר לחומר הפעיל, בעוד שאחרים טענו שהצרכן נאמן בעיקר למותג. על ידי הבניית הטענות האלו לתוך הנחות סדורות, אנו יכולים לבחון מי מהמודלים המתחרים הללו נתמך בצורה חזקה יותר על ידי הנתונים. מסקנות כאלו עשויות לתמוך במגוון החלטות אנושיות, במקרה זה, האם לאשר מיזוג.

כל זה מוכר וידוע. מה חדש בעבודה של מילנה, קנת' ואלנה? עבודה זו מציעה לנו לשחרר את הידיים מההגה, ולהמנע מלבצע בעצמנו את חלוקת המוצרים לקבוצות על בסיס הערכות איכותניות שלנו. במקום זה, מוצע לנו כאן לבצע את החלוקה באופן אוטומטי באופן שמונחה על ידי הנתונים. הספרות בסטטיסטיקה מציעה שיטות רבות לחלוקות תצפיות לצבירים, או קבוצות (clustering). העבודה הנוכחית מציעה לנו ליישם את התובנות מאחת מהשיטות הללו, המכונה K-means clustering, כדי לחלק את המוצרים לקבוצות באופן שממקסם את יכולת ההסבר של המודל ביחס לנתחי השוק של כל מוצר. חלוקה זו מתבצעת בשלב ראשון, ובשלב השני מתבצע הניתוח המסורתי, קרי, כיול הפרמטרים של המודל, המייצגים את העדפות הצרכנים, לאור החלוקה הראשונית.

אז מה עדיף: לבחון סגמנטציות של המוצרים בשוק הנשענות על ידע מוסדי, או לתת לנתונים לחלק את המוצרים לסגמנטים על בסיס מקסום יכולת החיזוי הסטטיסטי של המודל? ניתן לזהות כאן מתח מסויים בין מטרות אקונומטריות ומטרות סטטיסטיות. בעבודה אקונומטרית אנחנו פחות מוטרדים מיכולת החיזוי של המודל, וזה אינו הקריטריון שמנחה אותנו. חשוב לנו יותר לבחון השערות קונקרטיות אודות מכניזמים כלכליות ("אפקטים סיבתיים"), ולראות אלו השערות נתמכות, יותר או פחות, על ידי הנתונים.

על פי ראיה זו, המודל הוא אמצעי בלבד, ולא מטרה. כל המודלים פגומים, אך משקפים את היכולת הקוגניטיבית שלנו להבין את העולם. אנו הולכים לנתונים כדי לברר מי מבין המודלים הפגומים שמייצגים את חשיבתנו תואמים יותר את המציאות. סגמנטציה אוטומטית של השוק על בסיס קריטריונים של מקסום יכולת חיזוי עלולה, בעקרון, להביא אותנו לסגמנטציית שוק שלא מתיישבת כלל עם המציאות המוכרת לאנשים הפועלים בענף, הנובעת רק ממגבלות של המודל שאת יכולת החיזוי שלנו ניסינו למקסם. יתרה מכך, אנו מבצעים את העבודה כדי לתמוך בקבלת החלטות אנושית. על כן, תוצאותיה צריכות להתכתב עם הנחות יסוד שגיבשנו באופן קוגניטיבי-אנושי, ולא רק עם קריטריון סטטיסטי שעלול להיות מנותק מהן.

מנגד, אני חושב שיש ערך משמעותי בגישה הגלומה בעבודה החדשה. היא מעשירה את ארגז הכלים שלנו בטכניקה נוספת שמאפשרת לנו לבחון את עצמנו. נניח שבחרנו, על בסיס איכותני, בסגמנטציה מסויימת של המוצרים בשוק, והנתונים לא דחו אותה (וכן דחו חלוקות אלטרנטיביות). לכאורה, מצאנו את התשובה ואת הסגמנטציה ה"נכונה." אבל למה לעצור כאן, ולא ליישם, במקביל, את השיטה שמוצעת בעבודה החדשה? יהיה מעניין לראות אם החלוקה מבוססת-הנתונים תתמוך אף היא במסקנות האיכותניות שלנו. ואם לא, הדבר עשוי לשמש כתמרור אזהרה חשוב: אולי טעינו, ועלינו לשקול סגמטציות אלטרנטיביות?

בסופו של יום ברור שעבודה אמפירית טובה בכלכלה צריכה לדעת גם לתת לנתונים לדבר, וגם לאפשר לעצמנו להקשיב לתאוריות ולתפיסות רווחות בקרב האנשים המכירים את תחום הידע מקרוב. אמנם, התפיסות הללו עלולות להיות שגויות. אך למידה שיטתית מתאפשרת כאשר אנו לוקחים תפיסות כאלו ברצינות, כותבים הנחות המבוססות עליהן, ואז נותנים לנתונים לדבר. בשלב זה, הנתונים יכולים לאשש, או להפריך את הנחות היסוד שלנו. זאת לעומת מצב שבו אנחנו מגיעים לנתונים "טבולה ראסה" ללא כל תפיסות מקדמיות, ונותנים להם לדבר באופן בלעדי.

בעולם בו בסיסי הנתונים נעשים עשירים יותר, ומכונות בינה מלאכותית מבצעות חישובים בקצב שמאתגר את היכולת הקוגניטיבית שלנו, יהיו כאלו שיאמינו שניתן להתבסס באופן מוחלט על דפוסים בנתונים, ולזנוח את הניסיון הקוגניטיבי להבין את העולם בעצמנו ו"למשטר" את הנתונים באמצעות תפיסותינו המוגבלות. ישנן סיבות רבות שבגללן אני לא מאמין בחזון כזה, ובראשן הנקודות שהעלה קופמנס כבר ב-1947. קופמנס הטיל ספק בכך שניתן בכלל לגשת לנתונים בצורה "נקיה." עצם האופן בו בחרנו להגדיר את המשתנים ולאסוף את הנתונים מגלם לא מעט הנחות סמויות לגבי התופעה הנחקרת. תהליך המידול מאפשר לנו להפוך הנחות כאלו לשקופות יותר, ובכך עוזר לנו להבין את הנתונים, את עצמנו, ואחד את השניה.

רוצים להמשיך בשיחה? ניתן להגיב למטה, לעקוב אחרי "על שווקים ותחרות" בטוויטר, להירשם בדף הבית לקבלת רשומות חדשות לתבת המייל, או ליצור קשר.

פורסם ב-25.6.2026, י' בתמוז התשפ"ו. כל הזכויות שמורות לאלון איזנברג Ⓒ2019-2026

כתיבת תגובה

אתר זו עושה שימוש ב-Akismet כדי לסנן תגובות זבל. פרטים נוספים אודות איך המידע מהתגובה שלך יעובד.