פרק 9 Flashcards
ייצוג ידע Knowledge
המוח שלנו מלא במושגים. מושג
(concept)
הנו ייצוג מנטאלי המשמש עבור מגוון פונקציות קוגניטיביות כמו זיכרון, הסקה, שימוש והבנה של שפה.
הפונקציה הנלמדת ביותר של מושגים היא קטגוריזציה. קטגוריות הן לא רק דרך נוחה למיון אובייקטים, אלא הן כלי הכרחי להבנה שלנו את העולם. אחת הפונקציות החשובות ביותר של קטגוריות הנה לעזור לנו להבין מקרים אינדיווידואליים שלא נתקלנו בהם מעולם. ברגע שאנו יודעים שמשהו נכנס לקטגוריה מסוימת אנו יכולים לדעת המון דברים כלליים על המשהו הזה, וכך יכולים למקד את האנרגיה שלנו בבדיקה ספציפית של האובייקט המסוים שמולנו- מה מיוחד בו. היכולת שלנו להכניס דברים לקטגוריות יכולה לעזור לנו גם להבים התנהגויות שלולא הקטגוריות היו מבלבלות אותנו. אם לא היו לנו קטגוריות היה לנו קשה מאוד להתמודד עם העולם.
מדוע הגדרות לא עובדות עבור קטגוריות
ע”פ גישת ההגדרה לקטגוריזציה אנו יכולים להכריע האם אובייקט מסוים שייך או לא לקטגוריה אם הוא עומד בהגדרה של הקטגוריה. הגדרות עובדות היטב עבור אובייקטים מסוימים כמו צורות גיאומטריות. לכן הגדרה של ריבוע כ”צורה במישור בעלת ארבע צדדים השווים זה לזה”- עובדת. אולם עבור רוב האובייקטים הטבעיים (כמו ציפורים, צמחים וכו’) ועבור המון אובייקטים שנוצרו בידי האדם (כמו כיסאות) ההגדרות לא עובדות טוב כלל. הבעיה היא שלא לכל החברים בקטגוריה מסוימת יש את אותן תכונות. הבעיה היא שלא כל החברים בקטגוריות יומיומיות הינם בעלי אותם מאפיינים. כך שגם אם ההגדרה המילונית לכיסא היא: “רהיט בעל מושב, רגליים, משענת ולעיתים קרובות ידיות, שמעוצב לאכלס אדם אחד” נשמעת הגיונית, יש אובייקטים להם אנו קוראים כסאות אשר אינם מתאימים להגדרה.
הפילוסוף Ludwig Wittgenstein (1953) הציע רעיון של דמיון משפחתי (family resemblance), כדי להתמודד עם כל שההגדרה לא תמיד כוללת את כל חברי הקטגוריה. דמיון משפחתי מתייחס לעובדה כי פרטים בקטגוריה ספציפית דומים אחד לשני במספר דרכים. לפיכך במקום לקבוע מספר מאפיינים שכל חבר בקטגוריה חייב לעמוד בהם, גישת הדמיון המשפחתי מאפשרת גיוון בתוך הקטגוריה. כיסאות לדוגמא יכולים לבוא בגדלים שונים וצורות שונות אך כל כיסא דומה לכיסאות אחרים בכל מיני דרכים. הרעיון של דמיון משפחתי הוביל פסיכולוגים להציע כי קטגוריזציה מבוססת על ההכרעה עד כמה אובייקט מסוים דומה לכמה ייצוגים סטנדרטים של קטגוריה.
גישת הפרוטוטיפ: מציאת המקרה הממוצע
לפי גישת הפרוטוטיפ
(prototype approach),
חברות בקטגוריה מסוימת נקבעת ע”י השוואה של האובייקט לפרוטוטיפ המייצג את הקטגוריה. פרוטוטיפ הוא חבר “טיפוסי” בקטגוריה.
מהו חבר טיפוסי בקטגוריה?
Elinor Rosch (1973)
הציעה כי פרוטוטיפ “טיפוסי” מבוסס על ממוצע חברי הקטגוריה שפגשנו בעבר. לדוג’, פרוטוטיפ של ציפור יהיה הממוצע של הציפורים שראינו: בולבולים, אדום חזה, שקנאים, עורבים… וכו’, אולם הוא לא בהכרח בדיוק כמו ציפור מסוימת בקטגוריה. הפרוטוטיפ אם כך, אינו חבר אמיתי בקטגוריה, אלא הוא “ממוצע” ייצוגים של הקטגוריה. מובן שלא כל האובייקטים דומים לפרוטוטיפ באותה המידה.
Rosch
מתארת את השונות בתוך כל קטגוריה כמייצגת את השונות בפרוטוטיפיקאליות
(protottypicality).
פרוטוטיפיקלאיות גבוהה
(high prototypicality)
אומרת שחבר הקטגוריה קרוב בדמיון שלו לפרוטוטיפ, ואילו פרוטוטיפיקאליות נמוכה
(low prototypicality)
אומרת שחבר הקטגוריה אינו דומה לחבר טיפוסי בקטגוריה.
Rosch (1975)
בדקה את הרעיון הזה ע”י כך שהציגה לנבדקים כותרות של קטגוריות כמו “רהיטים” ו”ציפורים”, ורשימה של כ-50 חברי קטגוריה. המטלה של הנבדקים הייתה לדרג את המידה בה כל חבר מייצג את הקטגוריה בסולם של 7 נקודות (1- גבוה, 7-נמוך). בתמונה ניתן לראות תוצאות מ-2 קטגוריות שונות. רוב הנבדקים הסכימו כי דרור מייצג במידה גבוהה את קטגוריית הציפורים- דירוג של 1.18, בעוד פינגווין זכה לדירוג של 4.53 ו-6.15 לעטלף. משמעות הדירוגים הללו היא שפינגווינים ועטלפים אינם דוגמאות טובות ל’ציפור’.
לאובייקטים פרוטוטיפיקאליים יש דמיון משפחתי גבוה.
בניסוי של
Rosch and Carolyn Mervis (1975)-
הם הציגו לנבדקים רשימת אובייקטים בעלי מכנה משותף, והמטלה של הנבדקים הייתה לציין כמה שיותר מאפיינים דומים בניהם (לדוגמא- כיסא, ספה, טלפון, מראה). הנבדקים ציינו הרבה מאפיינים דומים לכיסא וספה, והרבה פחות חפיפות של מאפיינים עבור טלפון ומראה. כאשר למאפייניו של פריט מסוים ישנה חפיפה גדולה עם המאפיינים של פריטים רבים אחרים בקטגוריה, המשמעות היא שהדמיון המשפחתי בין הפריטים הללו הוא גבוה. מעט חפיפה משמעותה דמיון משפחתי נמוך. החוקרים הראו כי קיים קשר רב בין דמיון משפחתי ופרוטוטיפיקאליות, משום שאובייקטים בעלי פרוטוטיפיקאליות גבוהה הם בעלי דמיון משפחתי רב.
הצהרות על פרוטוטיפיקאליות מאומתות במהרה
השתמשו בפרוצדורה המכונה “טכניקת אימות משפט”, כדי לבדוק כמה מהר אנשים יכולים לענות על שאלות אודות קטגוריות של אובייקטים. לנבדקים מוצגות הצהרות והם נדרשים להשיב “כן” אם הם חושבים שההצהרות נכונות או “לא” אם הם חושבים שההצהרות אינן נכונות. נמצא כי אנשים ענו מהר יותר עבור אובייקטים בעלי פרוטוטיפיקאליות גבוהה (כמו “תפוח” עבור הקטגוריה “פירות”) בהשוואה לאובייקטים בעלי פרוטוטיפיקאליות נמוכה (כמו “רימון” עבור הקטגוריה “פירות”). היכולת הזו לשפוט מהר יותר אובייקטים בעלי פרוטוטיפיקאליות גבוהה נקראת אפקט הטיפוסיות
(rypicality effect).
אובייקטים פרוטוטיפיקאליים נאמרים ראשונים
כאשר נבדקים מתבקשים לומר כמה שיותר אובייקטים מקטגוריה מסוימת, הם נוטים לומר קודם את הפריטים הפרוטוטיפיקאליים בקטגוריה.
אובייקטים פרוטוטיפיראליים מושפעים יותר מהטרמה (priming)
הטרמה מתרחשת כאשר הצגה של גירוי מסוים מאיץ או מקדם את התגובה לגירוי אחר שלרוב מופיע מעט זמן לאחר מכן.
Rosch (1957)
הראתה כי חברים פרוטוטיפיקאליים של קטגוריה מסוימת מושפעים מגירוי מטרים יותר מחברים שאינם פרוטוטיפיקאליים. בניסוי הנבדקים ראשית שמעו את ה-
prime,
שהיה שם של צבע (לדוגמא- “ירוק”). 2 שניות לאחר מכן הוצגו בפני הנבדקים זוג צבעים- אחד ליד השני- והנבדקים היו צריכים ע”י הקשה על מקש כמה שיותר מהר – להכריע האם הם באותו צבע או לא. הצבעים הללו צומדו בשלוש דרכים שונות: 1) הצבעים היו זהים והיוו דוגמא טובה לקטגוריה (צבעי בסיס- ירוק, אדום כחול..). 2) הצבעים היו זהים אך היוו דוגמא גרועה לקטגוריה (גרסאות עשירות פחות של צבעי הבסיס- צהבהב, ירקרק..). 3) שני צבעים שונים המגיעים מקטגוריות צבעים שונות (לדוגמא- אדום וכחול). ניתן לראות דוגמא בתמונה. התוצאה החשובה ביותר התרחשה כאשר הצבעים היו זהים, שכן בתנאי זה ה-
priming
גרם לתגובה מהירה יותר עבור זוג צבעים זהה בעל פרוטוטיפיקליות גבוהה, לעומת צבעים שאינם פרוטוטיפיקליים. לפיכך, כאשר הנבדקים שמעו את המילה “ירוק”, הם שפטו שני עיגולים של ירוק ראשוני כזהים מהר יותר, מאשר שני עיגולים של ירוק בהיר.
Rosch
מסבירה את התוצאות הללו כך: כאשר הנבדקים שמעו את המילה ירוק הם דמיינו “ירוק טוב” (ירוק מאוד טיפוסי). הרעיון מאחורי ההטרמה הוא שההטרמה תקל על התגובה של הנבדקים אם הוא מכיל חלק מהמידע הנדרש כדי להגיב לגירוי הזה. זה ככל הנראה מה שקורה כאשר הירוק הבסיסי מופיע המבחן, אולם לא כאשר הירוק עשיר פחות בשלב המבחן. אם כך התוצאות של הניסוי תומכות ברעיון שהנבדקים יצרו דימוי של הפרוטוטיפ כתגובה למשמע השם של הצבע. בטבלה ישנו סיכום של מגוון הדרכים בהן פרוטוטיפיקליות משפיעה על ההתנהגות.
גישת האקזמפלרים: חשיבה על דוגמאות
גישת האקזמפלרים לקטגוריזציה
(exemplar approach to categorization)
בדומה לגישת הפרוטוטיפים, מערבת את ההכרעה האם אובייקט דומה או לא לאובייקט סטנדרטי. אולם, בעוד הסטנדרט בגישת הפרוטוטיפ הוא ממוצע יחיד של הקטגוריה, הסטנדרט בגישת האקזמפלר כולל הרבה דוגמאות, כל אחת מהן מכונה אקזמפלר. אקזמפלרים הם חברי קטגוריה ממשיים בהם האדם נתקל בעבר. גישה זו יכולה להסביר הרבה מן התוצאות של
Rosch.
גישת האקזמפלרים יכולה להסביר את אפקט הטיפוסיות (זמן התגובה לאובייקט טיפוסי קצר יותר בהשוואה לזמן התגובה לאובייקט שאינו כזה) ע”י כך שאובייקטים הדומים ליותר אקזמפלרים מסווגים מהר יותר. זה דומה בעיקרון לרעיון של דמיון משפחתי, שבו אובייקטים בעלי פרוטוטיפיקליות גבוהה הינם בעלי דמיון משפחתי רב יותר.
איזו גישה עובדת טוב יותר: פרוטוטיפים או אקזמפלרים?
יתרון אחד של גישת האקזמפלרים הוא כי על-ידי שימוש בדוגמאות אמתיות זה יכול להיות לקחת בחשבון מקרים טיפוסיים של ציפורים שלא עפות. ואז במקום להשוות בין פינגווין לציפור ממוצעת נזכור כי ישנן ציפורים שאינן עפות. המשמעות של היכולת הזו לקחת בחשבון מקרים אינדיבידואליים היא כי גישת האקזמפלרים אינה מוחקת מידע שעשוי להיות שימושי בהמשך. גישת האקזמפלרים יכולה להתמודד טוב יותר עם קטגוריות כמו משחקים. למרות שקשה מאוד לדמיין את הפרוטוטיפ לקטגוריה זו, גישת האקזמפלרים דורשת מאתנו לזכור דוגמאות מסוימות של משחקים כדי להכריע האם משהו שייך או לא לקטגוריה.
בהתבסס על מחקרים בנושא- חוקרים הסיקו כי אנשים משתמשים בשתי הגישות. הוצע כי בתחילה, כאשר אנו לומדי קטגוריה אנו יכולים למצע אקזמפלרים לפרוטוטיפ (אבטיפוס), ואז מאוחר יותר חלק מהמידע על האקזמפלרים מתחזק. אם כך, בשלבי הלמידה הראשונים לא נצליח טוב כל-כך לקחת בחשבון מקרים חריגים (כמו פינגווינים ויענים), אולם לאחר מכן אקזמפלרים למקרים הללו יתווספו לקטגוריה. מחקרים אחרים מצביעים על כך שגישת האקזמפלרים עובדת טוב ביותר עבור קטגוריות קטנות כמו נשיאים בארה”ב או הרים מעל לגובה של 15,000 מטרים, ואילו גישת הפרוטוטיפים עובדת טוב יותר עבור קטגוריות גדולות יותר כמו ציפורים או מכוניות.
האם, מבחינה פסיכולוגית ישנן רמות מועדפות של קטגוריות? Is There Psychologically “Privileged Level of Categories?
כפי שראינו קודם עבור גישת הפרוטוטיפים והאקזמפלרים השתמשנו בדוגמאות של קטגוריות כמו “רהיטים” המכילות חברים כמו כיסאות, שולחנות, ספות וכו’. אולפ כפי שניתן לראות בתרשים, הקטגוריה “כיסאות” יכולה להכיל קטגוריות קטנות יותר כמו “כיסאות מטבח”, “חדר אוכל” ועוד. סוג זה של ארגון, שבו קטגוריה כללית וגדולה יותר מחולקת לקטגוריות קטנות וספציפיות יותר, ויוצרות מספר רמות של חלוקה לקטגוריות מכונה ארגון היררכי. אחת השאלות היא האם ישנה רמה מסוימת שהיא בסיסית יותר או מועדפת יותר מהרמות האחרות.
הגישה של
Rosch:
מה מיוחד בקטגוריות בסיסיות?
המחקר של Rosch החל בהבחנה בכך שישנן רמות שונות של קטגוריות, הנעות על טווח מכלליות (כמו "רהיטים") וספציפיות ("שולחנות מטבח")- כפי שניתן לראות בתרשים הקודם, וכאשר אנשים עושים שימוש בקטגוריות הם נוטים להתמקד באחת מהרמות הללו. היא ערכה הבחנה בין שלוש רמות של קטגוריות: רמה בכירה (superordinate level), שאותה נכנה הרמה הגלובאלית (global level) (כמו לדוגמא "רהיטים"). הרמה הבסיסית (basic level) (לדוגמא "שולחנות"), ואת הרמה הנחותה (subordinate level), שאותה נכנה הרמה הספציפית (specific level) (לדוגמא "שולחנות מטבח"). הדוגמאות הבאות מראות כמה מהמאפיינים של הרמות הנ"ל.
רישום של תכונות משותפות
בניסוי שנערך ע”י
Rosch, mervis and cow’ (1976)
הוצגה בפני הנבדקים רשימה של קטגוריות (רהיטים, שולחנות, שולחנות מטבח)- וצריך למנות כמה שיותר תכונות המשותפת לכל או לרב הקטגוריות הללו. הנבדקים ציינו רק מספר קטן של מאפיינם המשותפים לכל הרהיטים ומספר גדול של מאפיינים המשותפים של שולחנות ושולחנות מטבח. הנבדקים ציינו בממוצע רק 3 מאפיינים עבור הרמה הגלובאלית (“רהיטים”), 9 עבור הרמה הבסיסית (“שולחנות”) ו-10.3 עבור הרמה הספציפית (“שולחנות מטבח”).
Rosch
הסיק כי מכיוון שמספר רב יותר של מאפיינים מספק יותר מידע אודות קטגוריה, העלייה מהרמה הבסיסית לכיוון הרמה הגלובאלית גורמת לאובדן של מידע רב. אולם המעבר מהרמה הבסיסית לרמה הספציפית מוסיפה לנו רק מעט מאוד מידע (ההבדל בין 9 ל-10.3). הוא הציע כי הרמה הבסיסית היא מיוחדת מבחינה פסיכולוגית כיוון שהעלייה ממנה גורמת לאובדן רב של מידע והירידה ממנה מובילה לתוספת קטנה מאוד של מידע.
שיום של דברים (naming things)
בניסוי נוסף שערכו החוקרים ב-1976- הוצגה בפני הנבדקים תמונה (תמונה)- והיה עליהם לרשום או לומר מהר ככל האפשר מילה המאפיינת כל תמונה. הם גילו שאנשים נוטים לבחור שם מהרמה הבסיסית: הם אמרו “גיטרה” (בהשוואה ל”כלי נגינה” או “גיטרה חשמלית”), “דג” (בהשוואה ל”בע”ח” או
“trout”-
פורל) ו”מכנסיים” (בהשוואה ל”בגד” או “ג’ינס”). בניסוי נוסף שערכו
Rosch, Simpson and Miller (1976)
הם הראו לנבדקים שם של קטגוריה (“מכונית” או “כלי רכב”), ולאחר השהייה קצרה הראו להם תמונה. המטלה של הנבדקים הייתה לומר מהר ככל האפשר האם התמונה נכללת בתוך הקטגוריה שהוצגה להם. התוצאות מראות כי הם ביצעו את המשימה טוב יותר עבור קטגוריות מהרמה הבסיסית (מכונית) בהשוואה לרמה הגלובאלית (כלי רכב). כלומר הם הגיבו “כן” מהר יותר כאשר היו צריכים לשייך תמונה של מכונית לקטגוריה “מכונית” בהשוואה לקטגוריה “כלי רכב”.
כיצד ידע יכול להשפיע על קטגוריזציה
הניסוי של
Rosch
שנערך על סטודנטים בקולג’ הראה כי יש רמה של קטגוריות, אותה היא כינתה “רמה בסיסית” המשקפת את החוויות היומיומיות של סטודנטים. הדבר הודגם בנוסף ע”י חוקרים רבים. בניסוי שנערך ע”י
J.D. Coley and cow’ (1997)
התבקשו סטודנטים, באופן הכי ספציפי שניתן, 44 שמות של צמחים שונים. 75% מהתגובות השתמשו בתיוגים כמו “עץ” בניגוד לשמות ספציפיים יותר כמו “עץ אלון”. בניסוי נוסף שנערך ע”י
James Tanaka and Marjorie Taylor (1991)
נבדק משהו דומה- עם ציפורים. הם ביקשו ממומחים לציפורים ומכאלה שאינם מומחים לשיים תמונות של חפצים. היו תמונות מקטגוריות רבות, אך מה שעניין את החוקרים היו תמונות של ארבע ציפורים. התוצאות המוצגות בגרף מראות כי המומחים הגיבו לתמונות הציפורים ע”י מתן שם לזן הספציפי של הציפור ואילו הנבדקים הלא מומחים הגיבו לארבעת התמונות ב”ציפור”. כנראה המומחים למדו לשים לב למאפיינים של הציפורים שהלא מומחים לא היו ערים להם כלל. אם כן, כדי להבין לחלוטין כיצד אנשים מקטלגים אובייקטים יש להבין לא רק את המאפיינים של האובייקט אלא גם את החוויות והניסיון של האנשים בתפיסת החפצים הללו.
אם כן- הרמה ה”מיוחדת”- זו שאנשים נוטים להתמקד בה- אינה זהה עבור כולם. באופן כללי אנשים עם יותר ממוחיות ומכירים יותר קטגוריה מסוימת נוטים להתמקד ברמה ספציפית יותר של מידע לגבי האובייקטים בקטגוריה.
ייצוג היחסים בין קטגוריות: רשתות סמנטיות Representing Relationships Between Categories: Semantic Networks
בחלק הזה נתמקד באופן בו קטגוריות או מושגים מאורגנים במוח. הגישה נקראת גישת הרשתות הסמנטיות
(semantic network approach)
והיא מציעה כי מושגים מאורגנים ברשתות.
מבוא לרשתות סמנטיות: המודל ההיררכי של Collins and Quillian
אחד מהמודלים הראשונים של רשתות סמנטיות התבסס על עבודתו החלוצית של
Ross Quillian (1967,1969),
שמטרתו הייתה לפתח מודל ממוחשב לזיכרון האנושי. המודל של
Allan Collins and Quillian (1969)
מתואר בתמונה. הרשת מורכבת מצמתים המחוברים זה לזה באמצעות קישורים. כל צומת מייצג מושג או קטגוריה, והמושגים ממוקמים ברשת כך שכל מושגים קשורים מקושרים זה לזה. בנוסף המאפיינים המקושרים לכל מושג מצוינים בצומת. הקישורים המחברים את הצמתים משמעותם כי הם מקושרים זה לזה במוחנו. וכך- אם נסתכל במודל נראה כי ישנו קשר במוחנו בין המושג “כנר” למושג “ציפור”. זהו מודל היררכי כיוון שהוא מכיל שכבות שמאורגנות כך שמושגים ספציפיים יותר ממוקמים בתחתית (כמו “כנר”), ומושגים כלליים יותר נמצאים בשכבות העליונות יותר. נדגים כיצד הרשת עובדת וכיצד היא מציגה את האופן בו המידע מאורגן אצלנו במוח ע”י הדגמת האופן בו נשלוף את המידע או המאפיינים של הכנר מתוך הרשת הזו. נתחיל עם כניסה לתוך הרשת המושג “כנר”. בצומת זה אנו יודעים כי הכנר צהוב ויכול לשיר. כדי לקבל מידע נוסף נמשיל במעלה הרשת ונגלה כי הכנר הוא ציפור, כלומר הוא יכול לעוף והוא בעל נוצות וכנפיים. אם נמשיך עוד מעלה נגלה כי מדובר גם בבעל חיים- כלומר לכנר יש עור והוא יכול לנוע. אם נמשיך עוד במעלה הרשת נגלה כי הוא מקבוצת הדברים החיים- כלומר הוא חי ויכול לגדול. ניתן לשאול מדוע עלינו לנוע מ”כנר” ל”ציפור” והלאה כדי לגלות שהיא יכולה לעוף, כי אחרי הכל ניתן היה למקם את המידע הזה בצומת בו יש את מושג ה”כנר”- וכך היינו יודעים זאת מיד. אולם
Collins and Quillian
חשבו כי התוספת של “יכולה לעוף” בצומת של כל ציפור וציפר אינה יעילה והייתה תופסת יותר מדי מרחב אחסון. לכן במקום לשייך תכונות כמו יכולת לעוף, בעל נוצות ועוד עבור כל ציפור, הם מיכמו בצומת של המושג “ציפור” את כל התכונות הללו כיוון שאלו תכונות המשותפות לרוב הציפורים. דרך זו של אחסון תכונות משותפות פעם אחת בלבד, בשלב הגבוה ביותר מכונה חיסכון קוגניטיבי
(cognitive economy).
למרות שהחיסכון הקוגניטיבי הופך את המערכת ליעילה יותר הוא גם יוצא בעיה- כיוון שלא כל הציפורים מסוגלות לעוף. כדי להתמודד עם בעיה זו הוסיפו החוקרים יוצאים מן הכלל בצמתים הנמוכים יותר. לדוג’- כדי להתמודד עם העובדה שיענים אינן עפות- התכונה “לא מסוגל לעוף” מתווספת בצומת בו מצוי המושג “יען”.
כיצד האלמנטים של הרשת הסמנטית מתייחסים לפעילות המוח עצמה? הצמתים והקישורים שתוארו אינם מתייחסים למבנים ספציפיים או אזורים מסוימים במוח ואינם בהכרח מתארים תאי עצב במוח. מודל זה ומודלים נוספים של רשתות שיתוארו בהמשך מתארים כיצד קונספטים ותכונותיהם מקושרים במוחנו. ממצאים פיזיולוגיים הרלוונטיים למודלים אלו, כמו נוירונים שמגיבים ביוחד לקטגוריות ספציפיות, לא היו ידועים והתגלו שנים רבות לאחר שהוצעו המודלים הללו. לאחר שהנחנו בצד קשר אפשרי בין המודל ובים פיזיולוגיה ממשית- נוכל לשאול מהי מידת הדיוק בה המודל מייצג את האופן בו מושגים מאורגנים במוחנו. היופי בדבר הוא שהרשת מאורגנת בצורה היררכית- מושגים כללים נמצאים למעלה וספציפיים למטה. המשמעות של הדבר היא כי הרשת מאפשרת ניבוי הניתן לבחינה- הזמן שייקח לאדם לאחזר מידע על קונספט מסוים ייקבע ע”פ המרחק אותו יצטרך לעבור ברשת הסמנטית.
אם כן, לפי המודל, כאשר משתמשים ב”טכניקת זיהוי המשפט”- בה נבדקים מתבקשים לענות “כן” או “לא” בנוגע להנחות אודות מושגים, ייקח זמן רב יותר לנבדקים להשיב “כן” למשפט: “כנר היא חיה” לעומת “כנר היא ציפור”.
Collins and Quillian (1969)
בחנו את ההשערה הזו ומדדו ז”ת של נבדקים. ואכן, כצפוי, זמן התגובה היה איטי יותר עבור משפטים שדרשו נדידה ארוכה יותר ברחבי הרשת הסמנטית. תכונה נוספת של התיאוריה, שהובילה לניבויים נוספים הינה של “התפשטות העירור”
(Spreading activation).
התפשטות עירור היא עירור שמתפשט לאורך כל קישור המחובר לצומת מעוררת. בזמן שאנו עולים ברשת מהצומת “כנר” לעבר “ציפור”, והקשר ביניהם מעורר, עירור זה מתפשט לצמתים אחרים ברשת, כגון בע”ח וסוגים נוספים של ציפורים. התוצאה של התפשטות העירור היא שמושגים נוספים שמקבלים עירור זה הופכים
למעוררים
(primed),
וניתן לשלוף אותם יותר בקלות מהזיכרון.
הרעיון הזה נבחן במחקר שנערך ע”י
David Meyer and Roger Schvaneveldt (1971).
הם השתמשו במטלת החלטה מילונית. הם הציגו לנבדקים 2 שרשראות של אותיות, אחת מעל השנייה. הנבדקים התבקשו ללחוץ על כפתור “כן” כאשר שתי השרשראות היו מילים, או “לא” כאשר אחת או שתי השרשראות לא היו מילה (תמונה). המשתנה המעניין בניסוי זה היה הקשר האסוציאטיבי בין זוגות המילים האמתיות. בחלק מהמקרים זוגות המילים היו קשורות מאוד כדוגמת: “לחם, חיטה”. ובאחרים הקשר היה חלש כגון: “כסף, כיסא”. התוצאה הייתה שזמן התגובה היה מהיר יותר כאשר שתי המילים היו קשורות אסוציאטיבית. החוקרים הציעו כי הדבר התרחש מפני שככל הנראה אחזור אחת מהמילים מהזזיכרון גרם להתפשטות של עירור למושגים סמוכים ברשת. העירור הנוסף הזה התפשט למילים הקשורות אסוציאטיבית זו לזו, כך שהתגובה אליהן תהיה מהירה יותר מהתגובה למילים שאינן קשורות זו לזו.
ביקורת על המודל של Collins and Quillian
למרות שהמודל זכה לתמיכה אמפירית רבה, הביקורות לא איחרו לבוא. המבקרים הצביעו על כך המודל לא יכול להסביר את “אפקט הטיפוסיות” (זמן התגובה מהיר יותר עבור אובייקטים טיפוסיים יותר בקטגוריה לעומת אובייקטים פחות טיפוסיים). כלומר ההיגד “כנר היא ציפור” יש ז”ת מהיר יותר בהשוואה להיגד “יען היא ציפור”- למרות שלפי המודל הניבוי יהיה שעבור שני המשפטים ז”ת יהיה זהה כיוון ששני המושגים, כנר ויען, נמצאים במרחק שווה מ”ציפור”. חוקרים מפקפקים גם ברעיון החיסכון הקוגניטיבי כיוון שישנם עדויות שאנשים כן מאחסנים תכונות ספציפיות במושגים עצמם.
Lance Rips and cow’ (1973)
השתמשו בטכניקת אימות המשפט וראו שנבדקים הגיבו מהר יותר להיגד “חזיר הוא בע”ח” לעומת “חזיר הוא יונק”, למרות שלפי המודל היה זה אמור להיות הפוך. הביקורות הללו הובילו לפיתוח של מודל חדש, שיעמוד בציפיות שהמודל הקודם לא עומד בהן.
המודל של Collins and Loftus: חוויות אישיות משפיעות על הרשת
Collins and Loftus (1975)
הציעו מודל כפי שמופיע בתמונה. מושגים הקשורים טוב יותר זה לזה נמצאים קרובים יותר זה לזה. הקישורים הקצרים הללו מנבאים תגובה מהירה יותר עבור מושגים טיפוסיים יותר (כמו מכונית ומשאית לעומת אמבולנס). המודל הנוכחי זונח את הגישה ההיררכית שהייתה במודל הקודם לטובת מבנה המבוסס על החוויות של האדם. המשמעות היא שהמרווחים בין מושגים שונים יכולים להשתנות כתלות בניסיון ובידע שיש לאדם בנוגע לאותם מושגים. החוקרים הוסיפו מספר שינויים כדי להתמודד עם בעיית כמו החיסכון הקוגניטיבי ובעיית החזיר/ יונק שהוצגה קודם לכן (אין פירוט בספר…). מה שחשוב בהתאמות שהם ערכו זה שכעת המודל הצליח להסביר כל תוצאה של ניסוי קטגוריזציה. החוקרים מתארים את המודל שלהם כ”תאוריה יחסית מסובכת, כללית מספיק ליישום על כל תוצאה שמתקבלת מכל פרדיגמה ניסויית”. למרות שהיכולת להסביר כל תוצאה היא יתרון, תכונה זו הייתה מושא עיקרי לביקורת.
הערכה של תיאוריות רשת סמנטית
מדוע לבקר מודל אשר מסביר כמעט כל תוצאה שמתקבלת? ניתן לענות על כך בעזרת בחינת הקריטריונים הבאים אשר מתארים תאוריות פסיכולוגיות טובות:
- יכולת הסברה: התאוריה יכולה להסביר מדוע התקבלה תוצאה מסוימת.
- יכולת ניבוי: התאוריה יכולה לנבא תוצאות של ניסוי מסוים.
- יכולת להיות מופרך: התאוריה, או חלק ממנה בעלי פוטנציאל להיות מופרכים. כלומר, ניתן לתכנן ניסוי שיניב תוצאות שנובאו ע”י התאוריה, ובאותה מידה יניב תוצאות שלא נובאו ע”י התאוריה.
- יצירה של ניסויים: תאוריות טובות מובילות לפרץ מחקרים וניסויים על מנת לבחון את התאוריה, על מנת לשפר את התאוריה, להשתמש בשיטות שהוצעו בתאוריה או לשם חקר שאלות חדשות שהועלו ע” התאוריה.
כאשר אנו בוחנים את התאוריה המקורית של
Collina and Quillian
כנגד הקריטריונים הללו, אנו מגלים כי היא אינה יכולה להסביר או לנבא חלק מהתוצאות של ניסויים, כפי שכבר נכתב מעלה. כישלונות אלו לנבא ולהסביר הם שהובילו את
Collins and Loftus
להגות את התאוריה שלהם. אבל גם התאוריה שלהם ספגה ביקורת על היותה כה גמישה שקשה להפריכה. אורך הקשרים בין קונספטים/קטגוריות תלוי בניסיון ובידע של אדם, כלומר אין חוקים קבועים לקבוע את אורכם של הקשרים, או במקרה זה, אין דרך לקבוע כמה זמן עוררות נשארת לאחר שהתפשטה, או כמה עירור דרוש כדי להפעיל מושג (צומת).
אם מודל מסוגל להסביר כמעט כל תוצאה ע”י התאמת תכונות שונות של המודל- מה המודל מסביר בעצם?
שאלה זו הובילה את
P.N. Johnson-Laird and cow’ (1984)
לבקר את תיאוריות הרשתות הסמנטיות ולטעון כי הן פשוט לא ניתנות להפרכה (קריטריון חשוב עבור תיאוריה מדעית).
ייצוג מושגים ברשתות: הגישה הקישורית Representation Concepts in Networks: The Connectionist Approach
הביקורת על התיאוריות הקודמות בשילוב עם התקדמות בהבנה של האופן בו מידע מיוצג אצלנו במוח הובילו להופעתה של גישה חדשה, שהוצעה ע”י
James McClelland and David Rumelhurt,
ומכונה הגישה הקישורית. הגישה התקבלה ע”י חוקרים רבים כיוון שהייתה מבוססת על האופן בו המידע מיוצג במוח ויכולה הייתה להסביר מספר ממצאים, כולל כיצד מושגים נלמדים וכיצד נזק למוח משפיע על הידע של האנשים לגבי מושגים
מהו המודל הקישורי?
מודל זה הוא גישה למודל ממוחשב לייצוג מושגים ותכונותיהם לפי מאפיינים של המוח. המודל הזה מכונה גם עיבוד מבוזר-מקבילי
(PDP- Parallel Distributed Processing)
כיוון שהוא מניח כי מושגים מיוצגים ע”י פעילות המפוזרת ברחבי הרשת. בגלל שהעיבוד ברשתות אלו, בדומה למע’ העצבים, מתרחש באופן מקבילי, בו זמנית, ובגלל שהייצוג של קונספטים ברשתות אלו מופץ על יחידות רבות, הגישה הקישורית נקראת גם כך. בתמונה ניתן לראות דוגמא לכך: העיגולים הם יחידות. היחידות הללו מושפעות מהנוירונים במוח. הקווים הם הקישורים המעבירים מידע בין היחידות בדומה לאקסונים של נוירונים. בדומה לנוירונים, חלק מהיחידות יכולות להיות מתופעלות ע”י גירוי מהסביבה, וחלקם יכולים להיות מעוררים או מעוכבים ע”י יחידות אחרות. יחידות מקושרות אחת לשנייה ע”י מסלולים שדומים למסלולי נוירונים פשוטים. ישנם שלושה סוגי יחידות: יחידות קלט
(input units)
המופעלות ע”י גירויים מהסביבה, יחידות נסתרות
(hidden units)
המקבלות אותות מיחידות הקלט, ויחידות פלט
(output units)
המקבלות אותות מהיחידות הנסתרות. מאפיין נוסף של הרשת הקישורית הן משקלות קישור
(connection weight).
המשקלות הללו מכריעות כיצד אות הנשלח מיחידה אחת יגביר או יפחית את הפעילות של היחידה הבאה (דומה למה שקורה בסינפסות בין נוירונים). אם כן אקטיבציה של יחידות ברשת תלויה בשני דברים: 1) אות שמקורו ביחידת הקלט, ו-2) משקלות הקישור לאורך הרשת. ידע מיוצג ברשתות הקישוריות כעירור שמתפשט מיחידות רבות. הידע של אדם על כנרית לדוג’, מיוצג במוחו ע”י דפוס העירור ביחידות רבות. שימו לב שזה שונה מהמצב ברשתות סמנטיות, שם ידע על כנרית מיוצג ע”י עירור ביחידות בודדות.
כיצד מושגים מיוצגים ברשת של קישורים?
המודל המוצג בתמונה הוצע ע”י James
McClelland and Timothy Rogers (2003)
כדי לענות על השאלה הזו. למרות שהתמונה נראית מורכבת המודל הזה דומה לזה שהוצג- מורכב מיחידות, קשרים ומשקלות (יש בעמוד 257 תיאור ארוך ונראה לי מיותר..)
כדי שהמודל יעבוד המשקלות צריכות לפעול כך שכאשר יחידת המושג “כנר” ויחידת היחס “יכול” מופעלות רק “לגדול”, “לזוז”, “לעוף” ו”לשיר” יופעלו. ההסתגלות הזו של המשקלות מושגת ע”י תהליך למידה. לפני הלמידה המשקלות אינן מדויקות והפעלת המושג “כנר” תגרום לפעילות אקראית ביחידות התכונות. לפי המודל הטעויות הללו מתועדות ונשלחות חזרה לאורך הרשת, באמצעות תהליך המכונה חלחול לאחור
(back propagation),
תהליך בו אות שגיאה
(error signal)
נשלח חזרה ליחידות הנסתרות כדי לספק להן מידע לגבי שינוי המשקלות כך שיתאימו את האקטיבציה לתכונה הנכונה. אם כן תהליך הלמידה של המודל מכיל אקטיבציה חלשה ולא מובחנת של יחידות- ולכן גם הרבה טעויות. אותות על הטעויות הללו נשלחים אחורה והאותות הללו גורמים לכך שיהיה שינוי במשקלות הקישור. השינוי קטן לאחר כל הליך של למידה, אולם הדפוס החדש של המערכת קרוב יותר ויותר בכל פעם לדפוס הנכון- התהליך חוזר על עצמו והמערכת מתקנת את עצמה בכל שלב עד שהיא מגיעה לפלט הנכון. מכיוון שהרשת צריכה להגיב למושגים רבים ושונים, תהליך הלמידה של הרשת צריך להיות כזה שעבור השגת תגובה יותר למושג אחד לא תיווצר תגובה פחות טובה למושג אחר. הדבר מושג ע”י למידה איטית מאוד, שלב אחר שלב, כך ששינוי המשקלות עבור מושג אחד ייגרמו להפרעה קטנה ככל הניתן למשקלות של מושגים אחרים שנלמדים באותו הזמן. בסופו של דבר לאחר אלפי צעדים המשקלות ברשת הופכים למדויקים כך שהמערכת מניבה את האקטיבציה הנכונה בכל פעם עבור המון מושגים שונים.
בתמונה נראה כיצד 8 יחידות נסתרות ברשת קשרים מסובכת מגיבות בזמן תהליך למידה, בו מוצגים לרשת מספר מושגים שונים, אחד אחרי השני. כל קו מייצג את האקטיבציה בכל אחת משמונה היחידות הנסתרות בתגובה לקלטים שונים. בתחילת התהליך, הפעילות היא בערך אותו הדבר בכל יחידה, אך ככל שהלמידה מתקדמת, כשכל המושגים מוצגים אחד אחרי השני והמשקלות משתנות רק מעט לאחר כל ניסיון, הדפוסים הופכים להיות מתואמים, כך שבניסיון מספר 250 הדפוס של “סלמון” ושל “כנרית” מתחיל להיראות שונה, ובניסיון 2500 קל לראות את ההבדל בין הדפוסים של “סלמון” ושל “כנרית” או בין “כנרית” ל”חרצית”. כמו כן, לשני הפרחים, “ורד” ו”חרצית”, יש דפוסים דומים אך מעט שונים.
כיצד דפוס עירור ביחידה נסתרת או יחידת פלט הופך מקושר לגירוי ספציפי או קונספט? טכניקות שונות הועלו כדי להסביר זאת. נתמקד במכניקה הנקראת למידה מבוקרת
(Supervised Learning),
בה הרשת לומדת בתהליך שמקביל לאופן שבו ילד שלומד שפה, מצביע על אוטו ואומר: “טו”. בתגובה לכך, ההורה יספק את ההגייה הנכונה: “אוטו”. הילד לרוב ימשיך לטעות, ויתכן ויקרא גם למשאית- אוטו. אבל בסוף, בעזרת אימון והדרכה מתמשכת הילד לומד להגיד “אוטו” ולא לקרוא למשאיות – אוטו
יש שני דברים שחשוב לזכור לגבי גישת הקשרים: (1) היא מציעה תהליך למידה איטי שבסופו של דבר יוצר רשת המסוגלת להתמודד עם מגוון רחב של קלטים, (2) מידע לגבי כל קלט מוכל בדפוס עירור המפוזר לאורך מספר יחידות. לכן, בדיוק כפי שמערכת העצבים מייצגת פנים שונות ע”י דפוסים שונים של פעילות בנוירונים, רשת הקשרים מייצגת מושגים שונים באמצעות דפוסים שונים של פעילות ביחידות שלה. מאפיינים נוספים של רשתות קשרים:
נזק לא לגמרי מפריע למערכת: בגלל שהמידע ברשת מחולק לאורך יחידות רבות, נזק למערכת לא לגמרי מפריע לפעולתה. מאפיין זה, בו הפרעה לתפקוד מתרחשת רק בהדרגה כשחלקים מהמערכת ניזוקים, נקרא הפחתה חיננית
(graceful degradation)
והוא דומה למה שקורה לעיתים קרובות במקרים אמתיים של נזק מוחי.
הלמידה ניתנת להכללה: בגלל שלמושגים דומים יש דפוסים דומים, אימון המערכת לזהות את המאפיינים של מושג אחד (למשל, “מכונית”) מספק גם מידע לגבי מושגים אחרים הקשורים אליו (כמו “משאית” ו”כלי רכב”). זה דומה לאופן בו אנו למעשה לומדים על מושגים בגלל שלמידה על מכוניות מאפשרת לנו לחזות מאפיינים של סוגי מכוניות שונים שלא נתקלנו בהם. יכולת זו להכליל היא הבסיס להתנהגות אינטליגנטית והטבע הקונסטרוקטיבי של זיכרון.
פותחו מודלים מצליחים של מחשב: מודלים של מחשב המבוססים על רשתות קשרים נוצרו ומגיבים לכך שהם ניזוקים בדרכים הדומות לתגובה המתרחשת במקרים אמתיים של נזק מוחי בבני אדם. חוקרים מסוימים הציעו שלמידת האופן בו רשתות מגיבות לנזק יכולה להציע אסטרטגיות לשיקום של בני אדם חולים. בנוסף, רשתות קשרים פותחו ומדמות תפקוד קוגניטיבי נורמאלי בעבור תהליכים כמו עיבוד שפה, זיכרון והתפתחות קוגניטיבית.
על אף העובדה שהרשתות הקישוריות בעלות תכונות שמאפשרות להן לשחזר אספקטים רבים של היווצרות קונספטים, הדעות בנוגע לרשת זו הן חלוקות. ישנם חוקרים הסוברים שגישה זו מבטיחה מאוד ובמיוחד הם נמשכים אחר עבודה על מע’ שמחזיקה תכונות משותפות עם מע’ העצבים. חוקרים אחרים חושבים שישנם גבולות לדברים שהרשת הקישורית יכולה להסביר, הם חשים כי גם אם רשתות אלו מסבירות אספקטים אחדים לגבי האופן בו אנו מאחסנים ידע, הדרך הטובה ביותר להסביר כיצד ידע מיוצג במוח היא לשלב קישוריות עם חלק מהגישות האחרות לזיכרון סמנטי, אותן הסברנו בתחילת הפרק.
פעילות ספציפית או מפוזרת?
תשובה אחת אפשרית לשאלה כיצד אובייקטים מיוצגים היא כי קטגוריות שונות או אובייקטים שונים מיוצגים ע”י פעילות באזורים ספציפיים במוח. שתי דוגמאות לאזורים המופעלים עבור קטגוריות ספציפיות הם ה-
fusiform face area (FFA),
שמגיב בצורה חזקה לפנים, וה-
parahippocampal place area (PPA)
המגיב לבתים, חדרים ומקומות. ראיה התומכת בקשר בין ה-
FFA
לבין פנים הוא מצב המכונה פרוספואגנוזיה
(prospoagnosia)
חוסר יכולת לזהות פרצופים, שקיים אצל אנשים עם נזק באונה הטמפורלית.
אולם לומר שקבוצה של דברים מיוצגת ע”י פעילות באזור מסוים וקבוצה אחרת מיוצגת באזור אחר אינה מספקת. אנו יודעים כי הפעילות המוחית שלנו היא מפוזרת לרוב, כך שלמרות שגירוי מסוים גורם לרמת פעילות גבוהה באזור מסוים הוא גורם לפעילות גם באזורים נוספים במוח. אחת הסיבות לפיזור הזה היא כי לאובייקט יש הרבה תכונות שונות (צבע, צורה, טקסטורה..).
מידע על קטגוריה בנוירונים בודדים
הייצוג של קטגוריות במוח נלמד באמצעות רישום מנוירונים בודדים. במחקר של
David Freedman and cow’ (2001, 2003, 2008)
הוא אימן קופים לסווג גירויים כמו אלה המופיעים בתמונה- ערבוב של כלבים וחתולים. בתמונה הגירוי מצד שמאל הוא 100% חתול ומצד ימין 100% כלב, והאחרים הם ערבוב של השניים. הוא עשה שימוש בגירויים אלו ונוספים, ואימן את הקופים להגיב רק כאשר הם מעל 50% חתול כשייכים לקטגורית החתולים, ולגבי כל השאר להגיב כ”כלבים”. לאחר כמה חודשי אימון הקופים הצליחו לסווג גירוי של 60% חתול ו-40% כלב כ”חתול ב90% מהזמן. אותו הדבר עבור כלבים. ברגע שהקופים למדו לזהות את הקטגוריה הם נבחנו באמצעות שימוש בפרוצדורה המוצגת בתמונה התחתונה. ראשית הוצג בפנים גירוי דוגמא (כלב או חתול). ואז לאחר השהיה של שנייה גירוי המבחן הוצג. המטלה של הקופים הייתה ללחוץ על דוושה אם גירוי המבחן וגירוי הדוגמא הם מאותה הקטגוריה. בזמן שהקופים הזו זאת נרשמה פעילות נוירונים שלהם מאזור באונה הטמפורלית המכונה
inferotemporal (IT) cortex,
המגיב לצורות, ומנוירונים בקורטקס הפרה-פרונטלי המעורבים בזיכרון ובתהליכים קוגניטיביים נוספים. התוצאות מוצגות בגרפים. בתמונה
b
נראית התגובה של הנוירונים ב-
inferotemporal (IT) cortex,
עבור 60% כלב ועבור 60% חתול. במהלך ההצגה של הדוגמא, כאשר הקוף רק מביט בגירוי, הנוירונים הללו יורים יותר למראה הגירוי של הכלב. במהלך ההשהיה ושלב המבחן, בזמן שהקוף שומר את המידע אודות הגירוי ומקבל החלטה, הנוירונים הללו מגיבים באותו אופן בדיוק עבור כלב ועבור חתול. התוצאות עבור הנוירונים בקורטקס הפרה פרונטלי מוצגות בתמונה
c.
במהלך הצגת גירוי הדוגמא הנוירונים הללו הגיבו מעט טוב יותר לגירוי הכלב, למרות שההבדל קטן ולא מובהק. אולם במהלך ההשהיה הנוירונים הללו יורים הרבה יותר מהר לגירוי של כלב (מתאים לכך שהם שומרים בזיכרון העבודה את התכונות של הכלב). בשלב במבחן, כאשר הקוף מבצע החלטה- ההבדלים הופכים גדולים יותר. הניסוי הזה מראה כי אזורים שונים של הקורטקס מגיבים לאספקטים שונים של גירויים. ה-
inferotemporal (IT) cortex
שמבחין בין כלבים וחתולים במהלך הצגת הגירוי נראה כי מגיב לתוכנות כמו צורת הגירוי. הקורטקס הפרה פרונטאלי, שמבחין בין כלבים וחתולים במהלך ההשהיה ככל הנראה אחראי על תכונות יותר אבסטרקטיות של הגירוי- כלבים בכללי או חתולים באופן כללי.