האם הבינה המלאכותית היא עדיין רק כלי משוכלל להשלמת מילים, או שהיא כבר מתקדמת לחשיבה אמיתית?
מודלים ממשפחת ה-o של Open AI, Gemini 2.0 Flash Thinking , , Claude 3 Opus ו-DeepSeek מציגים יכולות חדשות של חשיבה בשלבים.
(Chain of Thought)
מה ההבדל בין הבינה המלאכותית "הישנה" לבין מודלים החושבים?
איך ההתפחויות הללו ישפיעו על הלמידה ועל המחקר?
מה זה אומר על ההתקדמות של הבינה המלאכותית לכיוון בינה מלאכותית כללית (AGI) ואולי אפילו סופר בינה מלאכותית (ASI)?
פורסם בתאריך: 08.05.2025
דמיינו לרגע מורה ששואלת שאלות כמו "השלימו את הסדרה: 2 – 4 – 6…."
כל התלמידים עונים: 8.
הם לא צריכים לחשוב יותר מדי על התשובה, הם שולפים אותה במהירות מהזיכרון.
כך עובדים המודלים המוכרים לנו של בינה מלאכותית, המבוססים על מודל שפה גדול – LLM. מודלים אלו לא חושבים ממש, אלא שולפים תשובה מהירה שמקורה בזיהוי דפוסים ובתובנות שהתקבלו מתוך נתוני האימון שלנו.
התוצאות מהירות. אבל בשליפה, כמו בשליפה, התשובות לא תמיד נכונות!
המודלים החדשים פועלים קצת אחר.
המודלים החדשים מבוססים על גישה הנקראת "שרשרת חשיבה" .Chain of Thought –
במקום לנחש מה המילים הבאות, המודלים "החושבים" מפרקים את הבקשה או את הבעיה לשלבים ומשתמשים באסטרטגיות שונות וברעיונות שונים כדי לתת מענה לפרומפט. המודל מציע פתרונות שונים שעוברים תהליך של תגמול הערכה ורק לאחר מכן הפתרון המתאים ביותר מוצע למשתמש. חשוב לציין, שהמערכת מתגמלת גם פתרון נכון וגם את דרך הפתרון, וכך היא גם לומדת ומשתפרת ממשימה למשימה.
כל התהליך הזה איננו רק שיפור טכני – זוהי פריצת דרך בדרך ליצירת בינה מלאכותית חכמה יותר, ואולי אפילו הצעד הראשון אל עבר AGI – בינה מלאכותית כללית.
תכף נגיע לזה, אבל לפני כן, ראו דוגמאות של תשובות של מודלים "רגילים" של בינה מלאכותית המתבססים על LLM ושל מודל "חושב".
פרומפט:
האם למדינת ישראל היה נשיא ניצול שואה?
זוהי שאלה קצת מורכבת שדורשת ידע בתולדות נשיאי ישראל והבנה במושג "ניצול שואה".
לחצו על הכפתור וקראו את התשובה ממודל בינה מלאכותית מבוססת LLM "ישן" יחסית.
עכשיו נעבור למודל "חושב" חדש במיוחד – .DeepSeek R1
ייתכן ששמעתם על המודל הסיני הזה, שגרם להלם בשוק הטכנולוגיה (והבורסות העולמיות) כשהראה יכולות "חשיבה" מעולות במשאבי פיתוח נמוכים מאוד ביחס לאלו של המודלים האמריקניים.
התשובה של המודל הייתה ארוכה ומפורטת, הנה תרגום של חלק קצר מהמונולוג שה-DeepSeek "קיים" עם עצמו:
אין ספק שאפשרויות הדיאלוג הפנימי והתשובה המדויקת, מרשימות ביותר. המודלים החושבים אינם "שולפים" תשובות, אלא משתמשים באסטרגיות ובדרכי פתרון מורכבות. למעשה, המודלים המתקדמים הללו מחקים את הדרך שבה בני אדם פותרים בעיות – שלב אחרי שלב, עם ניתוח, ניסוי וטעייה וקבלת החלטות מבוססות תהליך.
וחשוב לזכור – שאת היכולות הללו הוא יכול להביא לידי ביטוי במענה לאתגרים מורכבים בהרבה מאשר שאלות על עברם של נשיאי ישראל.
ה-AGI עדיין לא כאן, אבל מומחים טוענים שהיא תהיה כאן בקרוב. עד כמה קרוב? תלוי את מי שואלים.
סם אלטמן, מנכ"ל Open AI המוכר לכולם מ-ChatGTP מעריך שה-AGI יגיע כנראה כברבשנת 2025. גם דריו אמודיי, מנכ"ל אנטרופיק, (ממפתחי מנוע Claude) צופה שזה יקרה עד 2026. ריי קורצוויל, עתידן מוביל, טוען שזה יקרה עד שנת 2029. פרופ' ג'פרי הינטון, שנחשב "אבי הבינה המלאכותית" מעריך שזה יקרה בטווח שבין חמש לעשרים שנה. יש גם חוקרים חשובים בתחום מגוגל ומטא שמאמינים שדרושים עוד עשורים כדי להגיע לפיתוח הזה. ואולי, זה לא יקרה לעולם. יש אפילו חוקרים שטוענים ש-AGI לא אפשרי, לפחות לא כמו שאנחנו מדמיינים זאת. לטענתם, בני אדם לא יצליחו לפתח מכונה עם אינטליגנציה אנושית אמיתית.
ואם אנחנו נמצאים בתחום הדמיון – בעתיד הרחוק של הבינה המלאכותית, אולי יגיע ה-ASI –
Artificial Super Intelligence. זה כבר ממש מדע בדיוני ולפי התרחיש הזה תהיה בינה מלאכותית שתתעלה על האינטליגנציה האנושית. אילו השפעות יהיו לכך על המדע, על הכלכלה ועל החברה? את זה אפשר רק לדמיין.