הבינה המלאכותית היוצרת היא כבר חלק מחיינו והשימוש בה הוא חלק ממיומנויות המאה ה־21 של הלומדים.
אחרי שהקדשנו פוסטים רבים למנועי טקסט, הגיע הזמן לצלול אל עולם חדש ומסעיר – יצירת תמונות באמצעות בינה מלאכותית.
הצטרפו אלינו למסע ולימדו כיצד נוצרת תמונה בבינה מלאכותית? כיצד אפשר ליצור תמונה איכותית בעצמנו וכיצד לשלב יצירת תמונות בלמידה?
פורסם בתאריך: 12.12.2024
דמיינו שאתם בתערוכת אומנות בגלריה מפורסמת בפריז ויצירה אחת מושכת את עיניכם: ציור שמציג כלי חרס ריאליסטיים המצוירים בדיוק מפליא. אבל הינה הטוויסט – זו לא יצירה של אומן אנושי אלא ציור פרי "מכחולו" של MidJourney v5, מחולל תמונות בינה מלאכותית.
תרחיש זה לא חייב להיות דמיוני. יצירות אמנות שנוצרו בכלי בינה מלאכותית כבר נמכרות בעשרות מיליוני דולרים, ומקבלות הכרה כענף של היצירה האנושית.
סוגייה זו מעוררת שאלות על היכולות המדהימות של יצירת תמונות באמצעות הבינה המלאכותית:
כיצד הבינה המלאכותית יוצרת תמונות?
כיצד אנחנו יכולים לשפר את התמונות שאנחנו יוצרים?
כיצד ניתן לרתום את הנושא של יצירת תמונות ללמידה?
אחת הדרכים הנפוצות היום ליצירת תמונות בבינה המלאכותית היא בשיטה הדיפוזית.
בשלב הראשון, בדומה לתהליכים אחרים בבינה מלאכותית מאמנים את המודל.
אימון המודל לקראת יצירת תמונות דורשת חשיפה של המודל למאות מיליוני תמונות.
לכל תמונה מצורף גם התיאור וההקשר המילולי שלה. באופן הזה, המודל יודע לקשר בין מילים לתמונות.
החיבור בין הטקסט לתמונה מספק מידע רב נוסף כמו – איך נראה תפוח מזן מסוים? אילו צבעים גורמים לרגש כלשהו? באיזה סגנון צייר או ואן גוך? וכדומה.
לאחר הליך האימון, מחולל התמונות מוכן ליצור תמונה חדשה.
בדומה לתהליכים אחרים בבינה מלאכותית יוצרת, התקשורת עם המנוע נעשית באמצעות הפרומפט*
באמצעות הפרומפט, מנוע יצירת התמונה משתמש בתמונות ובהקשרים שנלמדו במהלך האימון כדי לנבא אילו רכיבים צריכים להיכלל בתמונה החדשה ומה צריך להיות הקשר בין הרכיבים השונים שבתמונה. במהלך תהליך היצירה, מחולל התמונות מבצע איטרציה (חזרור) כדי לחדד ולשפר את התמונה עד ליצירת התמונה הרצויה.
(* לא בטוחים מהו פרומפט? מדובר בתיאור הטקסטואלי שמזינים למחולל התמונה כדי לקבל את התוצאה הרצויה. הפרומפט צריך להיות ברור, מפורט ומדויק ככל האפשר, כדי להנחות את המערכת וליצור תמונה שתואמת את הציפיות שלכם).
מתחילים ברעש
מתחילים ב"רעש" ויזואלי אקראי.
רעש הוא בעצם התפזרות כאוטית של פיקסלים בתמונה, מצב שבו אין סדר או מבנה הנראה לעין האנושית.
ממש ככה נראית תמונה לפני שמחולל התמונות מתחיל את עבודתו. כאוס מוחלט.
מצרפים פרומפט
בשלב השני מזינים פרומפט אנושי למחולל התמונות, למשל, "צור תמונה בסגנון של ון גוך של רובוט מנגן בגיטרה באנטרקטיקה " והמודל מתחיל לייצר תמונה מקורית.
ופה בדיוק נכנסת לתמונה הדיפוזיה – מתחיל תהליך של הסרת הרעש.
מנקים את הרעש
מודל הבינה "זוכר" תמונות ומושגים שמתייחסים למילים שבפרומפט ובהתאם לכך מתחיל "לנקות רעש" וליצור את
התמונה. מחולל התמונות יודע לסדר את הפיקסלים כך שייראו כמו הפרומפט שביקשנו.
משפרים תוצאה
ניקוי הרעש ממשיך והתוצאות משתפרות – לפעמים יש טעויות וצריך לנסות שוב.
יש לנו את זה!
מחולל התמונות ממשיך לנקות עד לקבלת לתוצאה הסופית המוצגת.
כדי להבין טוב יותר איך זה נראה בפועל, צפו בסרטון בחלק של האומן ג’סטין בייטמן, שמסדר צדפים וחלוקי נחל בחוף הים ויוצר מהם יצירות אומנות מרהיבות. בדיוק כפי שמחוללי התמונות מסדרים את הפיקסלים כדי ליצור תמונה, ג’סטין מסדר את האבנים והצדפים לכדי תמונה ברורה וקוהרנטית. זהו אותו עיקרון – סדר מתוך כאוס.
מחוללי תמונות מאפשרים לנו ליצור תמונות מרהיבות על בסיס תיאורים טקסטואליים. אך כדי לקבל תוצאות מרשימות ומדויקות, חשוב לדעת איך לכתוב פרומפט אפקטיבי.
על הפרומפט לכלול את הפרטים הבאים:
הכול עניין של סגנון
בקשו מהכלי את סגנון התמונה שאתם רוצים – ריאליסאטי, אנימציה, שחור לבן וכדומה
בצעו ניסויים
התנסו במגוון של פרומפטים עד לקבלת התוצר הרצוי.
בקישור זה תוכלו להשתמש בפרומפטים שהוכנו על ידי מומחים
התחילו מדוגמה
במנועים רבים אפשר להעלות תמונה או קישור כבסיס ולבקש מהמנוע לעצב על פי הדוגמה הזאת.
לדוגמה: תל־אביב בסגנון ואן גוך
שימו לב לבעיות האתיות – אתיקה, זכויות יוצרים, העתקת סגנון ועוד.
הבינה המלאכותית היוצרת היא כבר חלק מחיינו והשימוש בה הוא חלק ממיומנויות המאה
ה־21 של הלומדים. יצירת תמונות כחלק מתהליך הלמידה יכולה לסייע בפיתוח אוריינות הלומדים בשימוש בבינה מלאכותית יוצרת, תוך רתימת הבינה המלאכותית לסיוע בהכנת עבודות אישיות או קבוצתיות.
הינה כמה רעיונות לשילוב הבינה המלאכותית בלמידה:
כחלק מעיצוב מצגת בכל נושא
כתרגיל לפיתוח חשיבה יצירתית
במסגרת תרגיל הכנה לכתיבת סיפור
כאמצעי לפרשנות לטקסט לימודי
במסגרת תרגיל בין־אישי או קבוצתי־חברתי של תיאור רגשות ומחשבות
במשימות הערכה חלופית כמו משימות אותנטית
במסגרת פיתוח יכולות רגשיות־חברתיות (SEL)
זהו, אחרי שלמדנו כיצד תמונות נוצרות בבינה מלאכותית, כיצד לבקש מהכלים ליצור תמונות וכיצד אפשר לשלב אותן בתהליך הלמידה, נותר לנו להכיר את כלים שמחוללים תמונות. בטבלה שלפניכם כלים הכוללים הן מסלולים חינמיים הן מסלולים בתשלום. מומלץ להתנסות בכולם.
כלי | תיאור | הערות |
מיועד ליצירת תמונות ועריכה באיכות גבוהה. משולב ב-Adobe Creative Cloud | קיים מסלול חינמי | |
צ'טבוט המבוסס על GPT-4 שמספק גישה ל- DALL-E 3 יוצר תמונות באיכות גבוהה מהנחיות טקסטואליות | חינמי | |
מודל יצירת תמונות מבוסס AI שפותח על ידי OpenAI היוצר תמונות באיכות גבוהה מהנחיות טקסטואליות | זמין למנויים בתשלום של ChatGPT זמין בחינם בבינג צ'ט או עם Bing Image Generator | |
כלי מבוסס AI ליצירת תמונות אומנותיות, משנה תמונות לסגנונות אומנותיים | קיים מסלול חינמי | |
מחולל תמונות חינמי המאפשר ליצור תמונות מרהיבות מתיאורים טקסטואליים פשוטים | חינמי | |
מחולל תמונות שמבוסס על סטייבל דיפיוז’ן ויש לו תוצאות מדהימות וממשק נוח ומזמין | קיים מסלול חינמי של 150 קרדיטים |
ולפני שנסיים, נתייחס על קצה המזלג לנושא האתיקה וזכויות היוצרים. היכולות המרהיבות של המחולל נשענות על כמויות אדירות של מידע שממנו המחוללים לומדים. קיימים מאגרים מורשים המכילים תמונות וטקסטים למטרות אימון כאלו, אולם יש מקרים שבהם איסוף המידע לשלב האימון מתבצע על ידי סריקה כוללת של האינטרנט. חלק מהמפתחים הודו שאיסוף המידע לצורכי האימון של מחוללים מסוימים נעשה ללא הסכמת בעלי המידע. אומנים מצאו את עצמם במצב שבו מחולל שלמד מעבודות שלהם המפורסמות ברשת, מחקה בתוך שניות את הסגנון שהם פיתחו במהלך קריירה שלמה.
תביעות משפטיות מצד אומנים טוענות להפרת זכויות היוצרים ומעלות שאלות אתיות בנוגע לשימוש שעושה הבינה המלאכותית בפירות עמלם של אומנים.
נראה שהמישור המשפטי עדיין מדשדש, והגבולות בין השראה חוקית לבין שימוש לא הוגן עדיין מטושטשים.
היזהרו מחיקויים!