יצירת תמונות בסיוע בינה מלאכותית

הבינה המלאכותית היוצרת היא כבר חלק מחיינו והשימוש בה הוא חלק ממיומנויות המאה ה־21 של הלומדים.

אחרי שהקדשנו פוסטים רבים למנועי טקסט, הגיע הזמן לצלול אל עולם חדש ומסעיר – יצירת תמונות באמצעות בינה מלאכותית.

הצטרפו אלינו למסע ולימדו כיצד נוצרת תמונה בבינה מלאכותית? כיצד אפשר ליצור תמונה איכותית בעצמנו וכיצד לשלב יצירת תמונות בלמידה?

פורסם בתאריך: 12.12.2024

דמיינו שאתם בתערוכת אומנות בגלריה מפורסמת בפריז ויצירה אחת מושכת את עיניכם: ציור שמציג כלי חרס ריאליסטיים המצוירים בדיוק מפליא. אבל הינה הטוויסט – זו לא יצירה של אומן אנושי אלא ציור פרי "מכחולו" של MidJourney v5, מחולל תמונות בינה מלאכותית.

תרחיש זה לא חייב להיות דמיוני. יצירות אמנות שנוצרו בכלי בינה מלאכותית כבר נמכרות בעשרות מיליוני דולרים, ומקבלות הכרה כענף של היצירה האנושית.

סוגייה זו מעוררת שאלות על היכולות המדהימות של יצירת תמונות באמצעות הבינה המלאכותית:
כיצד הבינה המלאכותית יוצרת תמונות?
כיצד אנחנו יכולים לשפר את התמונות שאנחנו יוצרים?
כיצד ניתן לרתום את הנושא של יצירת תמונות ללמידה?

הפקת תמונות במודל דיפוזיה

אחת הדרכים הנפוצות היום ליצירת תמונות בבינה המלאכותית היא בשיטה הדיפוזית.

בשלב הראשון, בדומה לתהליכים אחרים בבינה מלאכותית מאמנים את המודל.

אימון המודל לקראת יצירת תמונות דורשת חשיפה של המודל למאות מיליוני תמונות.

לכל תמונה מצורף גם התיאור וההקשר המילולי שלה. באופן הזה, המודל יודע לקשר בין מילים לתמונות.

החיבור בין הטקסט לתמונה מספק מידע רב נוסף כמו – איך נראה תפוח מזן מסוים? אילו צבעים גורמים לרגש כלשהו? באיזה סגנון צייר או ואן גוך? וכדומה.

מוסיפים פרומפט

לאחר הליך האימון, מחולל התמונות מוכן ליצור תמונה חדשה.
בדומה לתהליכים אחרים בבינה מלאכותית יוצרת, התקשורת עם המנוע נעשית באמצעות הפרומפט*
באמצעות הפרומפט, מנוע יצירת התמונה משתמש בתמונות ובהקשרים שנלמדו במהלך האימון כדי לנבא אילו רכיבים צריכים להיכלל בתמונה החדשה ומה צריך להיות הקשר בין הרכיבים השונים שבתמונה. במהלך תהליך היצירה, מחולל התמונות מבצע איטרציה (חזרור) כדי לחדד ולשפר את התמונה עד ליצירת התמונה הרצויה.

(* לא בטוחים מהו פרומפט? מדובר בתיאור הטקסטואלי שמזינים למחולל התמונה כדי לקבל את התוצאה הרצויה. הפרומפט צריך להיות ברור, מפורט ומדויק ככל האפשר, כדי להנחות את המערכת וליצור תמונה שתואמת את הציפיות שלכם).

כיצד הבינה מלאכותית יוצרת את התמונה?

מתחילים ברעש

מתחילים ב"רעש" ויזואלי אקראי.

רעש הוא בעצם התפזרות כאוטית של פיקסלים בתמונה, מצב שבו אין סדר או מבנה הנראה לעין האנושית.

ממש ככה נראית תמונה לפני שמחולל התמונות מתחיל את עבודתו. כאוס מוחלט.

מצרפים פרומפט

בשלב השני מזינים פרומפט אנושי למחולל התמונות, למשל, "צור תמונה בסגנון של ון גוך של רובוט מנגן בגיטרה באנטרקטיקה " והמודל מתחיל לייצר תמונה מקורית.

ופה בדיוק נכנסת לתמונה הדיפוזיה – מתחיל תהליך של הסרת הרעש.

מנקים את הרעש

מודל הבינה "זוכר" תמונות ומושגים שמתייחסים למילים שבפרומפט ובהתאם לכך מתחיל "לנקות רעש" וליצור את

התמונה. מחולל התמונות יודע לסדר את הפיקסלים כך שייראו כמו הפרומפט שביקשנו.

משפרים תוצאה

ניקוי הרעש ממשיך והתוצאות משתפרות – לפעמים יש טעויות וצריך לנסות שוב.

יש לנו את זה!

מחולל התמונות ממשיך לנקות עד לקבלת לתוצאה הסופית המוצגת.

קרדיט:
AI can now create image out of thin air – See how it works. Washington Post

דוגמה מהעולם האמיתי

כדי להבין טוב יותר איך זה נראה בפועל, צפו בסרטון בחלק של האומן ג’סטין בייטמן, שמסדר צדפים וחלוקי נחל בחוף הים ויוצר מהם יצירות אומנות מרהיבות. בדיוק כפי שמחוללי התמונות מסדרים את הפיקסלים כדי ליצור תמונה, ג’סטין מסדר את האבנים והצדפים לכדי תמונה ברורה וקוהרנטית. זהו אותו עיקרון – סדר מתוך כאוס.

כיצד כותבים פרומפט לתמונה?

מחוללי תמונות מאפשרים לנו ליצור תמונות מרהיבות על בסיס תיאורים טקסטואליים. אך כדי לקבל תוצאות מרשימות ומדויקות, חשוב לדעת איך לכתוב פרומפט אפקטיבי.

על הפרומפט לכלול את הפרטים הבאים:

טיפים ליצירת תמונות באמצעות מחולל AI

הכול עניין של סגנון

בקשו מהכלי את סגנון התמונה שאתם רוצים – ריאליסאטי, אנימציה, שחור לבן וכדומה

בצעו ניסויים

התנסו במגוון של פרומפטים עד לקבלת התוצר הרצוי.

בקישור זה תוכלו להשתמש בפרומפטים שהוכנו על ידי מומחים

התחילו מדוגמה

במנועים רבים אפשר להעלות תמונה או קישור כבסיס ולבקש מהמנוע לעצב על פי הדוגמה הזאת.

לדוגמה: תל־אביב בסגנון ואן גוך

שימו לב לבעיות האתיות – אתיקה, זכויות יוצרים, העתקת סגנון ועוד.

כיצד ניתן לרתום את יצירת התמונות להליך הלמידה?

הבינה המלאכותית היוצרת היא כבר חלק מחיינו והשימוש בה הוא חלק ממיומנויות המאה
ה־21 של הלומדים. יצירת תמונות כחלק מתהליך הלמידה יכולה לסייע בפיתוח אוריינות הלומדים בשימוש בבינה מלאכותית יוצרת, תוך רתימת הבינה המלאכותית לסיוע בהכנת עבודות אישיות או קבוצתיות.

הינה כמה רעיונות לשילוב הבינה המלאכותית בלמידה:

כחלק מעיצוב מצגת בכל נושא

כתרגיל לפיתוח חשיבה יצירתית

במסגרת תרגיל הכנה לכתיבת סיפור

כאמצעי לפרשנות לטקסט לימודי

במסגרת תרגיל בין־אישי או קבוצתי־חברתי של תיאור רגשות ומחשבות

במשימות הערכה חלופית כמו משימות אותנטית

במסגרת פיתוח יכולות רגשיות־חברתיות (SEL)

לפני שמתחילים ליצור – חשוב לדעת!

קשה ליצור משהו ספציפי מדי או מדויק מדי.
הבינה המלאכותית יוצרת בכל פעם תמונה חדשה – היא לא יכולה ליצור שוב את אותה התמונה בדיוק. לכן יהיה זה מורכב ליצור סדרה של תמונות או דמויות שחוזרות על עצמן.
בחלק מהכלים יש מעצורים שמונעים מליצור אנשים מפורסמים או נושאים שנויים במחלוקת.

כלים…כלים…כלים!

זהו, אחרי שלמדנו כיצד תמונות נוצרות בבינה מלאכותית, כיצד לבקש מהכלים ליצור תמונות וכיצד אפשר לשלב אותן בתהליך הלמידה, נותר לנו להכיר את כלים שמחוללים תמונות. בטבלה שלפניכם כלים הכוללים הן מסלולים חינמיים הן מסלולים בתשלום. מומלץ להתנסות בכולם.

כלי	תיאור	הערות
Adobe Firefly	מיועד ליצירת תמונות ועריכה באיכות גבוהה. משולב ב-Adobe Creative Cloud	קיים מסלול חינמי
Microsoft Copilot	צ'טבוט המבוסס על GPT-4 שמספק גישה ל- DALL-E 3 יוצר תמונות באיכות גבוהה מהנחיות טקסטואליות	חינמי
DALLE-3	מודל יצירת תמונות מבוסס AI שפותח על ידי OpenAI היוצר תמונות באיכות גבוהה מהנחיות טקסטואליות	זמין למנויים בתשלום של ChatGPT זמין בחינם בבינג צ'ט או עם Bing Image Generator
Starry.ai	כלי מבוסס AI ליצירת תמונות אומנותיות, משנה תמונות לסגנונות אומנותיים	קיים מסלול חינמי
ideogram	מחולל תמונות חינמי המאפשר ליצור תמונות מרהיבות מתיאורים טקסטואליים פשוטים	חינמי
Leonardo AI	מחולל תמונות שמבוסס על סטייבל דיפיוז’ן ויש לו תוצאות מדהימות וממשק נוח ומזמין	קיים מסלול חינמי של 150 קרדיטים

אתיקה ותמונות

ולפני שנסיים, נתייחס על קצה המזלג לנושא האתיקה וזכויות היוצרים. היכולות המרהיבות של המחולל נשענות על כמויות אדירות של מידע שממנו המחוללים לומדים. קיימים מאגרים מורשים המכילים תמונות וטקסטים למטרות אימון כאלו, אולם יש מקרים שבהם איסוף המידע לשלב האימון מתבצע על ידי סריקה כוללת של האינטרנט. חלק מהמפתחים הודו שאיסוף המידע לצורכי האימון של מחוללים מסוימים נעשה ללא הסכמת בעלי המידע. אומנים מצאו את עצמם במצב שבו מחולל שלמד מעבודות שלהם המפורסמות ברשת, מחקה בתוך שניות את הסגנון שהם פיתחו במהלך קריירה שלמה.

תביעות משפטיות מצד אומנים טוענות להפרת זכויות היוצרים ומעלות שאלות אתיות בנוגע לשימוש שעושה הבינה המלאכותית בפירות עמלם של אומנים.

נראה שהמישור המשפטי עדיין מדשדש, והגבולות בין השראה חוקית לבין שימוש לא הוגן עדיין מטושטשים.

היזהרו מחיקויים!

למה אתם מחכים? התחילו ליצור

למידע נוסף בכל תחומי הטכנולוגיה

צרו איתנו קשר!

ciet@l-w.ac.il