לוגו חדשנות בקטנה
יצירת תמונות בסיוע בינה מלאכותית

יצירת תמונות בסיוע בינה מלאכותית

הבינה המלאכותית היוצרת היא כבר חלק מחיינו והשימוש בה הוא חלק ממיומנויות המאה ה־21 של הלומדים.

אחרי שהקדשנו פוסטים רבים למנועי טקסט, הגיע הזמן לצלול אל עולם חדש ומסעיר – יצירת תמונות באמצעות בינה מלאכותית.

הצטרפו אלינו למסע ולימדו כיצד נוצרת תמונה בבינה מלאכותית? כיצד אפשר ליצור תמונה איכותית בעצמנו וכיצד לשלב יצירת תמונות בלמידה?

פורסם בתאריך: 12.12.2024

דמיינו שאתם בתערוכת אומנות בגלריה מפורסמת בפריז ויצירה אחת מושכת את עיניכם: ציור שמציג  כלי חרס ריאליסטיים המצוירים בדיוק מפליא. אבל הינה הטוויסט – זו לא יצירה של אומן אנושי אלא ציור פרי "מכחולו" של MidJourney v5, מחולל תמונות בינה מלאכותית.

תרחיש  זה לא חייב להיות דמיוני. יצירות אמנות שנוצרו בכלי בינה מלאכותית כבר נמכרות בעשרות מיליוני דולרים, ומקבלות הכרה כענף של היצירה האנושית.

סוגייה זו מעוררת שאלות על היכולות המדהימות של יצירת תמונות באמצעות הבינה המלאכותית:
כיצד הבינה המלאכותית יוצרת תמונות?
כיצד אנחנו יכולים לשפר את התמונות שאנחנו יוצרים?
כיצד ניתן לרתום את הנושא של יצירת תמונות ללמידה? 

הפקת תמונות במודל דיפוזיה

אחת הדרכים הנפוצות היום ליצירת תמונות בבינה המלאכותית היא בשיטה הדיפוזית.

בשלב הראשון, בדומה לתהליכים אחרים בבינה מלאכותית מאמנים את המודל.

אימון המודל לקראת יצירת תמונות דורשת חשיפה של המודל למאות מיליוני תמונות.

לכל תמונה מצורף גם התיאור וההקשר המילולי שלה. באופן הזה, המודל יודע לקשר בין מילים לתמונות.

החיבור בין הטקסט לתמונה מספק מידע רב נוסף כמו – איך נראה תפוח מזן מסוים? אילו צבעים גורמים לרגש כלשהו? באיזה סגנון צייר או ואן גוך? וכדומה.

מוסיפים פרומפט

לאחר הליך האימון, מחולל התמונות מוכן ליצור תמונה חדשה.      
בדומה לתהליכים אחרים בבינה מלאכותית יוצרת, התקשורת עם המנוע נעשית באמצעות הפרומפט*
באמצעות הפרומפט, מנוע יצירת התמונה משתמש בתמונות ובהקשרים שנלמדו במהלך האימון כדי לנבא אילו רכיבים צריכים להיכלל בתמונה החדשה ומה צריך להיות הקשר בין הרכיבים השונים שבתמונה.  במהלך תהליך היצירה, מחולל התמונות מבצע איטרציה (חזרור) כדי לחדד ולשפר את התמונה עד ליצירת התמונה הרצויה.

(* לא בטוחים מהו פרומפט? מדובר בתיאור הטקסטואלי שמזינים למחולל התמונה כדי לקבל את התוצאה הרצויה. הפרומפט צריך להיות ברור, מפורט ומדויק ככל האפשר, כדי להנחות את המערכת וליצור תמונה שתואמת את הציפיות שלכם).

כיצד הבינה מלאכותית יוצרת את התמונה?

מתחילים ברעש

מתחילים ב"רעש" ויזואלי אקראי.

רעש הוא בעצם התפזרות כאוטית של פיקסלים בתמונה, מצב שבו אין סדר או מבנה הנראה לעין האנושית.

ממש ככה נראית תמונה לפני שמחולל התמונות מתחיל את עבודתו. כאוס מוחלט.

מתחילים ברעש

מצרפים פרומפט

בשלב השני מזינים פרומפט אנושי למחולל התמונות, למשל, "צור תמונה בסגנון של ון גוך של רובוט מנגן בגיטרה באנטרקטיקה " והמודל מתחיל לייצר תמונה מקורית.

ופה בדיוק נכנסת לתמונה הדיפוזיה – מתחיל תהליך של  הסרת הרעש.

מצרפים פרומפט

מנקים את הרעש

מודל הבינה "זוכר" תמונות ומושגים שמתייחסים למילים שבפרומפט ובהתאם לכך מתחיל "לנקות רעש" וליצור את

התמונה. מחולל התמונות יודע לסדר את הפיקסלים כך שייראו כמו הפרומפט שביקשנו.

מנקים את הרעש

משפרים תוצאה

ניקוי הרעש ממשיך והתוצאות משתפרות – לפעמים יש טעויות וצריך לנסות שוב.

משפרים תוצאה

יש לנו את זה!

מחולל התמונות ממשיך לנקות עד לקבלת לתוצאה הסופית המוצגת.

דוגמה מהעולם האמיתי

כדי להבין טוב יותר איך זה נראה בפועל, צפו בסרטון בחלק של האומן ג’סטין בייטמן, שמסדר צדפים וחלוקי נחל בחוף הים ויוצר מהם יצירות אומנות מרהיבות. בדיוק כפי שמחוללי התמונות מסדרים את הפיקסלים כדי ליצור תמונה, ג’סטין מסדר את האבנים והצדפים לכדי תמונה ברורה וקוהרנטית. זהו אותו עיקרון – סדר מתוך כאוס.

כיצד כותבים פרומפט לתמונה?

מחוללי תמונות מאפשרים לנו ליצור תמונות מרהיבות על בסיס תיאורים טקסטואליים. אך כדי לקבל תוצאות מרשימות ומדויקות, חשוב לדעת איך לכתוב פרומפט אפקטיבי.

על הפרומפט  לכלול  את הפרטים הבאים:

טיפים ליצירת תמונות באמצעות מחולל AI

הכול עניין של סגנון

בקשו מהכלי את סגנון התמונה שאתם רוצים – ריאליסאטי, אנימציה, שחור לבן וכדומה

הכול עניין של סגנון

בצעו ניסויים

התנסו במגוון של פרומפטים עד לקבלת התוצר הרצוי.

בקישור זה תוכלו להשתמש בפרומפטים שהוכנו על ידי מומחים

picture of the dog with an illusion of motion created by changing the focal length

התחילו מדוגמה

במנועים רבים אפשר להעלות תמונה או קישור כבסיס ולבקש מהמנוע לעצב על פי הדוגמה הזאת.

לדוגמה: תל־אביב בסגנון ואן גוך

שימו לב לבעיות האתיות – אתיקה, זכויות יוצרים, העתקת סגנון ועוד.

תמונת ואן גוך ותמונה בסיגנון ואן גוך

כיצד ניתן לרתום את יצירת התמונות להליך הלמידה?

הבינה המלאכותית היוצרת היא כבר חלק מחיינו והשימוש בה הוא חלק ממיומנויות המאה
ה־21 של הלומדים. יצירת תמונות כחלק מתהליך הלמידה יכולה לסייע בפיתוח אוריינות הלומדים בשימוש בבינה מלאכותית יוצרת, תוך רתימת הבינה המלאכותית לסיוע בהכנת עבודות אישיות או קבוצתיות.

הינה כמה רעיונות לשילוב הבינה המלאכותית בלמידה:

אייקון עלה

כחלק מעיצוב מצגת בכל נושא

אייקון עלה

כתרגיל לפיתוח חשיבה יצירתית

אייקון עלה

במסגרת תרגיל הכנה לכתיבת סיפור

אייקון עלה

כאמצעי לפרשנות לטקסט לימודי

אייקון עלה

במסגרת תרגיל בין־אישי או קבוצתי־חברתי של תיאור רגשות ומחשבות

אייקון עלה

במשימות הערכה חלופית כמו משימות אותנטית

אייקון עלה

במסגרת פיתוח יכולות רגשיות־חברתיות (SEL)

לפני שמתחילים ליצור – חשוב לדעת!

  • קשה ליצור משהו ספציפי מדי או מדויק מדי.
  • הבינה המלאכותית יוצרת בכל פעם תמונה חדשה – היא לא יכולה ליצור שוב את אותה התמונה בדיוק. לכן יהיה זה מורכב ליצור סדרה של תמונות או דמויות שחוזרות על עצמן.
  • בחלק מהכלים יש מעצורים שמונעים מליצור אנשים מפורסמים או נושאים שנויים במחלוקת.

כלים…כלים…כלים!

זהו, אחרי שלמדנו כיצד תמונות נוצרות בבינה מלאכותית, כיצד לבקש מהכלים ליצור תמונות וכיצד אפשר לשלב אותן בתהליך הלמידה, נותר לנו להכיר את כלים שמחוללים תמונות. בטבלה שלפניכם כלים הכוללים הן מסלולים חינמיים הן מסלולים בתשלום. מומלץ להתנסות בכולם.

כלי

תיאור

הערות

Adobe Firefly

מיועד ליצירת תמונות ועריכה באיכות גבוהה. משולב ב-Adobe Creative Cloud

קיים מסלול חינמי

Microsoft Copilot

צ'טבוט המבוסס על GPT-4 שמספק גישה ל- DALL-E 3 יוצר תמונות באיכות גבוהה מהנחיות טקסטואליות

חינמי

DALLE-3

מודל יצירת תמונות מבוסס AI שפותח על ידי OpenAI היוצר תמונות באיכות גבוהה מהנחיות טקסטואליות

זמין למנויים בתשלום של ChatGPT זמין בחינם בבינג צ'ט או עם Bing Image Generator

Starry.ai

כלי מבוסס AI ליצירת תמונות אומנותיות, משנה תמונות לסגנונות אומנותיים

קיים מסלול חינמי

ideogram

 מחולל תמונות חינמי המאפשר ליצור תמונות מרהיבות מתיאורים טקסטואליים פשוטים

חינמי

Leonardo AI

מחולל תמונות שמבוסס על סטייבל דיפיוז’ן ויש לו תוצאות מדהימות וממשק נוח ומזמין

קיים מסלול חינמי של 150 קרדיטים

אתיקה ותמונות

ולפני שנסיים, נתייחס על קצה המזלג לנושא האתיקה וזכויות היוצרים. היכולות המרהיבות של המחולל נשענות על כמויות אדירות של מידע שממנו המחוללים לומדים. קיימים מאגרים מורשים המכילים תמונות וטקסטים למטרות אימון כאלו, אולם יש מקרים שבהם איסוף המידע לשלב האימון מתבצע על ידי סריקה כוללת של האינטרנט. חלק מהמפתחים הודו שאיסוף המידע לצורכי האימון של מחוללים מסוימים נעשה ללא הסכמת בעלי המידע. אומנים מצאו את עצמם במצב שבו מחולל שלמד מעבודות שלהם המפורסמות ברשת, מחקה בתוך שניות את הסגנון שהם פיתחו במהלך קריירה שלמה.

תביעות משפטיות מצד אומנים טוענות להפרת זכויות היוצרים ומעלות שאלות אתיות בנוגע לשימוש שעושה הבינה המלאכותית בפירות עמלם של אומנים.

נראה שהמישור המשפטי עדיין מדשדש, והגבולות בין השראה חוקית לבין שימוש לא הוגן עדיין מטושטשים.

היזהרו מחיקויים!

 

למה אתם מחכים? התחילו ליצור

לוגו חדשנות בקטנה

למידע נוסף בכל תחומי הטכנולוגיה

צרו איתנו קשר!

ciet@l-w.ac.il