רתימת כוחה של בינה מלאכותית: בחינת כלים וכיוונים עתידיים
המושג בינה מלאכותית, נשמע מפוצץ וגדול ואולי לחלקנו מאיים, אך למעלה מעשור כלי בינה מלאכותית משרתים את האנושות בדרכים שונות. המושגים: בית חכם, מכוניות חכמות, Bot שעולה בכל אתר ושואל כיצד לעזור וכלים רבים אחרים, כולם מבוססי בינה מלאכותית – AI.
עד לתחילית 2023, כלים אלו עמדו לרשותם של מפתחים, חברות תוכנה ואחרים ולא היו פתוחים לציבור הרחב. מהרגע שבו כלי הבינה המלאכותית נפתחו לשימוש ציבורי, המרוץ סביב התפתחותה של הבינה המלאכותית כ"כ מהיר ולא מן הנמנע שרבים מכלים אלו מעצבים ויעצבו מחדש מגזרים ומקצועות רבים בחברה. החל מאלגוריתמים של למידת מכונה ועד למערכות עיבוד שפה טבעית, כלים אלו לא רק התרחבו באופן אקספוננציאלי, אלא גם התפתחו באופן משמעותי בתחכום, בפונקציונליות ובנגישות שלהם. השימוש בכלי AI אלה מעניק יתרונות משמעותיים, לרבות יעילות משופרת, יכולות חדשניות לפתרון בעיות ופוטנציאל לתובנות עמוקות לגבי מערכי נתונים מורכבים. מטרת המאמר, לייצר סדר כללי בכאוס של המגוון העשיר של כלי בינה מלאכותית הזמינים כיום, להבהיר את היתרונות שלהם ולחקור את הפוטנציאל שלהם לחולל מהפכה בתחומים שונים של העשייה האנושית.
ניתן לחלק את כלי הבינה המלאכותית לקטגוריות כלליות כגון: מודלים של שפה, בינה מלאכותית גנרית ו-Creative AI Toolkits – כלים יצירתיים בבינה מלאכותית. כל קטגוריה רותמת היבטים ייחודיים של למידת מכונה (Machine Learning) ולמידה עמוקה (Deep Learning) כדי להגשים מטרות ספציפיות. חלק מהכלים, לדוגמא ChatGPT של Open AI, ו- Bard של Google מעבדים ומייצרים טקסט דמוי אדם בצורה מיומנת, בעוד שכלים כגון DALL-E, Midjourney, Stable Diffusion ורבים אחרים, מצטיינים ביצירת תמונות מתיאורים טקסטואליים. במקביל, ישנן פלטפורמות כמו Runway, המאפשרות ליוצרים לשלב בינה מלאכותית בעבודתם עם מומחיות טכנית מינימלית וכמו כן, ישנם כלים ומודלים שבהם ניתן לייצר אינפורמציה חדשה בשילוב של סרטוני וידאו, מוסיקה ועוד.
היריעה גדולה ורחבה מאוד ומתפתחת לרוחב ולעומק מאוד מהר. על מנת שנוכל לדעת אילו כלים נמצאים וניתנים למחקר ושימוש, מהם הכלים החדשים ולאיזו צורך, נפתחו אתרים יעודים למטרות אלו כגון: https://theresanaiforthat.com/ , https://www.futuretools.io/ .
ברמה הכללית, מודלים של שפה (Language models), בהקשר של בינה מלאכותית, הם מודלים חישוביים המשמשים לניבוי או יצירת טקסט על סמך הקלט שהם קיבלו. תפיסת הליבה מאחורי מודל שפה היא להבין, לחזות וליצור שפה אנושית בצורה נכונה מבחינה דקדוקית ומשמעותית מבחינה הקשרית. מודלים של שפה מבוססים בדרך כלל על שיטות סטטיסטיות או טכניקות למידת מכונה.
Chat GPT של OpenAI, למשל, היא דוגמא למודל שפה מבוסס למידת מכונה המשתמש ברשתות נוירונים ממחושבות.
GPT - Generative Pretrained Transformer (בתרגום חופשי: טרנספורמר מאומן מראש בעל יכולת יצירה), מודל זה מאומן על כמויות גדולות של נתוני טקסט ויכול ליצור משפטים, פסקאות או אפילו מאמרים שלמים קוהרנטיים ורלוונטיים מבחינה הקשרית. הוא יכול גם לענות על שאלות, לתרגם שפות, לסכם טקסט ועוד. החיסרון של Chat-GPT הוא בגודלו העצום של המנוע, בהשקעה הכספית הגדולה שיש לבצע על מנת ללמד אותו וכן ההגבלה שלו לידע עד שנה 2021. הפיתוחים האחרונים של Open AI אפשרו למודל זה לגשת לאתרי אינטרנט באמצעות התקנה של plugins שונים אך אפשרות זו מוגבלת רק למשתמשים בתשלום.
Bard של Google לעומת זאת איננו מודל של שפה כמו Chat-GPT, מכיוון ש Bard רץ על מודל: PaLM 2.
מודל שפה זה ,התאמן על כמויות עצומות של טקסטים מסוגים שונים, היכולות של בארד מגוונות למדי ומזכירות מאוד את אלה של ChatGPT. הוא יכול להשיב על שאלות בנושאים שונים, לכתוב סיפורים, שירים ותסריטים ולסכם טקסטים ארוכים. את התשובות של Bard ניתן לייצא ל- Gmail או ל- Google Docx בלחיצת כפתור.
ישנם מגוון רחב של מודלי שפה קטנים יותר שמתפתחים כל הזמן וניתן לבדוק מהם ההתמחויות של כל מודל בחיפוש אינטרנטי פשוט. מודלים של שפה נמצאים בשימוש במגוון רחב של יישומים, כגון: זיהוי דיבור, תרגום מכונה, סיכום טקסט, תכונות השלמה אוטומטית (כמו Smart Compose של Gmail), צ'אט בוטים ועוזרים וירטואליים.
בינה מלאכותית גנרית (Generative Artificial Intelligent), זהו שם כולל לכלים רבים שניתן להשתמש בהם כדי ליצור מודלים עבור יישומים שונים. חלקם ספציפיים למשימות מסוימות, בעוד שאחרים כלליים יותר וניתן להשתמש בהם עבור מגוון רחב של יישומי בינה מלאכותית. דוגמאות לכך נוכל למצוא במערכות הבאות:
• ספריות Python :Python היא אחת משפות הקוד הפופולריות ביותר לפיתוח בינה מלאכותית בשל האופן שבו טקסט הקוד מוצג, היעילות ושפע הספריות שהיא מציעה עבור AI ולמידת מכונה.
• ספריות למידת מכונה: ישנן מספר ספריות שתוכננו במיוחד עבור למידת מכונה.
• למידה עמוקה: למידה עמוקה היא תת-קבוצה של למידת מכונה המתמקדת ברשתות עצביות בעלות שכבות רבות ("רשתות עצביות עמוקות").
• ספריות עיבוד שפה טבעית: NLTK (Natural Language Toolkit): פלטפורמה מובילה לבניית תוכניות Python לעבודה עם נתוני שפה אנושית.
• שירותי AI בענן: ספקי ענן רבים מציעים שירותי AI המפשטים את תהליך הפיתוח והפריסה של מודלים של AI כמו לדוגמא מערכות Azure של Microsoft.
Creative AI Toolkits - עולם הבינה המלאכותית בתחומי המדיה השונים, העלה את רף האומנות לדרגה חדשה. כלים חדשים בתחום היצירתי של בינה מלאכותית נועדו לעזור לאומנים, מעצבים, מוזיקאים ובכלל תחומי האומנות, למנף את הכוח של AI בעבודתם. כלים אלו כוללים יישומים של למידת מכונה ובינה מלאכותית בהיבטים שונים של תהליך היצירה, הכוללים אמנות חזותית, מוזיקה, קולנוע, ספרות ועוד. הם יכולים להפוך משימות מסוימות לאוטומטיות, לייצר רעיונות חדשים, או אפילו ליצור אמנות בעצמם. בתחומי האומנות עולות שאלות חדשות של מה היפה החדש? מהי יצירתיות?, מהם הגבולות היצירה שבין אדם למכונה? ועוד. ישנם כלים רבים שעוסקים במדיות השונות, וישנם כלים המוכרים יותר מאחרים. מושגים כגון: Text to Image / Image to Image / Text To Video / Image To Video / Video to Video מתחילים להיות שגורים בפיהם של אומנים העוסקים בסוגי מדיה אלו. לכל אחד מכלים אלו יש את שיטת הכתיבה המיוחדת עבורו, ועל מנת להגיע לתוצאות הרצויות על המעצב / משתמש, לדייק את ה- Prompt הכתוב בהתאם לסגנון בניית המשפט המתאים לכל כלי.
להלן מספר דוגמאות של כלי AI Creative:
• Midjourney היא פלטפורמה פורצת דרך המופעלת על ידי בינה מלאכותית שעושה שימוש בטכנולוגיה מתקדמת להפקת תמונות פוטוריאליסטיות מתיאורים טקסטואליים, שילוב של תמונות עם טקסט וערבוב של תמונות. בפלטפורמה זו נעשה שימוש בשיטה מתוחכמת של למידה עמוקה (Deep Learning) המכונה GAN (Generative adversarial networks). על מנת להסביר במלים פשוטות מהו GAN , נדמיין רשת עצבית שיש לה שני חלקים מתחרים שאומנו יחד: החלק הראשון - Generator Network מאומן להבחין בין תמונות אמיתיות לתמונות שנוצרו, בעוד שהחלק השני - Discriminator Network מאומן לייצר תמונות ריאליסטיות התואמות את התיאור המסופק ע"י החלק הראשון. פלטפורמה זו לומדת כל הזמן באמצעות המידע הרב והפידבק של המשתמשים ונחשבת כיום לכלי Ai המקצועי ביותר שפותח עד כה.
Midjourney פועלת כיום במסגרת Discord, אך נמצאת בעיצומו של פיתוח להפוך לפלטפורמה עצמאית.
• DALL-E של Open AI - היא מערכת בינה מלאכותית נוספת שיכולה ליצור תמונות מתיאורי טקסט, באמצעות מערך נתונים של זוגות טקסט-תמונה. הוא יכול לשלב מושגים, תכונות וסגנונות בדרכים חדשניות ומפתיעות. בשונה מפלטפורמת Midjourney, DALL-E, הוא כלי מצוין עבור מעצבים ואמנים שרוצים לחקור אפשרויות יצירתיות חדשות, מכיוון שהוא יכול לייצר תמונות בעלות דמיון ורעיונות מופשטים.
• Runway: מאגדת בתוכה מערכת כלים המאפשרת למעצבים מכל התחומים להשתמש בכלי הבינה המלאכותית בצורה קלה ואינטואיטיבית. הוא מציע מודלים מאומנים מראש למגוון משימות, כולל סינתזת תמונה, שילובים של תמונות עם וידאו / כלים ל- Sound / שינוי סגנון / זיהוי אובייקטים ועוד. הכלי חדש ש- Runway העלה לפלטפורמה היא מסוג GAN2 המאפשר יצירת סרטון על בסיס טקסט.
• Kaiber – כלי ליצירת אנימציות מטקסט תמונות ו- Sound, משמשת ב- Storytelling על מנת ליצר מעברים ורצף בין Prompts שונים של מלל ותמונות.
• Adobe – כלי ה- AI של Adobe נכנסו ל- Photoshop ול- Illustrator ומאפשרים עיבודי תמונות וגרפיקה מתקדמים בשילוב של סרגלים כלים מתחום הבינה המלאכותית.
ישנם עוד כלים רבים מתחומי ה- Creative AI כגון: Stable Diffusion, Leonardo, Wekinator, Magneta, MuseNet העוסקים במדיה חזותית ובמוסיקה. כל אחד מהכלים הללו הוא מיוחד ומתמחה בעולמות מגוונים של ביצוע. לרוב שליטה במספר כלים, תאפשר למעצב להביא את חלומו ורעיונותיו לכדי תוצר ממשי.
אם נסתכל קדימה, תחום זה כפי שציינתי מתפתח ללא הפסקה ואנו עשויים לצפות להתפתחויות בתחומים כגון:
• Multi-AI - כלים בבינה מלאכותית שיכולה להבין וליצור סוגים שונים של נתונים (טקסט, תמונות, קול וכו') בו זמנית. כלים שיכולים לנהל שיחה תוך מניפולציה או יצירת תמונות רלוונטיות.
• AI אינטראקטיבי - בינה מלאכותית שיכולה ליצור אינטראקציה עם משתמשים בזמן אמת, תוך התאמת התוצרים שלה על סמך קלט המשתמש.
• למידה ללא פיקוח: בעוד שמודלים נוכחיים כמו GPT-3/4 מאומנים מראש על מערכי נתונים גדולים, מודלים עתידיים עשויים להיות מסוגלים ללמוד בצורה יעילה יותר מנתונים ללא תווית, מה שהופך אותם למגוונים יותר.
• בינה מלאכותית אישית: מודלים של בינה מלאכותית שניתן להתאים למשתמשים בודדים, ללמוד את ההעדפות היחודיות שלהם כדי לספק תפוקות מותאמות אישית ביותר.
אם נסכם, העתיד של AI הוא עצום ומרגש ביותר. אנחנו צריכים להתאים את עצמנו לעולם ההולך ומשתנה ומשלב כלים חדשים שיעזרו לנו כאנושות לפשט תהליכים, ליצור ולדמיין באופן שלא נראה עד כה. זוהי בהחלט מהפכה וחשוב שנהיה חלק ממנה, אך בד בבד יש לזכור שעם כל הטוב, ישנם אתגרים מערכתיים שחשוב להציף באופן תמידי, על מנת להזכיר לנו שאנחנו בעלי השליטה ולא המכונה.