הכל אודות Sora: הפוטנציאל והסיכונים במחולל הווידאו פורץ הדרך

ענבל שטרייכמן-טל, רכזת מחשוב וחדשנות דיגיטלית בבית הספר לעיצוב וחדשנות, סוקרת את הכלי החדש והמלהיב

בעשור האחרון חלה קפיצת מדרגה בטכנולוגיה עם מעבר ממחוללי תמונה למחוללי וידאו. בעוד שמודלים כגון DALL·E של OpenAI, Stable Diffusion ו- Midjourney לימדו אותנו איך להפוך מילים לתמונות מרהיבות, יצירת וידאו באמצעות טכנולוגיות של בינה מלאכותית היא אתגר הרבה יותר מורכב.

כדי שסרטון ייראה טבעי ורציף, יש צורך לשמור על תאורה עקבית, תנועות זורמות ומעברים חלקים בין פריימים (תמונות). האתגר הזה הפך את פיתוח מחוללי הווידאו לאחד התחומים המרכזיים והמורכבים ביותר בעולמות הבינה המלאכותית, במיוחד בשנה האחרונה.

מודלים ראשונים כמו Runway Gen-1 ו- Pika Labs הובילו את הדרך, אך התמודדו עם אתגרים משמעותיים: איכות מוגבלת של רזולוציה, תנועה לא חלקה בין פריימים ותוצרים גנריים ופחות יצירתיים. עם התקדמות הטכנולוגיה, חל שיפור ניכר באיכות וביכולת היצירה, אך עדיין נותרו אתגרים משמעותיים – כיצד לשמר תחושת טבעיות ואמינות ויזואלית בסרטונים, ומהם הגבולות האתיים הנדרשים כדי למנוע שימוש לרעה בטכנולוגיה?

ואז הגיע Sora

בינואר 2024, OpenAI הציבה רף חדש עם הכרזתה עלSora , מחולל הווידאו פורץ הדרך שלה. ההכרזה עוררה התרגשות עצומה בעולמות הטכנולוגיה והאומנות החזותית, כשהיא הבטיחה לראשונה כלי המאפשר להפוך תיאורי טקסט לווידאו באיכות גבוהה, עם תנועות מורכבות ופריימים עקביים. Sora לא רק התמודד עם אתגרי העבר, אלא הציע פתרונות שהפכו את הבלתי אפשרי למציאות.

לאחר פרומו מרהיב, OpenAI הודיעה ש Sora- ישוחרר לציבור במועד לא ידוע ובחרה בגישה זהירה, כשהיא מאפשרת תחילה גישה לקבוצה קטנה של יוצרים, אמנים ואנשי וידאו נבחרים, כדי לבדוק את המודל ולהבטיח את השימוש האחראי בו.

ובכל זאת, העולם כבר הבין: Sora הוא לא רק כלי, אלא סמל. הוא חשף את הפוטנציאל ואת הסיכונים בעולם שבו כל אחד יכול ליצור סרטונים ברמת ריאליזם גבוהה ממספר שורות טקסט.

לאחר כמעט שנה של התנסות ובדיקות, בסוף דצמבר 2024, הושק Sora לציבור הרחב. OpenAI שילבה במודל הבסיסי שלו מנגנוני בטיחות כמו סימני מים ומגבלות על דמויות אנושיות ריאליסטיות, ובכך הצליחה לשלב יצירתיות עם אחריות.

כאשר דמיון וטכנולוגיה מתמזגים

השפעת Sora על העולם הייתה מיידית. אנשי שיווק השתמשו בו ליצירת קמפיינים מהירים, אמנים מצאו דרכים חדשות לביטוי, וגם אנשי חינוך ראו פוטנציאל להמחשת רעיונות מורכבים באמצעות וידאו דינמי. מעבר לכך Sora הפך לסמל לעידן שבו דמיון וטכנולוגיה מתמזגים, ואיתו צצות שאלות על אתיקה, יצירתיות ושליטה בכלים שיקבעו את העתיד שלנו.

כך, לדוגמא, היתה זו תעשיית הקולנוע בהוליווד בין הראשונות להרים דגל אדום, במהלך שביתת התסריטאים והשחקנים בשנת 2024, כאשר אחת הסוגיות המרכזיות הייתה החשש מהחלפת תסריטאים ושחקנים בבינה מלאכותית. בהסכמים שהושגו לאחר השביתה, נקבעו בין היתר הגבלות על השימוש בבינה מלאכותית, כולל איסור על יצירת תסריטים או דמויות ללא הסכמת היוצרים, והבטחת זכויותיהם בתהליך היצירה.

המעבר למחוללי וידאו סימן לא רק שינוי טכנולוגי, אלא גם שינוי חברתי ופילוסופי ובמרכזו השאלה כיצד אנחנו משתמשים בטכנולוגיה כדי ליצור את הסיפורים של מחר?

Sora לא לבד: התחרות בעיצומה

עם ההכרזה על Sora , "נדלקו האורות" בתחרות הגדולה בין ענקיות הבינה המלאכותית – מי תוביל את הדור הבא של מחוללי הווידאו? OpenAI אולי הכתיבה את הקצב, אבל המתחרות לא נשארו מאחור.

Runway העלו הילוך עםGen-3 , מנוע שהביא עמו שיפורים בתנועות ובמעברים, Dream Machine של חברתLuma Labs , הציג גישה יצירתית עם תוצרים דינמיים. לקראת סוף 2024 נרשמו התפתחויות משמעויות נוספות בתחום מחוללי הוידאו: Pika Labs הפתיעו עם שדרוג למודל Pika שלהם שממוקד ביצירת תכנים דינמיים וראליסטיים ברמה גבוהה.

גם חברות הבינה המלאכותית האסיאתיות נכנסו במלוא הכוח. לדוגמא, מחולל הוידאוKling הציב תחרות ראויה ל Sora-באיכות, דינמיות וסיסטמתיות מעוררת השראה. ואם זה לא מספיק - Veo2 של Google נחת בזירה במקביל להשקת Sora בסוף 2024 ונחשב כמודל המוביל כיום ליצירת וידאו, עם יכולות ריאליסטיות גבוהות מאוד (Veo2 נכון לדצמבר 2024, פתוח בארצות הברית בלבד, אך הציב רף חדש וראליסטי למחוללי הוידאו).

התחרות הפכה את 2024 לשנה היסטורית בעולם מחוללי הווידאו – לא רק בגלל הטכנולוגיה, אלא גם בגלל מה שהיא הביאה איתה: יצירתיות בלתי נגמרת, שיתופי פעולה בין קהילות שונות, ושאלה מרכזית אחת – עד לאן נוכל להגיע עם הכוח שבידינו?

במסגרת הקורס "בינה מלאכותית בשירות המעצב.ת", הנלמד בבית הספר לעיצוב וחדשנות, נחשפים הסטודנטים והסטודנטיות, למגוון רחב של כלים מבוססי בינה מלאכותית. Sora אחד מהם. מכיוון שהתחרות בין החברות כל כך גדולה, מחוללי הוידאו משתדרגים מעדכון לעדכון ובכל פעם אנחנו מקבלים מודלים טובים יותר. כמעצבים חדשניים, הסטודנטים והסטודנטיות לומדים לבחור את הכלי הנכון עבור כל פרויקט ולעיתים גם לשלב ביניהם ומשתמשים ביכולות של כלים מבוססי בינה מלאכותית לטובת הקורס בפרט ולתכנים הנלמדים בתואר ככלל.

Sora - על קצה המזלג:

Sora הוא מודל חדשני של OpenAI ליצירת וידאו באמצעות בינה מלאכותית, המאפשר למשתמשים ליצור סרטונים על בסיס טקסט, תמונות או וידאו קיימים. הכלי מאפשר יצירת תוכן וידאו ברזולוציה של px 1080 ובאורך של עד 20 שניות, בפורמטים שונים כמו מסך רחב, אנכי או ריבועי.

• זמינות: Sora זמינה לשימוש באתר https://sora.com
הגישה לכלי ניתנת במסגרת מנויי ChatGPT Plus ו ChatGPT Pro-כאשר מנוי Plus (בעלות של 20 דולר לחודש) מאפשר יצירה של עד 50 סרטונים ברזולוציה שבין 480-720px ובאורך של בין 5-10 שניות, ומנוי Pro (בעלות של 200 דולר לחודש) מציע יצירת סרטונים ללא הגבלה, ברזולוציה של עד px 1080 ובאורך של עד 20 שניות, ללא סימן מים.
• תחומי שימוש: Sora מתאים למגוון רחב של תחומים, ביניהם: שיווק ופרסום, קולנוע, חינוך, אמנות ועיצוב, אדריכלות ועוד.

ענבל שטרייכמן-טל, רכזת מחשוב וחדשנות דיגיטלית בבית הספר לעיצוב וחדשנות

הכל אודות Sora: הפוטנציאל והסיכונים במחולל הווידאו פורץ הדרך

ואז הגיע Sora

כאשר דמיון וטכנולוגיה מתמזגים

Sora לא לבד: התחרות בעיצומה

Sora - על קצה המזלג:

כתבות נוספות שעשויות לעניין אותך