­

אנחנו נמצאים בתהליכי פיתוח של מנוע המלצות,  שבא לענות על אתגר מורכב בעולם התוכן האודיו-ויזואלי: כיצד להתאים סרט לנושאי קורס, הרצאה או שיעור

הדרך המקובלת כיום היא לבקש המלצות לסרטים מתאימים מאנשים בעלי ידע נרחב, לבקש סיוע ממידענים, לקרוא בבלוג סקירת הסרטים שלנו, לפנות לתמיכה של אתר הסרטים, לשאול עמיתים, לחפש סרטים על פי מילות מפתח, לבקש את חוות דעת הקהילה ברשתות חברתיות ובפורומים ועוד.
׳כל התשובות נכונות,׳ כמאמר הפראפראזה המפורסמת על מבחני ברירה. אלא שכרגע, מדובר בתהליך ארוך ודי מייגע. לא תמיד ההמלצות שנקבל תהיינה טובות והגרוע מכל - הן מצומצמות.
תכונה אנושית ידועה היא להכניס מספר מצומצם של סרטים (או ספרים, או אמנים, או בעלי מקצוע) לתוך רשימה קאנונית וירטואלית, שנוצרת באופן טבעי. היתרון של רשימות כאלה הוא קיצור הזמן עבור המחפש-ת.
החיסרון הוא צרות האופקים: שאלו אוהבי קולנוע מה הם הסרטים המוערכים והאהובים עליהם. סביר להניח ש - 90% ימנו את האזרח קיין כאחד מהם, בכלל בלי לחשוב. אז לא שאנחנו מטילים ספק בגאוניותו של אורסון ווילס, אבל יש בתשובה המוחצת הזו, שחוזרת על עצמה כבר יותר מ - 40 שנה, ריח חריף של קונפורמיזם ואופנה. ויש גם את מחשבתו של הדובר-ת על איך הוא או היא ייראו בעיני השומע. כלומר, אם אפזר כמה מילים חכמות על מכניקה קוונטית, המונה ליזה, דוסטוייבסקי ואינגמר ברגמן, איראה טוב יותר בעיני הסביבה. דבר כזה מהווה חלק מהטבע האנושי, אבל יוצר הטייה: לא תמיד ההמלצות הקאנוניות או מה ש״כולם״ מדברים בו נכבדות, מתאים.

אז האם לנצח נישאר תקועים עם אותם 10-15 סרטים שכולם משתמשים בהם שוב ושוב?

לא בהכרח.

גייסנו בינה מלאכותית

תודו שזה היה צפוי.
למרות שיש כיום מנועי המלצות טובים, רובם המכריע ממליצים (מפנים) מסרט אחד לאחר (״אם אהבת את סרט א׳, אולי תרצי לצפות בסרט ב׳׳״). או שהם מתאימים סרט לטעם שלנו (״אני אוהב סרטי אימה״) או למצב הרוח (״הערב בא לי קומדיה רומנטית״).

אלא שסרט המתאים להרצאה או קורס, אינו בהכרח סרט שמתחשק לנו לראות. זהו סרט שמתאים לנושא הקורס או השיעור.
סרט כזה, אם נבחר בצורה נכונה, יכול להצית דיון (להיות טריגר), להאיר זווית נוספת, להדגים נקודה חשובה, לתת המחשה לענין אבסטרקטי, לספק עדות וגם להסביר דברים בדרך נוספת, אודיו-ויזואלית.
לכן נדרשת התאמה נושאית יותר מאשר התאמת ״חשק״.
זו, בקיצור, תמצית יחודיות המנוע שלנו, ששמו בישראל KLIPNOTE.

כיצד ההמלצה תעבוד

כאשר המערכת תהיה מוכנה, תתבקשו להקליד, להדביק טקסט או להעלות קובץ המתאר את נושא הקורס או הפרזנטציה, עבורם תרצו למצוא סרט מתאים.
המערכת תציע לכם מספר אפשרויות וגם תדרג את מידת הרלוונטיות המשוערת. 
תוכלו לשפר את ההמלצה על ידי מתן משוב, כמו בכל ממשק שיחה (צ׳אט).
בהמשך, מתוכננות גם אפשרויות ליצירת רשימת המלצות על פי קורס ולקבלת התראות כאשר מצורף סרט חדש, שעשוי להתאים לתיאור הקורס או פרזנטציה.

קראו כאן על ההיגיון, הפילוסופיה והטכנולוגיה שמאחורי יצירת המלצות

 

מהיכן באים הסרטים?

או במילים אחרות, לאילו סרטים המנוע יפנה?
המנוע נבנה כמנוע כללי. אך מאחר שאנחנו בעלי קטלוג סרטים בעצמנו, נבנה את המסד הראשוני עבור הקטלוג שלנו עצמו. נוכל להוסיף הפניות לקטלוגים נוספים וגם אתם תוכלו ליצור כאלה בעצמכם, אם אתם יודעים לעבוד עם קוד. מה שמביא לסעיף הבא:

הקוד זמין לכל

ברגע שיסתיים הפיתוח, הקוד ייפתח לציבור להורדה חופשית מ - Github, כולל הנחיות להקמת המערכת (תצורת השרתים).
המגבלה היחידה היא שלא תוכלו למסחר אותו (למכור את הקוד או לגבות תשלום על גישה אליו), אך בהחלט לבנות ולהשתמש בו בחינם.
כל מוסד או חוקר-ת שירצו בכך, יוכלו להקים ולהריץ את המנוע עם כל קטלוג סרטים שהוא העומד לרשותם, כולל למשל ספרייה פנימית של סרטים שאוניברסיטה הפיקה בעצמה.
אנחנו נספק גם שירות כזה (של הקמה והתאמה של המנוע לצרכי הגוף המבקש), אך הוא אופציונלי לחלוטין. ניתן לבצע הכל לבד.

המערכת גמישה

  • תוכלו לקבוע באיזה מודל (LLM)  המנוע יעבוד. הוא יוכל להיות על מחשב מקומי וניתן יהיה לחלופין להתחבר לשרותי LLM מקוונים, דוגמת המודל של OpenAI.
  • אנחנו בונים מודולים שונים, בתור חלקי משנה במערכת. גם אותם תוכלו להתאים לצרכיכם. למשל: קטלוג הסרטים שלנו נמצא בפורמט מארק XML, כמו רבים מהמאגרים איתם עובדות ספריות אקדמיות. יצרנו כלי פשוט הממיר את פורמט מארק לכזה שהמכונה יכולה בקלות לקרוא (CSV). במהלך ההמרה הזו, השמטנו בכוונה פרטים רבים שנמצאים במארק, אך אינם רלוונטיים ללמידת המכונה.
  • תוכלו לשנות את המשקלים (weights). בעברית פשוטה, ״משקל״ (בבינה מלאכותית) הוא החשיבות המוקנה לכל גורם בייצור ההמלצה. אנחנו למשל הגענו למסקנה כי כלי חילוץ מילות המפתח מקבל משקל של 40% בהחלטה על ההמלצה. ה - LLM מקבל משקל של 60% בהמלצה. תוכלו לשנות זאת או פשוט לנסות, עד שתגיעו לתוצאה שתשביע את רצונכם (כלומר, להמלצות טובות).

חשוב לזכור

ישנו מונח עממי במחשוב: Garbage in, garbage out. או במילים אחרות: אם הקלט הוא ברמה נמוכה, גם הפלט יהיה ברמה נמוכה. ובהיבט היישומי, על מנת לקבל המלצות טובות, תיאורי הסרטים חייבים להיות איכותיים. וכמובן, מן הצד השני גם תיאורי הקורסים (סילבוס).  

מראה הממשק

בהמשך נראית תמונת מסך של הממשק הראשוני. הוא עוד ישתנה וישוכלל.  יתווספו אליו עוד תכונות, כמו היכולת לשמור רשימת המלצות לסרטים עבור העתיד והיכולת לעדכן את הרשימה כאשר מצורפים עוד סרטים לקטלוג, כמו גם היכולת לקבל התראות כאשר נוסף לקטלוג סרט, העונה למילות מפתח שתגדירו.

 

 


 

­