איך מוסיפים כתוביות אוטומטיות בעברית לשורטס — מדריך פרקטי
הפוסט הזה הוא המדריך הקצר — איך לעשות את זה צעד אחר צעד, איפה כלים גלובליים נופלים על עברית, ומה ההבדל בין קובץ SRT לכתוביות צרובות לתוך השורט עצמו. הסיבה שזה לא טריוויאלי היא שעברית היא לא אנגלית הפוכה — מי שלא בנה את שכבת הכתוביות לעברית מאפס, הכלי שלו יחזיר כתוביות שבורות. אנחנו יודעים את זה כי בנינו את שכבת התיקון הזו לפני שהיה לנו ממשק או עורך, מתוך הניסיון של מאות שורטים שאני בעצמי הוצאתי ל-@dov_fund (הערוץ שצבר 10 מיליון+ צפיות בטיקטוק).
למה כתוביות זה הכרחי בשורטס — לא תוספת
רוב הצפיות בשורטים מתבצעות בלי קול. הצופה במובייל, בתחבורה ציבורית, בעבודה, או גולל בלילה ליד בן זוג ישן — הוא לא לוחץ על אייקון הסאונד. אם השורט שלכם דורש שמיעה כדי להבין מה קורה, אתם מאבדים את רוב הקהל הפוטנציאלי לפני שהוא הספיק להגיע למילה הראשונה.
זה לא תיאורטי. שורט בעברית בלי כתוביות מקבל פחות שיתופים ופחות שימור בשלוש השניות הראשונות — בפיד טיקטוק או ריילס, הצופה רואה שלוש שניות של דובר שזז בלי טקסט, ומסיק שאין שם תוכן. הוא גולל. הכתובית היא לא קישוט — היא המסר. אצלנו ב-ClipRocket Studio זה היה הרכיב הראשון שבנינו מאפס, לפני שהיה לנו ממשק.
למה כלים גלובליים נופלים על עברית — ארבע המלכודות
זו השאלה שאני מקבל הכי הרבה: ״יש לי CapCut או OpusClip, למה לא להשתמש בהם לכתוביות בעברית?״ אפשר — אבל יש ארבע מלכודות חוזרות שהופכות את השורט הסופי לשבור. ארבעתן ספציפיות לעברית, ארבעתן ניתנות לזיהוי בשנייה אחת.
מספרים מתהפכים
המודל הגלובלי מתמלל ״1.6 מיליון״ נכון בקובץ הטקסט. אבל ברגע שהכתובית נכנסת ל-RTL (RTL — סידור ימין לשמאל בעברית) של עורך הווידאו או של הפלטפורמה, רצף הספרות מתהפך ל״6.1 מיליון״. אם המודל לא מסמן את המקטע הזה כ-LTR (LTR — סידור משמאל לימין) פנימי, התוצאה חצי שגויה.
הצופה רואה ״6.1״, לוקח לו שלוש שניות להבין שמשהו לא בסדר — ובינתיים הוא כבר גלל הלאה.
אות סופית נשברת
״שלום״ הופך ל״שלומ״ באמצע משפט. ״עידן״ ל״עידנ״. ״צמצום״ ל״צמצומ״. המעבד הפנימי של הכלי הגלובלי לא מבדיל בין מ׳ סופית (״ם״) לבין מ׳ אמצעית (״מ״), ועושה את אותה טעות עם נ׳, פ׳, צ׳, וכ׳ סופיות.
צופה ישראלי מזהה את זה בחצי שנייה, ומיד מסיק שמדובר בשורט שיוצר ברשלנות. זה לא רק חוסר נעימות — זה איבוד אמון.
מ-/ה-/ל- נשברים על מקפים
״מ־ירושלים״ הופך ל״מ ירושלים״ עם רווח באמצע, או ל״מ-ירושלים״ עם מקף לטיני במקום מקף עברי. המקף העברי (״־״) — שונה ויזואלית מהמקף הלטיני (״-״) — נופל באופן עיוור כי המעבד לא יודע שהוא ספציפי לעברית.
המילה נשארת קריאה, אבל הקצב של המשפט נשבר. בשורט שבו לכל חצי שנייה יש משקל, זה מספיק כדי שהצופה ירגיש שמשהו ״לא ישראלי״.
שמות פרטיים ישראליים נופלים
״גלעד״ הופך ל״גילד״. ״תהילה״ ל״תילה״. ״גורניצקי״ נופל לחלוטין ויוצא משהו שאף אחד לא יזהה. שמות ספציפיים של ישראלים פשוט לא חלק מאוצר המילים של מודל גלובלי שאומן בעיקר על אנגלית.
זו החולשה המרכזית של כל מערכת תמלול בעברית, כולל אצלנו. אנחנו לא מבטיחים שכל שם פרטי ייצא נכון — אבל כן מסמנים פנימית מקומות שבהם הביטחון נמוך, כדי שתדעו איפה לבדוק לפני שאתם מעלים את השורט.
כל ארבע המלכודות האלה נמנעות — אבל לא בכלי שתומך ב״עברית״ ככיתוב על מדף הפלטפורמה. ספציפית לארבעתן בנינו את מחולל הכתוביות החינמי ואת דף השירות שלנו לכתוביות אוטומטיות בעברית. שניהם בנויים לעברית מהשורה הראשונה, לא ״הופכים את האנגלית״.
ארבעה שלבים — איך עושים את זה אצלנו
התהליך כולו לוקח פחות מחמש דקות מהפתיחה של הכלי עד הקובץ המוכן. כל אחד מהשלבים הוא פעולה אחת — אין הרשמה, אין הגדרות מתקדמות, אין בחירת מודל.
גוררים את הקטע לכלי החינמי
נכנסים ל-/tools/captions. גוררים סרטון או קובץ אודיו לאזור ההעלאה. הפורמטים שמתקבלים: MP4, MOV, M4A, MP3, WAV, WEBM, OGG. אורך מקסימלי — 5 דקות. גודל מקסימלי — 100 מגה. בלי הרשמה, בלי כרטיס אשראי, בלי טופס בעברית להמלא לפני שמתחילים.
התמלול רץ עם שכבת תיקון לעברית
אנחנו מחלצים את האודיו מהווידאו, ממירים ל-MP3 דחוס, ושולחים ל-Whisper (Whisper — מודל התמלול האוטומטי של OpenAI) במצב עברית — עם חותמות זמן ברמת המשפט. שכבת התיקון העברית שלנו רצה אחר כך — מתקנת אות סופית, ממירה מקפים לתואם עברי, ודואגת לכיוון של מספרים.
אנחנו עומדים על 85 עד 95 אחוז דיוק מהמילים על אודיו נקי של דובר אחד. רעש רקע, מבטא לא ישראלי, או מיקרופון רחוק — מורידים את האחוז. שמות פרטיים נדירים נופלים גם אצלנו לעיתים. זה תהליך מתמשך, לא מוצר שגמר את ההתפתחות שלו.
מורידים שני קבצים — SRT ו-VTT
אנחנו מחזירים שני קבצים בסיום, זהים בתוכן אבל בפורמט שונה. SRT — סטנדרט הכתוביות הוותיק, נתמך כמעט בכל עורך וידאו, בכל שירות סטרימינג, ובכל פלטפורמת שורטים גדולה. VTT — הגרסה המודרנית להטמעה ב-HTML5 ולאתרי אינטרנט.
אנחנו ממליצים להוריד את שניהם. SRT לעריכה ב-DaVinci, Premiere או Final Cut. VTT אם אתם מעלים את השורט ישירות לאתר שלכם בלי לעבור דרך פלטפורמה חיצונית.
בודקים את הקובץ לפני העלאה
פותחים את קובץ ה-SRT בפנקס הרשימות, ב-Notepad, או בכל עורך טקסט פשוט. עוברים מהר על התוכן — מחפשים שמות פרטיים שאולי נכתבו לא נכון, ומספרים גדולים שכדאי לוודא שהם בכיוון הנכון.
תיקון של 30 שניות בקובץ טקסט שווה הרבה. זה ההבדל בין שורט שיוצא בשידור נקי, לבין שורט שצריך לרנדר מחדש אחרי שכבר עלה. גם אם הכל נכון — הבדיקה הזו היא ביטחון.
איך משלבים את הכתוביות בשורט הסופי — SRT לעומת צרובות
קיבלתם SRT. עכשיו יש שתי דרכים לחבר את הכתוביות לשורט עצמו — והבחירה בין השתיים תלויה בפלטפורמה.
SRT נפרד — כשמעלים את השורט ליוטיוב Studio, מוסיפים את ה-SRT בתפריט הכתוביות. הצופה רואה את הכתוביות מעל הסרטון, יכול לכבות אותן בכפתור. מתאים ליוטיוב — גם ארוך וגם שורטס. מתאים פחות לטיקטוק וריילס, שבהם רוב הצפיות במצב שקט והכתוביות חייבות להיות חלק מהפריים.
כתוביות צרובות — הכתוביות הופכות לחלק מהווידאו עצמו, מוטמעות לתוך הפיקסלים. הצופה רואה אותן תמיד, בלי קשר להגדרות. זה הסטנדרט לשורטים בטיקטוק, ריילס, וגם ביוטיוב שורטס. הכלי החינמי שלנו מחזיר SRT — אם אתם רוצים את הכתוביות צרובות אוטומטית, בתוכנית בתשלום של ClipRocket Studio זה קורה כחלק מהשורט המקצה לקצה — פונט עברי גדול, קונטרסט גבוה, ושתיים עד שלוש מילים לפריים.
שאלות נפוצות
איך אני יודע אם הכתוביות שלי בכיוון הנכון?
בדיקה של חמש שניות — פותחים את הסרטון, עוצרים בשנייה הראשונה שבה יש כתובית. אם יש מספר — הוא צריך להיות בצד הימני של הכתובית. אם יש שם פרטי — האות הראשונה שלו צריכה להיות בצד הימני של המילה. אם אחד מהשניים בצד השמאלי, הכתוביות הפוכות.
אפשר להוסיף כתוביות לשורט אחרי שהוא כבר עלה לאינטרנט?
ביוטיוב — כן. ב-YouTube Studio אפשר להוסיף קובץ SRT לסרטון קיים, גם אחרי הפרסום. בטיקטוק וריילס — לא ישיר. שם הכתוביות מוצמדות לפיקסלים של הווידאו עצמו, וצריך למחוק את הפוסט ולהעלות מחדש עם הכתוביות הצרובות. עדיף להוסיף כתוביות לפני הפרסום הראשון, גם בגלל זה וגם בגלל שהפרסום הראשוני הוא חלון 60 עד 90 הדקות הקריטי של החשיפה האלגוריתמית בטיקטוק.
מה אם השורט שלי מערבב עברית עם אנגלית?
Whisper מזהה את העברית בתוך שורט דו-לשוני בתנאי שהיא נוכחת באודיו משמעותית — כמה שניות רצופות בעברית. אם זה דובר־לרגע בעברית בתוך אודיו אנגלי, הזיהוי לפעמים נופל. במקרים כאלה — חתכו את הקטע העברי לקובץ נפרד, העבירו אותו דרך הכלי, ואת הקטע האנגלי דרך כלי תמלול אנגלי. שני קבצי SRT, מיזוג ידני בעורך.
זה באמת חינם? מה הקאצ׳?
כן, חינם לחלוטין. בלי הרשמה, בלי כרטיס אשראי, בלי שיווק במייל אחר כך. המגבלה היחידה היא תמלול אחד ל-IP ב-24 שעות. זה מספיק לקטע שורט אחד מדי יום. אם אתם צריכים פרק שלם של 60 דקות, או 10 עד 20 שורטים מאותו פרק עם כתוביות צרובות — שדרגו לתוכנית בתשלום של ClipRocket Studio. 30 קרדיטים חינם = 30 דקות וידאו, ללא כרטיס אשראי.
הצעד הבא
30 דקות וידאו חינם. כתוביות שעובדות בעברית. בלי כרטיס אשראי.
הכלי החינמי מצוין לקטע יחיד עד 5 דקות. לפרק פודקאסט שלם — תמלול מסונכרן, כתוביות צרובות מותאמות לעברית, ו-10 עד 20 שורטים מוכנים בפורמט 9:16 — תנו ל-ClipRocket Studio את הפרק שלכם. 30 קרדיטים חינם = 30 דקות וידאו, ללא כרטיס אשראי.
קריאה נוספת: שש טעויות שהורגות שורטס בעברית, המדריך המלא להפיכת פרק פודקאסט לשורטס, ההשוואה המלאה: ClipRocket מול OpusClip בעברית.