איך יוצרים קול בעברית שנשמע כמו אדם אמיתי בחינם

מכירים את הרגע הזה שבו אתם שומעים קול ממוחשב שמנסה לדבר עברית… ומתכווצים? כן, גם אנחנו. אבל מה אם נגיד לכם שמשהו השתנה? לא שדרוג קטן. מהפכה. ולא, לא צריך להוציא כרטיס אשראי. יש עכשיו כלי חדש של גוגל, שממיר טקסט לדיבור בעברית – והוא נשמע כמעט כמו אדם אמיתי. אפילו יותר טוב מזה, הוא בחינם. רגע, מה? כן. תמשיכו לקרוא.

 

איך פתאום יש קול עברי שנשמע אנושי, ואפילו בחינם?

אז מה הקאץ’? אין. אנחנו עדיין מחפשים אותו. גוגל השיקה ממש לאחרונה כלי מדהים תחת Google AI Studio. בתוך כל החידושים והפיצ’רים, מסתתרת פונקציה שנקראת Generate Speech. זה לא עוד כלי “רובוטי”. זה משהו אחר לגמרי. הוא מקבל טקסט, ומחזיר קול שמדבר עברית – קול עם רגש, עם נשמה, בלי מבטא מוזר ובלי אינטונציות מוזרות. נשמע פשוט, אבל זה מרגיש כמו קסם.

הכי כיף? לא צריך ידע מוקדם, לא צריך לשבור את הראש. נכנסים לסטודיו של גוגל, לוחצים על כפתור, מזינים טקסט, בוחרים קול – וזהו. אפשר לשמוע איך זה נשמע תוך שניות. גבר? אישה? קול עמוק או קליל? תבחרו. הקול לא רק מקריא – הוא מדגיש, שואל, מתלהב, נרגע. בדיוק כמו בני אדם. למה רק עכשיו זה קורה? לא ברור. אבל סוף סוף מישהו בגוגל החליט שאנחנו גם שווים דיבור כמו שצריך.

מתי קול ממוחשב הפסיק להישמע כמו קובץ מחשב?

מה שקורה פה הוא לא שדרוג. זו קפיצה מדרגה. יש משהו מרגש בשמיעה של טקסט שלנו, מוקרא בקול עברי שלא נשמע רובוטי. פתאום סימן שאלה נשמע כמו שאלה אמיתית. סימן קריאה – כמו מישהו שבאמת מתלהב.

יש עשרות קולות לבחור מהם – גברים, נשים, מבוגרים, קלילים, דרמטיים. וכל אחד מהם נשמע שונה באמת. לא מדובר פה על שינוי גובה הקול או מהירות – אלא על אינטונציה, תחושה, אישיות קולית. ואפשר לשנות את הטון בצורה מיידית: טקסט אחר – קול אחר.

הדבר שהכי תפס אותנו? הקול נשמע מכיר את הטקסט. כאילו הוא מבין אותו. כאילו יש מישהו בצד השני שמקשיב. וזה לא משהו שקורה כל יום.

אפשר להקליט דיאלוגים שלמים בלי לפתוח מיקרופון

הפיצ’ר הכי מפתיע בכל החבילה הזאת? שיחות. לא סתם טקסט. שיחה בין שני דוברים. אתם מגדירים טקסט לכל דמות, בוחרים לכל אחת קול אחר, ולוחצים הפעלה. פתאום יש לכם דיאלוג. לא מוקלט, לא מבוים – נוצר בזמן אמת.

וזה לא רק קול. זה סגנון. אם כתבתם דמות נרגשת – היא תשמע ככה. אם כתבתם דמות שמתעצבנת – תרגישו את זה בקול. כן, אפילו צחוק יש שם. והמעבר בין משפטים – טבעי. זורם.

אפשר להשתמש בזה לסרטונים, להצגות מוקלטות, להדמיות, לתוכן ליוטיוב, אפילו לתרגול בעברית. הכל נשמע טוב. כל כך טוב, שפתאום מתחשק לכתוב תסריטים.

כל אחד יכול להשתמש בזה. ובאמת כל אחד.

לא צריך לדעת לתכנת. לא צריך להיות קריין. לא צריך להכיר מושגים. זה פתוח לכולם. כל מי שיודע להקליד – יכול ליצור קול. וזה לא סתם קול – זה קול שיכול להוביל סיפור. להנחות. להסביר. לשכנע.

הממשק פשוט. הכלי חינמי. והתוצאה? נשמעת כמו מוצר פרימיום. כל כך פרימיום, שזה מרגיש מוזר שהוא עדיין לא בתשלום.

ובשקט בשקט, בלי שאף אחד יכריז על זה בתופים – יש לנו פתאום פלטפורמה לעברית מדוברת, טבעית, נעימה. וזה לא פחות ממדהים.

מאמרים נוספים שיכולים לעניין אותך

רובנו גדלנו על שאלה אחת שחוזרת שוב ושוב: מה התוכנית שלנו? איפה נהיה בעוד שנה, חמש שנים, עשור? העולם אוהב…

התובנות שנשתף כאן מבוססות על הדרך והניסיון של דן הנרי (Dan Henry), יזם דיגיטלי ומשווק שבנה עסק של עשרות מיליוני…

יש רגעים בחיים שבהם אנחנו מרגישים שהשגרה שואבת אותנו פנימה. אנחנו רצים ממשימה למשימה, מנסים להספיק עוד פגישה, עוד פרויקט,…

בעידן שבו אנחנו חיים, נדמה שהכול משתנה מהר מדי. מה שהיה נכון אתמול – היום כבר מתיישן. בינה מלאכותית (Artificial…

הזדמנות להחזיר בחזרה לקהילה:

3,500 קשישים ושורדי שואה מחכים לארוחה גם היום. אתם יכולים לשנות את זה - ממש עכשיו.

הזדמנות להחזיר בחזרה לקהילה:

הם לא יכולים לבקש, אבל הם בוכים מרעב.
תינוקות בישראל הולכים לישון רעבים. אנחנו כאן כדי לשנות את זה.

תפריט נגישות

מתקשים ליישם?

הכנו עבורכם צעדים קטנים ליישום על בסיס שבועי שיגיעו אליכם ישירות למייל.