近期,Lalamu Studio 開啟了 beta 版本測試:Lalamu Studio。該工具整合了 TTS 和 lip sync 功能,可以讓任意視頻中的人物開口說話,並精確模擬口型。
例如,選擇一段視頻素材,添加由 Ai 合成的語音,即可完成實時播報和唇形同步。點擊上面鏈接,訪問 Lalamu Studio。左側可以合成語音,完成唇形同步。
選擇一段動畫,在左側對畫框中添加視頻腳本,在下方選擇一個播音員,點擊生成音頻,完成語音合成後,點擊下方的 Generation,開始合成視頻。為了節省算力,Lalamu Studio 並未提供高清視頻輸出。不過,從生成的動畫可以看出,人物的口型可和語音完全相符。
然後,選擇一段真人動畫,測試一下口型模擬的效果。Lalamu Studio 還處於測試期,正式上市後,將會支持高清輸出。Lalamu Studio 還將推出多人物語音合成和編輯功能,讓視頻剪輯變得更有趣。
簡單的了解了 Lalamu Studio,我就為大家演示如何使用 Lalamu Studio 為動畫合成語音。
首先,使用任意工具,生成一張 TINKERBELL 的圖像。登錄 Pikalabs,
輸入 a pirate of the Caribbean 提示,生成一段幾秒鐘的短視頻,並保存到本地。返回 Lalamu Studio,上傳製作好的短視頻。下一步,登錄 TTS 語音合成網站 Elevenlabs:Text to Speech & AI Voice Generator – ElevenLabs,點擊 voice library 選項,從社區中選擇一個合適的配音員。
點擊下方的 add to voicelab, 把播音員添加到自己的語音庫。然後,輸入視頻腳本,完成語音合成:
“Hi, I‘m Jack Sparrow, a pirate of the Caribbean.”
上傳語音文件到 Lalamu,點擊 lipsync 選項,實現模擬口型。
最後,測試一下 lalamu 自帶的視頻素材,通過多組測試,Lalamu 可以準確模擬大部分卡通人物的口型,大家可以自行嘗試。然後,測試一下真實人像的模擬效果。
Lalamu 可用於製作有趣的短視頻和動畫,最多支持 300 字符的腳本。目前,Lalamu 僅支持德語和英語,並不支持中文,大家可以在上面網站內嘗試。