AI 視頻講解類產品走紅
只需點擊一下按鈕,AI 就能將文字或者圖片轉化為視頻,這已經在學習場景落地,且成為一個重要的創業方向。
如 AI 視頻生成平臺 Mootion、斯坦福大學生們創辦的 VideoTutor、谷歌旗下的 Sparkify、佛羅里達大學的初創公司 Knowlify、法國專注於兒童和家庭娛樂的 AI 媒體公司 Animaj 以及中國初創公司北京波波熊科技旗下 TalkingSpark...... 都切入了學習場景。
在“AI 視頻”產品的説明下,知識以更直觀、更個性化的視頻形式呈現,更加生動、有趣。
A 視頻可以講解知識、講解題目、輸出故事、輸出概念等,不過,各家在切入點、定位上、功能上及底層技術上有一些差別。
多知獲悉,Mootion 最近獲得了源碼資本、創新工廠等新一輪投資,其已經有 200 萬註冊使用者,年化收入達到了 100 萬美元。 當前,Mootion 主要用於社交媒體博主視頻創作和教育工作者授課。 阿聯酋、沙特、阿曼等海灣國家的教育工作者會用 Mootion 生成教學視頻,比如生成雙語對話視頻。
可以看到,在通用視頻大模型快速狂飆之外,一部分 AI 視頻產品進入到垂直場景,試圖解決普通人在視頻創作和學習方面的難題。
多個從業者告訴多知,AI 視頻在學習領域的應用才剛剛開始,基礎性技術障礙已基本攻克,當前需要關注特定場景的適配性,更多需要的是工程上的優化與打磨。
(多知製圖)
01 AI 視頻落地教育場景
聚焦 AI 視頻的產品愈發多了起來,且受到了教育用戶的關注。
最近,Mootion 以口碑傳播的方式在阿拉伯世界火了,在阿曼,有近 3 萬名老師用來製作視頻,從而更好地教英語、歷史和科學。
王詠剛為 Mootion 創始人、CEO,他曾是創新工廠 AI 工程院執行院長,也是人工智慧與軟體工程領域專家,曾擔任谷歌主任工程師和高級技術經理,他於 2022 年底啟動了 Mootion 專案; 童超為 Mootion 聯合創始人兼首席產品官,曾任 360 人工智慧研究院產品及對外合作負責人。
在 Mootion,戶只要輸入一句話,AI 就會自動以導演的角色構思,編劇的角色製作腳本,動畫師的角色製作分鏡,然後剪輯師的身份進行剪輯,最後給到使用者一個故事、畫面、聲音都完整的視頻作品。
Mootion 創始人王詠剛告訴多知:「我們一開始預設的是 Social media 博主做 Faceless 講解或故事視頻這個場景,後來推廣時,自然而然進入了教育領域。 目前,Mootion 使用者以 social media 博主為主,教育使用者約 20%。 ”
Mootion 最初全球幾個區域進行了推廣,其中,在阿拉伯文的國家以口碑傳播的方式廣為人知。 後來,Mootion 調研得知,教師授課使用 Mootion 生成對話視頻,是因為當地老師教英語時除了教材之外,其他資料匱乏。
大洋彼岸,最近,來自美國的 AI 視頻講解產品 Knowlify 獲得了創業加速器 Y Combinator 的支援,今年夏天,該公司將從美國東南部佛羅里達州遷往美國北部的三藩市。
Knowlify 是由佛羅里達大學的學生 Ritvik Varada 、Ritam Rana、Arjun Talati 和 Jonathan Maynard 共同創立的。 該產品正將 AI 與故事講述相結合,能在幾秒鐘內將任何材料、筆記或 PDF 文件轉化為類似可汗學院風格的視頻。 這可以用於學習平臺、大學和入職培訓團隊,旨在讓學習變得更直觀、更吸引人、更易獲取。
Knowlify 既可以 to C——學生可以直接用來學習,獲得個性化的學習; 也可以 to B———學校、教育培訓或者企業培訓可以使用。
不過,多知發現,目前 Knowlify 還不能直接使用,需要加入等候名單。
此前,多知報導過斯坦福大學生們創辦的 VideoTutor,由是留學生 kai 與斯坦福大學校友 Nick 和 Jovan(毛靖文)等人創辦,這是專門針對 K12 階段開發的教育 AI 工具,一句話即可生成個人專屬教學/講解視頻。
VideoTutor 的願景是讓每個人都擁有自己專屬的 AI 導師,改變學習方式。 同樣,VideoTutor 既面向學生、家長、老師等 C 端使用者,也面向學校、教育機構等企業級使用者。
VideoTutor 是從數學、物理等理科科目切入,其所生成的視頻還原了線下老師講課的場景,有動態的圖形圖表,還有清晰地語音講解,還有文字板書,語言中文、英文等可以任意選擇。
目前,VideoTutor 已經開放使用,其正式上線一周即產生了近 2 萬的講解視頻,其可視化的方式對於理科學習很有説明。
從 VideoTutor 來看,其背後有 AI 程式設計工具、大模型、數學動畫引擎,創始人 Kai 曾告訴多知,其最大的突破是解決了元素重疊和複雜動畫渲染的問題,其視頻流暢,講解自然。
此前,多知還曾介紹過同樣由斯坦福團隊研發的 AI 教育工具 Gatekeep,也可以一句話生成教學視頻,不過,該產品已暫停更新。
多知還發現,谷歌也推出了可以生成教育視頻的實驗性產品 Sparkify,它可以生成使用者想要的科普視頻, 這種輕鬆有趣的方式比較適合低幼的小朋友們學習一些常識或者通用的知識以及百科等,滿足他們的好奇心。
不過,Sparkify 現在只有視頻 demo,使用者使用需要加入等候名單,其產品定位和功能暫未可知。
最近,總部在倫敦和巴黎的 Animaj 公司融資 8500 萬美元, 該公司藉助 AI 將部分動畫製作流程自動化了 ,並通過 AI 生產與平臺原生內容開發相結合的混合模式,將兒童 IP 轉變為全球性、多格式特許經營權。
Animaj 收購了多個數位 IP,其中,2023 年 6 月,Animaj 接手西班牙經典動畫《小 P 優優》 (Pocoyo ),該劇以其由斯蒂芬·弗萊配音的藍衣小男孩而聞名。 該動畫片是寓教於樂的形式,結合「歡笑幽默」與「探索學習」,通過日常遊戲引導兒童認知顏色、形狀、數學等基礎知識,並融入英語詞彙教學。
多知還瞭解到,波波熊科技公司也正在研發 AI 視頻產品 TalkingSpark,此前其波波熊學伴 AI 工具是圖文的方式生成百科類的只是文章,而今,TalkingSpark 希望為視頻領域或者學習領域帶來視頻解決方案。 波波熊創始人劉宇龍告訴多知:「我們通過將複雜的製作流程交由 AI 處理,它將創作者從繁瑣的技術束縛中解放出來,使創作者能夠專注於創意的核心。 ”
針對教育場景,TalkingSpark 希望可以幫助教師將複雜的歷史事件(如古羅馬的衰落)或抽象的科學概念(如人工智慧的工作原理)轉化為生動的影像教材。
可以看到,目前已經有一個非常明顯的趨勢,AI 視頻開始在教育領域有所應用。
自 Sora 出現之時,教育行業普遍認為,未來 AI 視頻的成熟應用將對教育行業起到重大變革作用。 剛剛一年半的時間,AI 視頻技術突飛猛進,垂直細分場景也有了更多可能性。
一個大背景是,這幾年,視頻逐漸成為了媒介的主流,同時,大模型到來后,視頻生產端也在革新。
2025 年,國內外廠商如 OpenAI(Sora)、谷歌(Veo 3)、快手(可靈 AI)、阿裡(通義萬相)等視頻大模型競相推出高性能模型,在視頻時長、真實感、多模態融合(如音訊同步)等方面取得突破,給應用層帶來了巨大的機會。
另一方面如愛詩科技旗下的拍我 AI(PixVerse)切入到細分場景,用戶上傳一張照片即可一鍵生成短視頻,可用於娛樂、行銷、電商、私域運營內容等場景。 而 Mootion、VideoTutor、Sparkify、Knowlify 等產品可以應用於學習場景。
值得注意的是,在垂類場景,比如在嚴肅學習方面,有很強的 Know-how,通用視頻大模型還不足以完全解決問題,這也是垂類場景 AI 視頻的價值所在。
當下,這些新興的 AI 視頻工具均可以生成學習類的視頻或者講解視頻,降低製作成本和時間,並增強學習的趣味性。 未來,還有望加入虛擬老師的講解和個人化的互動。
02 工程優化還需持續改進
各家在底層邏輯和技術上有一些區別。
從切入點來看,Mootion、Animaj 以及 TalkingSpark 並非是從教育場景切入的,而 VideoTutor、Knowlify 明確是針對 K12 群體,Sparkfiy 也提到是面向教育場景。
從功能上來看,Mootion 將電影製作流程自動化了,還提供了各個場景的模版,使用者只要給出一句話即可快速生成一段兩分鐘以內的視頻。
用 Mootion 生成視頻大致可分為三步:第一,輸入提示詞,生成“故事板”; 第二,系統對每個場景進行具體調整,如可選擇字幕、音樂、配音或特效等; 第三,視頻自動合成並輸出完整視頻。
這背後涉及從構思到腳本到分鏡到運鏡到剪輯全流程,最終給到使用者一個完整的音畫同步的視頻片段。
而 VideoTutor 和 Knowlify 也是一句話生成視頻,但更偏向於用圖文並茂的視頻方式來講解一個知識點或講解一道題,跟秘塔的“今天學點啥”有類似之處,像 PPT 的視頻化,目前幾乎不涉及分鏡頭和運鏡。
Sparkify 目前看不到具體功能,看起來有分鏡頭和運鏡,所涉及的教育場景看起來多元化,但更偏向科普。
總體而言,VideoTutor 和 Knowlify 看起來比較偏理科問題的講解,優勢在於可視化且動態的圖表,而 Mootion、Animaj、Sparkify、TalkingSpark 以及則傾向於文科類或者創意類的視頻輸出,比較考驗打磨底層專業級的視頻工作流。
值得注意的是,這些 AI 視頻產品生成的產品都可以公開發表在平臺上,使用者可以直接拿來學習,有點像“知識版的抖音”。
Animaj 則有更大的差異化:
在技術層面,Animaj 開發了專有的 GenAI 製作工具,並利用數據驅動的洞察力,通過 AI 實現動畫流程的自動化。 該流程可加快製作速度、降低成本,並使用基於人工智慧的“草圖到姿勢”預測和“中間運動”層來説明保持動畫的藝術品質。 同時,保留每個角色獨特的風格和基調。
在業務層面,Animaj 的目標是希望收購國際 IP 並將其轉化為全球特許經營權,擴大兒童 IP 的延展性。 Animaj 的首席商務官 Gregory Dray 介紹,“獨立工作室和創作者開發了大量兒童 IP,但這些 IP 的潛力尚未充分發揮。 我們希望採用現代化、平臺原生的方式,在不損害其創意 DNA 的情況下,在全球範圍內推廣這些品牌。 ”
不論是哪種形式的產品,在針對教育場景都需要更強的準確性和嚴謹性。 目前來看,大部分 AI 視頻產品在一致性和細節方面仍有待提高。
有使用者提到,VideoTutor 生成的視頻對於數學問題理解起來確實直觀,但是,在複雜問題上依然會有 bug,或者生成的視頻有線條鋸齒。
有從業者發現,Sparkify 視頻定位暫未可知,看起來很多是給孩子科普用的,但腳本中有不少術語,這對於孩子來說理解起來困難。
劉宇龍告訴多知:「目前 AI 視頻中會有一些和現實不符的錯誤,這是整個行業面臨的問題。 ”
Mootion 已經深入到教育場景之中,達到了可交付的水準,但在多知體驗的過程中發現,目前 Mootion 暫時以插畫短視頻為主,也有些微 bug,比如會出現角色形象不一致的情況。
王詠剛亦坦言 Mootion 還沒有及格,但他對未來有信心,他在接受矽星人 Pro 訪談時提到,“如果我們不相信 AI 能從今天的 50 分,最終進化到 80 分甚至 100 分,今天 99%的 AI 創業公司也都不要做了。 ”
值得一提的是,多知發現,Mootion 對教育場景進行了細化,比如有雙語故事、雙語對話、歷史啟蒙、兒童科普、睡前故事、60 秒傳記、名人名言等模版。
從產品延展性來看,VideoTutor 和 Knowlify 也會向文科方向演化,但最終目標或是 AI 老師,Mootion 這類產品的場景則會更加多元,有望應用於廣告行銷、電影、動畫等領域。
總而言之,視頻輸出更穩定、更流暢,甚至更準確,這是 AI 視頻產品共同努力的方向。
值得注意的是,投資方的要求在提高,他們在嚴格篩選產品,更傾向於有高技術壁壘或者產品打磨得更完美的產品。
有投資人告訴多知:「80分的產品的溢價能力正逐步減弱,創業者需要把產品打磨到95分,很多產品背後有許多細節需要打磨。 ”
這意味著垂類的 AI 視頻產品一方面在工程優化方面更為突出; 一方面,需要在差異化路徑上更具備獨特性,找到真正的使用者需求。
本文來自微信公眾號 「多知網」(ID:duozhiwang),作者:王上,36 氪經授權發佈。