2025年8月11日,昆侖萬維宣布啟動一場覆蓋五大技術(shù)領(lǐng)域的SkyWork AI技術(shù)發(fā)布周,8月11日至8月15日,每天將發(fā)布一款新模型,從視頻生成模型(Skyreels)、世界模型,到生圖一體化模型、智能體(Agent)模型,再到AI音樂創(chuàng)作模型(Mureka),連續(xù)五天發(fā)布覆蓋多模態(tài)AI核心場景的前沿模型,集中展示技術(shù)突破的最新成果。
這標(biāo)志著昆侖萬維AI技術(shù)全面邁入商業(yè)化應(yīng)用階段。前期重投入的研發(fā)成果加速轉(zhuǎn)化為產(chǎn)品矩陣,技術(shù)變現(xiàn)飛輪高效運轉(zhuǎn)。
技術(shù)周首日,全球首個支持分鐘級長視頻生成的音頻驅(qū)動模型Skyreels-A3正式亮相。該模型通過四大技術(shù)創(chuàng)新錨定直播電商萬億市場痛點,可實現(xiàn)長視頻連貫生成、影視級運鏡控制與自然動作交互,為全球內(nèi)容創(chuàng)作產(chǎn)業(yè)提供新一代技術(shù)基石。
技術(shù)突破:構(gòu)建多模態(tài)協(xié)同的生成范式
傳統(tǒng)視頻生成技術(shù)受限于誤差累積效應(yīng),面臨長視頻畫面崩壞與動作僵硬的行業(yè)瓶頸。模型Skyreels-A3的創(chuàng)新在于構(gòu)建了多模態(tài)協(xié)同的生成范式,保證了畫面的一致性,基于DiT視頻擴散模型框架構(gòu)建,通過三路輸入處理系統(tǒng)實現(xiàn)文本、圖像與音頻的深度融合,突破了誤差控制機制,創(chuàng)新采用分段插幀策略,通過確定起始幀和終止幀生成視頻片段,并取用尾幀作為插幀監(jiān)督信號,成功將180秒長視頻的畫面穩(wěn)定度控制在較高值,徹底解決行業(yè)頑疾。
在藝術(shù)創(chuàng)作的高階美感表達(dá)維度,模型首創(chuàng)基于ControlNet的鏡頭控制模塊,支持固定鏡頭、推鏡、拉鏡、左搖、右搖、抬升、下降、手持鏡頭等8種運鏡參數(shù),且強度可自由連續(xù)調(diào)節(jié)。該技術(shù)使非專業(yè)用戶也能精準(zhǔn)控制鏡頭語言,這種能力源自對影視鏡頭物理軌跡的數(shù)學(xué)建模,顯著提升直播帶貨場景的真實性,同時也可以提升音樂MV、電影片段的藝術(shù)表現(xiàn)力。
針對直播帶貨等交互場景中,效果不夠逼真的痛點,模型通過DPO算法優(yōu)化手部動作自然度,驅(qū)動生成效果逼近真人表現(xiàn),該技術(shù)通過分析大量真實交互數(shù)據(jù),建立動作-商品-語音的跨模態(tài)關(guān)聯(lián)。
效率突破同樣令人矚目。模型Skyreels通過Step蒸餾技術(shù),將推理步數(shù)從40步壓縮至4步,畫面質(zhì)量保持率超98%,使視頻生成時間縮短至80秒,大幅降低創(chuàng)作者硬件門檻。人工盲測進(jìn)一步驗證其優(yōu)勢:在帶貨場景中,在觀眾盲測中,89%的人認(rèn)為模型Skyreels呈現(xiàn)的動作效果比競品更真實自然,動作自然性和面部穩(wěn)定性評分這兩項關(guān)鍵指標(biāo)均居行業(yè)首位。
商業(yè)化潛力:撬動萬億市場的創(chuàng)作革命
2023年以來,昆侖萬維“All in AGI與AIGC”戰(zhàn)略全面落地,實現(xiàn)了從技術(shù)研發(fā)到產(chǎn)品商業(yè)化的轉(zhuǎn)變,并獲得了用戶廣泛的認(rèn)可。
據(jù)悉,昆侖萬維推出的短劇平臺DramaWave年化流水達(dá)1.2億美元,AI音樂產(chǎn)品模型Mureka年化流水1200萬美元,AI社交產(chǎn)品Linky單月收入突破100萬美元。與此同時,Linky社交平臺300萬月活用戶形成創(chuàng)作者孵化池,Opera廣告系統(tǒng)實現(xiàn)精準(zhǔn)投放,這種“創(chuàng)作-分發(fā)-變現(xiàn)”閉環(huán)推動毛利率維持在73.6%高位,為昆侖萬維AI技術(shù)持續(xù)創(chuàng)新提供動能。
昆侖萬維2025年Q1財報數(shù)據(jù)顯示,經(jīng)營性現(xiàn)金流凈額增長58.3%,顯然,2024年15.4億元的研發(fā)投入正持續(xù)轉(zhuǎn)化為營收增長動能。這驗證了AI技術(shù)商業(yè)化的可持續(xù)性,使昆侖萬維成為國內(nèi)首個跑通“研發(fā)投入——產(chǎn)品變現(xiàn)——現(xiàn)金流反哺”閉環(huán)的AI企業(yè)。
當(dāng)模型SkyReels賦能錨定直播電商領(lǐng)域電影制作、虛擬直播、游戲開發(fā)與教育內(nèi)容創(chuàng)作,顯著降低多角色 視頻制作門檻,讓個性化、交互式內(nèi)容的創(chuàng)作前所未有的高效與便捷。,昆侖萬維技術(shù)周未來幾日發(fā)布的其他模型也將各自開辟多元戰(zhàn)場,五大模型正編織一張覆蓋全球市場的商業(yè)化網(wǎng)絡(luò)。
從單點突破到生態(tài)賦能,昆侖萬維以可驗證的商業(yè)化效率與全球化布局能力,宣告中國AI企業(yè)首次跑通規(guī)模化盈利路徑。技術(shù)周的五大模型,恰是這場變革的序章——當(dāng)技術(shù)飛輪與商業(yè)飛輪同頻轉(zhuǎn)動,昆侖萬維的營收增長故事,才剛剛開始。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!