©自象限原創(chuàng)
作者丨周乾
優(yōu)質的直播內容已經(jīng)成為各大直播間營收增長的核心驅動力,而在打造優(yōu)質直播內容的方式中,AIGC無疑是目前更具性價比和效率的方向。事實上,AI在直播間的應用也越來越深入,比如AI數(shù)字人主播、AI技術推動直播服務的優(yōu)化和升級等等。
直播行業(yè)線上化程度高,且內容質量直接決定其價值創(chuàng)造,這兩大特征使得AIGC應用在其中能夠產(chǎn)生最大化的價值,并能夠迅速滲透至核心生產(chǎn)環(huán)節(jié)。
這些聽起來讓人感覺新的增長機會近在眼前,而參差不齊、真真假假的應用能力讓人感到焦慮又躊躇——想跟上AI 浪潮,但投入了成本,真能產(chǎn)生效益嗎?哪些層面才能產(chǎn)生效益?
為此,我們深入直播行業(yè)調研,并采訪到直播行業(yè)的技術TOP廠商,將AI技術在直播行業(yè)的細分應用場景挖掘出來,供大家參考與討論——AI+直播是如何降低直播內容生產(chǎn)的成本和門檻,來賦能優(yōu)質直播內容的創(chuàng)作,提升直播內容的質量、互動性和個性化體驗。
AIGC為內容生產(chǎn)降本提效
AI技術以“低門檻、低成本、高效率”的創(chuàng)作模式賦能直播內容創(chuàng)作,已經(jīng)顯著地推動了降本增效的進程。主要體現(xiàn)在以下幾個方面:
虛擬主播生成:
AI技術可以生成虛擬主播形象和聲音,通過深度學習算法訓練模型,創(chuàng)造逼真的虛擬形象,提供新穎的直播體驗。虛擬主播可以24小時不間斷直播,不需要休息,也不受到情緒、健康等因素的影響。通過預先設定的腳本和互動話術,能夠持續(xù)吸引用戶注意力,提高直播的頻率和覆蓋度,同時減少了對真人主播的依賴,降低了成本。
直播行業(yè)TOP技術廠商即構科技目前也推出“即構數(shù)智人”產(chǎn)品,據(jù)相關產(chǎn)品負責人表示,目前的數(shù)字人技術廠商,主要是為客戶提供一個saas軟件,例如“即構數(shù)智人”平臺,通過這個軟件直接推流到第三方平臺去做直播。然后客戶在這個軟件后臺去設定所謂的“人貨場”,即開播前在后臺選擇虛擬主播、提前設定好產(chǎn)品介紹,以及可以去生成數(shù)字化的直播場景。
AI主播作為一個新型事物,目前處在發(fā)展應用的初期,平臺、商家,以及MCN等都表現(xiàn)出了擁抱探索的心態(tài)。技術的發(fā)展有一個過程,目前AI直播在互動反饋、畫面效果等方面仍然存在著短板,而技術的突破也直接決定了數(shù)字人直播的發(fā)展走向。
內容創(chuàng)作輔助:
在內容創(chuàng)作的輔助方面,主要分為視頻和音頻兩大類。
AI視頻創(chuàng)作類工具,如百度的“度加”,允許用戶輸入文案后自動匹配視頻素材和編輯,快速生成內容豐富的視頻。AI技術還可以基于熱點新聞和用戶興趣自動生成文案腳本,為創(chuàng)作者提供靈感和素材,降低創(chuàng)作門檻。還包括個性化推薦、實時彈幕處理等。
AI音頻頻創(chuàng)作類工具,AI技術在聲音創(chuàng)作方向上提供了文本配音、音色定制、智能變聲等功能,幫助創(chuàng)作者高效簡潔地完成配音工作。以即構科技的“VC音色轉換”為例,該技術可支持Any-to-One音色轉換,即將任意說話人的語音轉換為特定音色,算法可實時生成高清目標音色語音,保留原始語氣與說話韻律。
比如,主播想把自己的語音轉換為蠟筆小新的聲音,就可以在直播過程中實時換上蠟筆小新的聲音,等于是給自己的聲音換上“新皮膚”,立即調動起直播間的氛圍。
另外,AI為直播間的運營也提供極大助力,比如內容分析、推薦等,此環(huán)節(jié)與直播內容創(chuàng)作不直接相關,在此不做深入討論。
AI技術優(yōu)化帶來內容質量提升
越來越多的直播間通過AI技術來優(yōu)化直播內容質量,保護用戶體驗,從而留住更多用戶。從內容生產(chǎn)來說(不包含運營環(huán)節(jié)),主要是兩個方向:
首先是AI技術優(yōu)化直播的清晰度和流暢度。
比如,在直播、1V1視頻聊天中,外界環(huán)境“不友好”比如光線暗的時候,主播視頻畫面清晰度低,容易有噪點,粉絲的觀感體驗就很差,畫面“又黑又糊”,很容易就喪失耐心,退出直播間。
而通過AI技術,比如即構科技“AI畫質增強算法”,能夠在光線暗的環(huán)境下,對主播開播視頻畫面進行“調色”:拉高亮度、飽和度、降低視頻噪點,提升直播畫面質感,相當于一個智能、實時的“調色插件”,這樣以來,觀看直播的用戶對于直播間的好感度也會提高。
其次是直播技術創(chuàng)新方面,如AI輔助的綠幕技術、虛擬背景、AI降噪等,為直播帶來新的視聽效果。
直播三要素“人、貨、場”中,直播間是否具備足夠有創(chuàng)意、足夠氛圍感、足夠引發(fā)觀眾”沖動消費“的場景,對于整場直播的銷售效果有著直接的影響。因此各大直播間或者直播平臺都選擇用虛擬場景直播,用相比實景更加具有創(chuàng)意和吸睛的方式來撬動流量。
即構科技相關產(chǎn)品負責人反饋,一款綠幕應用(用于綠幕直播間實時換背景),在接入即構綠幕摳圖技術后,半年內新增5萬用戶(也就是主播);23年下半年,該綠幕軟件結合直播機一起售賣,目前已經(jīng)新增近2千用戶,今年預計將達到1萬用戶增量。
近10倍的效益增長足以顯示出直播市場對于直播摳綠幕換背景的需求,我們也看到,越先使用AI+直播技術的,也越先收獲了效益。
另外,在直播場景中,主播在做外景直播時,常常有不確定的噪音“亂入”,嚴重影響用戶聽感,甚至會讓用戶離開直播間。此時,主播通常選擇降噪,但一般降噪技術,在降低噪音的同時,也會損傷音樂聲音。假如主播表演個彈唱,降噪技術直接就把音樂伴奏識別為噪音,一并消除了大部分,別說普通用戶的聽感不舒適,對于熱愛音樂的用戶簡直是一種折磨……
對此,即構科技針對性地推出了“場景化AI降噪”,在消除環(huán)境噪音的同時,還能保障純凈音樂伴奏聲。并且能根據(jù)不同的直播環(huán)境(戶外噪音環(huán)境&音樂演奏場景),智能調整最佳降噪策略——如果是戶外噪音,沒有音樂演唱,AI降噪將啟動消噪,保障優(yōu)質人聲;如果環(huán)境里有音樂伴奏,AI降噪將自動識別音樂伴奏,降噪同時,保留人聲和純凈音樂。如此,主播無論在怎樣的環(huán)境開播,無需手動操作,AI降噪都能實時保護主播人聲和音樂的最佳音質,保證用戶最舒適的聽感。
另外,AI技術還通過內容水印、內容指紋識別、監(jiān)測與屏蔽技術等,保護直播內容的版權,減少盜版風險。
AI技術不僅提高了直播內容創(chuàng)作的效率和質量,還為直播平臺和創(chuàng)作者提供了更多的創(chuàng)新可能性和商業(yè)機會。可以預見的是,隨著AI技術的不斷進步,未來直播內容創(chuàng)作將變得更加智能化、個性化和互動化。
AI 能發(fā)揮的“降本增效”的作用,無非是對勞動力的“替代”,而非“超越。但AI未來的發(fā)展速度將比我們想象的更快,對直播內容創(chuàng)作的賦能或許也很快就將從“降本增效”轉變?yōu)?ldquo;不可替代的全新生產(chǎn)方式”。積極擁抱AIGC,不僅僅是企業(yè)降本增效的手段,而是跟上時代發(fā)展腳步的基礎門檻。
從最早的工業(yè)革命開始,任何一種技術的發(fā)展,都是通過工具賦能,來增強人本身的能力,從而降低社會發(fā)展對專業(yè)人才的依懶性。讓不會織布的工人通過紡紗機就能進行織布作業(yè)、讓不會除草的居民通過割草機也能輕松修剪草坪,而AIGC也同樣是一種工具賦能,讓不會繪畫的人可以制作出精美的圖片、讓文筆不好的人可以撰寫出優(yōu)秀的文本。
新技術改變人類生產(chǎn)和生活方式的同時,也催生生產(chǎn)關系的改變。蒸汽機和內燃機的問世,為汽車的誕生奠定了基礎,但這僅僅是個開始。汽車真正成為改變世界的驅動力,是亨利·福特引入的流水線生產(chǎn)方式——一場關于生產(chǎn)關系的變革。從此汽車實現(xiàn)大規(guī)模生產(chǎn),價格變得親民,走進尋常百姓家,成為推動社會經(jīng)濟轉型的強大引擎。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
我覺得我們AI的目標是:從芯片設計到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達造車、國產(chǎn)開車26年國產(chǎn)芯片會在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會以軟件彌補硬件不足,所以訓練和推理分開,訓練就
文/道哥在深陷“后門”風波、接受網(wǎng)信辦問詢之后,英偉達的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達已悄然向其關鍵供應商——包括負責封裝的安靠科技、供應高帶寬內存的三星電子、以及承擔后端處理的富士康發(fā)出指令,要求暫停所有與H20AI
文/二風來源/節(jié)點財經(jīng)一場關于“中國芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請。作為中國半導體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達背景、高達80億元人民幣的募資雄心,以及在國產(chǎn)GPU領域取
技術的進步永無止境,繼創(chuàng)下TPC-C性能&性價比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫再度實現(xiàn)關鍵突破。9月24日杭州云棲大會上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術的PolarDB數(shù)據(jù)庫專用服務器。在原有RDMA網(wǎng)絡的基礎上,Polar
2025年9月24日,在杭州舉辦的云棲大會上,阿里云正式發(fā)布全新一代服務器操作系統(tǒng)AlibabaCloudLinux4(簡稱Alinux4)。Alinux4基于Linux6.6內核打造,是首個全面遵循龍蜥社區(qū)“開源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開源社區(qū)生態(tài),更針對阿里云最新9代ECS
9月24日,杭州云棲大會技術主論壇上,阿里云重磅發(fā)布AI安全護欄,提供五項核心安全能力,護航AI安全。一方面為客戶提供融入AIAgent開發(fā)全鏈路的原生安全防護,另一方面持續(xù)用AI賦能安全產(chǎn)品智能化升級,打造Agentic-SOC安全運營,提升安全威脅檢測和響應效率。在過去的一年,AIAgent正在
9月24日,魔搭社區(qū)舉辦了“全球協(xié)作?科學突破?創(chuàng)意無限”的專題論壇,并發(fā)布魔搭社區(qū)國際版、科學智能專區(qū)與AIGC創(chuàng)作引擎FlowBench,旨在連接全球開發(fā)者、加速科研范式創(chuàng)新、賦能創(chuàng)意表達。自2022年11月初成立至今,魔搭社區(qū)已成長為中國最大AI開源社區(qū),其模型數(shù)量已突破10萬,服務了全球20
9月24日,2025云棲大會現(xiàn)場,阿里云CTO周靖人接連發(fā)布了七款大模型技術產(chǎn)品。七款技術產(chǎn)品覆蓋語言、語音、視覺、多模態(tài)、代碼等模型領域,在模型智能水平、Agent工具調用以及Coding能力、深度推理、多模態(tài)等方面均實現(xiàn)突破。在大語言模型中,阿里通義旗艦模型Qwen3-Max全新亮相,性能超過G
9月24日,阿里云在云棲大會上宣布新一輪全球基礎設施擴建計劃:將在巴西、法國和荷蘭首次設立云計算地域節(jié)點(region),并將擴建墨西哥、日本、韓國、馬來西亞和迪拜的數(shù)據(jù)中心,以便更好服務全球客戶日益增長的AI和云計算需求。目前,阿里云在全球29個地區(qū)運營91個可用區(qū),是中國最大、亞太第一的云服務商