還在玩只限于人臉的AR玩法嗎?一鍵美體塑形、視頻體感游戲、用手機(jī)就能玩虛擬形象全身驅(qū)動(dòng)……隨著5G即將全面普及以及智能圖形技術(shù)的不斷創(chuàng)新,原本受限于高端硬件的全身AR技術(shù),現(xiàn)在用智能手機(jī)就能玩,視頻AR玩法也將全面進(jìn)入了全身時(shí)代。
相芯科技此次對(duì)人體AI技術(shù)進(jìn)行全面升級(jí),在視頻AR特效的功能基礎(chǔ)上進(jìn)行玩法升級(jí),同時(shí)新增開(kāi)放7大功能的算法接口,分別是2D人體關(guān)鍵點(diǎn)、3D人體骨骼、人像分割、頭部分割、頭發(fā)分割、動(dòng)作識(shí)別、手勢(shì)識(shí)別。每項(xiàng)技術(shù)革新背后都能帶來(lái)新的應(yīng)用層的火花,相芯更新的技術(shù)效果到底如何,一起來(lái)看下吧。
打開(kāi)APP 閱讀最新報(bào)道一、2D人體關(guān)鍵點(diǎn)
通過(guò)2D人體關(guān)鍵點(diǎn)算法接口,實(shí)現(xiàn)人體全身2D關(guān)鍵點(diǎn)的跟蹤效果,點(diǎn)位準(zhǔn)確性高,即使做大幅度動(dòng)作、遮擋以及轉(zhuǎn)身的情況下,也能準(zhǔn)確穩(wěn)定跟蹤。同時(shí)針對(duì)用戶在短視頻、直播拍攝時(shí)的自拍場(chǎng)景,2D人體關(guān)鍵點(diǎn)還提供半身模式的點(diǎn)位跟蹤,這樣用戶在單手持手機(jī)自拍的情況下,也能準(zhǔn)確定位人體數(shù)據(jù)。
在高精度的人體關(guān)鍵點(diǎn)模型的基礎(chǔ)上,對(duì)視頻中的人物實(shí)現(xiàn)全身美體功能,是這項(xiàng)技術(shù)比較熱門(mén)的應(yīng)用場(chǎng)景。相芯的技術(shù),可以從瘦身、長(zhǎng)腿、細(xì)腰、美肩、美臀、小頭、瘦腿等七個(gè)美化維度,對(duì)人物的身體進(jìn)行精細(xì)化調(diào)整,從而達(dá)到一件瘦身塑形的作用。
二、3D人體骨骼
相芯科技開(kāi)放的3D人體骨骼的算法接口,主要應(yīng)用于基于3D關(guān)鍵點(diǎn)和3D骨骼,實(shí)現(xiàn)3D虛擬形象的全身驅(qū)動(dòng)。這項(xiàng)技術(shù)不依賴于深度攝像頭,只需要手機(jī)的普通攝像頭就能獲得視頻中的人體3D骨骼數(shù)據(jù),即使人物做大幅度的動(dòng)作、有動(dòng)作遮擋、轉(zhuǎn)身等情況都能穩(wěn)定跟蹤。除了身體軀干動(dòng)作,在手指細(xì)節(jié)上,也能識(shí)別和跟蹤常見(jiàn)的14種手勢(shì)。讓3D虛擬形象能夠更細(xì)膩地復(fù)原人物的動(dòng)作。同樣針對(duì)他人拍攝和自拍兩種拍攝場(chǎng)景,相芯提供全身和半身兩種模式,支持3D人體骨骼數(shù)據(jù)的輸出。
三、人像分割
通過(guò)人像分割的算法接口,可對(duì)輸入的視頻進(jìn)行內(nèi)容理解,將人物進(jìn)行高精分割解析,將人像區(qū)域分離出來(lái),并實(shí)時(shí)追蹤。例如視頻直播過(guò)程中,識(shí)別用戶的人體輪廓,為人物實(shí)時(shí)替換各種背景特效。也可以與各具創(chuàng)意的人體AR貼紙相結(jié)合,讓貼紙實(shí)時(shí)跟隨人體移動(dòng),貼紙素材與人體的前后位置關(guān)系可靈活定義,可以充分發(fā)揮運(yùn)營(yíng)者的互動(dòng)創(chuàng)意,為用戶帶來(lái)更加豐富的娛樂(lè)體驗(yàn)。
四、頭部分割
通過(guò)頭部分割接口,企業(yè)和開(kāi)發(fā)者可以對(duì)人物頭部區(qū)域做更多的特效創(chuàng)意。例如搞笑大頭玩法特效,可以實(shí)現(xiàn)視頻中的人物頭部放大的萌態(tài)效果。這項(xiàng)技術(shù)還能和其他技術(shù)進(jìn)行組合實(shí)現(xiàn)更加新穎的玩法效果。比如將頭部分割和表情系數(shù)結(jié)合,即可用特點(diǎn)的表情,觸發(fā)大頭效果,并用表情的夸張程度來(lái)實(shí)時(shí)控制頭部的放大程度。用頭部分割+哈哈鏡+AR貼紙這樣的技術(shù)組合,就可以實(shí)效惡搞版的效果,充分發(fā)揮腦洞創(chuàng)意。
五、頭發(fā)分割
通過(guò)頭發(fā)分割接口,可以在視頻和照片中人物的頭發(fā)區(qū)域高精度地分離出來(lái),可以給頭發(fā)切換各種各樣的顏色,可以是純色,也可以是漸變色,實(shí)現(xiàn)一鍵換發(fā)色的特效。同時(shí)頭發(fā)的色值支持自定義,并可以進(jìn)行上色程度的調(diào)整,實(shí)現(xiàn)想要的發(fā)色,想換就換。
六、動(dòng)作識(shí)別
相芯科技的動(dòng)作識(shí)別接口,能夠支持15種全身動(dòng)作的識(shí)別。將動(dòng)作識(shí)別和匹配算法相結(jié)合,可以開(kāi)發(fā)出各種體感小游戲,比如“尬舞機(jī)”游戲,跟著屏幕的動(dòng)作提示即可開(kāi)始跳舞了。同時(shí)動(dòng)作識(shí)別也可以與AR貼紙相結(jié)合,用特定動(dòng)作來(lái)觸發(fā)貼紙?zhí)匦?充分發(fā)揮體感互動(dòng)的娛樂(lè)性。
七、手勢(shì)識(shí)別
通過(guò)手勢(shì)識(shí)別接口,可精準(zhǔn)識(shí)別常見(jiàn)的14種手勢(shì)動(dòng)作。在短視頻直播領(lǐng)域,用戶在拍視頻和拍照過(guò)程中,可以通過(guò)手勢(shì)動(dòng)作來(lái)觸發(fā)各種貼紙?zhí)匦?從而衍生出創(chuàng)意視頻的各種玩法。同時(shí),在智能設(shè)備領(lǐng)域,比如智能家電、智能機(jī)器人、可穿戴設(shè)備、智能互動(dòng)大屏等智能硬件,可以實(shí)現(xiàn)用手勢(shì)控制對(duì)應(yīng)的功能。用戶在不接觸設(shè)備的情況下,通過(guò)簡(jiǎn)單的手勢(shì),就能實(shí)現(xiàn)對(duì)設(shè)備的交互和控制,讓人機(jī)交互方式更加智能化、自然化。
相芯科技專注于人工智能和計(jì)算機(jī)圖形學(xué)的融合與創(chuàng)新,致力于為消費(fèi)級(jí)應(yīng)用提供內(nèi)容創(chuàng)作工具、平臺(tái)和解決方案。相芯科技的人臉人體AI解決方案目前已累計(jì)服務(wù)700多家B端客戶,產(chǎn)品被廣泛應(yīng)用于短視頻、直播、社交、游戲、智能家居、在線教育、廣告營(yíng)銷、新零售等領(lǐng)域,月均調(diào)用量達(dá)40億。
此次的人體AI SDK大更新,相芯針對(duì)不同體驗(yàn)需求推出了兩個(gè)版本的體驗(yàn)demo,分別是特效版和算法版demo。
【特效版demo】模擬真實(shí)的用戶應(yīng)用場(chǎng)景,提供技術(shù)的功能演示和體驗(yàn),可以在這個(gè)demo里面直觀體驗(yàn)美顏、美妝、道具貼紙、Animoji、美發(fā)、輕美妝、AR面具、搞笑大頭、海報(bào)換臉、表情識(shí)別、音樂(lè)濾鏡、哈哈鏡、美體、全身Avatar、動(dòng)作識(shí)別、人像分割、手勢(shì)識(shí)別等功能。
同時(shí)針對(duì)開(kāi)發(fā)者用戶,為了能更好地體驗(yàn)各個(gè)功能接口在算法層的效果,相芯全新推出【算法版demo】,使用這個(gè)demo就能直觀地看到各種人體關(guān)鍵點(diǎn)、人體骨骼、mask類功能的算法效果,便于進(jìn)一步開(kāi)發(fā)使用。目前開(kāi)放的接口為2D人體關(guān)鍵點(diǎn)、3D人體骨骼、人像分割、頭部分割、頭發(fā)分割、動(dòng)作識(shí)別、手勢(shì)識(shí)別。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
2023年7月6日,第六屆世界人工智能大會(huì)(WAIC2023)在上海開(kāi)幕,“人工智能大模型”是本屆大會(huì)的備受矚目的話題,據(jù)悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領(lǐng)軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊(duì)”,云天勵(lì)飛作為中國(guó)人工智能企業(yè)的杰出代表,和互聯(lián)網(wǎng)大廠、運(yùn)營(yíng)商、科研院所等優(yōu)秀團(tuán)隊(duì)
這幾個(gè)月來(lái),以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經(jīng)沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個(gè)名詞重回C位。過(guò)去在AI1.0時(shí)代,主要通過(guò)訓(xùn)練模型來(lái)實(shí)現(xiàn)圖像識(shí)別、聲音識(shí)別、語(yǔ)言處理等特
文:互聯(lián)網(wǎng)江湖作者:志剛2023年的IoT需要一個(gè)新故事。6月29日,涂鴉智能在開(kāi)發(fā)者大會(huì)上,發(fā)布了企業(yè)級(jí)戰(zhàn)略PaaS2.0,希望通過(guò)一個(gè)平臺(tái)+四大開(kāi)發(fā)服務(wù),建立起IoT生態(tài)。對(duì)于這場(chǎng)發(fā)布會(huì),市場(chǎng)的態(tài)度是積極的。美東時(shí)間6月29日收盤(pán),涂鴉智能美股股價(jià)上漲5.6%,來(lái)到1.87美元/股。近日股價(jià)穩(wěn)定
美團(tuán)曾經(jīng)的二號(hào)人物王慧文對(duì)標(biāo)OpenAI的創(chuàng)業(yè)項(xiàng)目光年之外,以20億賣(mài)給美團(tuán),再度引發(fā)市場(chǎng)對(duì)大模型的熱議。
2020年底,王慧文在朋友圈寫(xiě)下這句話時(shí),外界本以為這位伴隨中國(guó)互聯(lián)網(wǎng)發(fā)展而持續(xù)創(chuàng)業(yè)20年的人物即將告別創(chuàng)業(yè)舞臺(tái)。但是,一個(gè)曾經(jīng)多次創(chuàng)業(yè),正值壯年的互聯(lián)網(wǎng)老將心中的創(chuàng)業(yè)熱情是難以熄滅的。
阿里媽媽、巨量引擎、騰訊廣告,誰(shuí)是當(dāng)代“AI印鈔機(jī)”?
Manus撕開(kāi)一道真相
文/八真來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)具身智能賽道,誰(shuí)最有可能拔得A股資本市場(chǎng)的頭籌?答案大概率是誕生剛剛兩年,由華為"天才少年"、B站百萬(wàn)粉絲科技UP主稚暉君(彭志輝)創(chuàng)立的智元機(jī)器人。近期,從事新材料研發(fā)與生產(chǎn)的上緯新材(688585.SH)丟出重磅炸彈,宣布智元機(jī)器人及相關(guān)主體將通過(guò)收購(gòu)其至少63.62%的股
文/道哥大舉裁員、清空賬號(hào)、國(guó)內(nèi)IP無(wú)法訪問(wèn)——曾被譽(yù)為“中國(guó)AIAgent希望之星”的Manus,在估值飆至5億美元的高光時(shí)刻“閃離”中國(guó)市場(chǎng)。近日,Manus“裁員、出走”的消息在媒體端大量發(fā)酵。消息稱,Manus公司總部將由中國(guó)遷至新加坡,其國(guó)內(nèi)團(tuán)隊(duì)也將大幅裁撤——原有120人規(guī)模團(tuán)隊(duì)除40余
四個(gè)月前邀請(qǐng)碼炒至10萬(wàn)元,如今官網(wǎng)變灰、社交賬號(hào)清空,這家AI新貴的閃電遷移折射中國(guó)科技企業(yè)出海潮涌。7月11日,打開(kāi)Manus官網(wǎng)的用戶發(fā)現(xiàn)一則突兀提示:“Manus在你所在的地區(qū)不可用”。而就在不久前,這個(gè)位置還顯示著“Manus中文版本正在開(kāi)發(fā)中”的樂(lè)觀聲明。同時(shí),Manus官方微博和小紅書(shū)
文/十界來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)一場(chǎng)圍繞算力自主的競(jìng)賽,正在科創(chuàng)板上演。近日,國(guó)產(chǎn)全功能GPU廠商摩爾線程遞交科創(chuàng)板招股書(shū),擬募資約80億人民幣,成為今年上半年科創(chuàng)板擬募資規(guī)模最大的沖刺者,也打響了“國(guó)產(chǎn)英偉達(dá)”上市的第一槍。據(jù)招股書(shū)顯示,摩爾線程自2020年成立以來(lái),主營(yíng)全功能GPU芯片的研發(fā)與銷售,以自主
“AI大模型六小虎”百川智能危機(jī)重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵:(1)拿下河北(2)學(xué)習(xí)科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的
百度AI團(tuán)隊(duì)今日正式推出PaddleOCR3.1版本,以突破性的多語(yǔ)言組合識(shí)別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級(jí)標(biāo)志著OCR領(lǐng)域首次實(shí)現(xiàn)對(duì)同一文檔內(nèi)任意混合語(yǔ)言文本的精準(zhǔn)識(shí)別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場(chǎng)