1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 人工智能
  4. 正文

聲音鑒黃師飽受摧殘,AI聲音鑒黃師為何沒幫上忙?

 2018-09-26 14:11  來源:A5專欄  我來投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

文|雷宇

來源|智能相對(duì)論(aixdlun)

人民對(duì)性的態(tài)度向來很奇怪,父母和長(zhǎng)輩期待子女能無師自通,教育者三緘其口,最后少男少女通過其他渠道實(shí)現(xiàn)了對(duì)性的初級(jí)摸索,當(dāng)然這個(gè)摸索過程就很曲折了,文字,圖片,視頻和音頻遍地開花,“學(xué)習(xí)資料”越來越方便傳播。

食也性也,但傳播色情內(nèi)容卻有極大的負(fù)外部效應(yīng),懵懂少男少女極易受其蠱惑,鑒黃師的重要性可想而知。在蘋果商店的社交App中,有超過1/10的應(yīng)用主打聲音社交功能,由此催生出了一個(gè)新興職業(yè)——聲音鑒黃師。聲音鑒黃師是一個(gè)讓身心飽受摧殘的職業(yè),一位女性聲音鑒黃師稱,“一個(gè)人平均一天需要鑒定4000條信息,24小時(shí)輪班監(jiān)控,各種葷段子、曖昧語音,有時(shí)(聽到)惡心想吐。”

聲音鑒黃師是一份不足以為外人道也的工作

由于這份工作實(shí)在是太過于枯燥,很多男生都受不了,因此聲音鑒黃師多為女性且離職率高。一般枯燥且重復(fù)率高的工作都是AI的拿手好戲,那么AI有沒有辦法實(shí)現(xiàn)聲音鑒黃呢?

聲音鑒黃之殤,AI難以克服雞尾酒效應(yīng)

視頻,圖片和語音是色情內(nèi)容常見的三種形式,多數(shù)公司的鑒黃都是立足于視頻和圖片,比如阿里的阿里綠網(wǎng)、騰訊的萬象優(yōu)圖等等。有人可能會(huì)疑問,這幾年科大訊飛、百度、騰訊等公司先后對(duì)外公布語音識(shí)別準(zhǔn)確率均達(dá)到“97%”,那為什么在AI語音鑒黃上那么難?

這是因?yàn)樯缃黄脚_(tái)的語音環(huán)境十分復(fù)雜,機(jī)器很難從龐大雜亂的語音中揪出涉黃涉暴人員,而這就不得不提雞尾酒效應(yīng)了。所謂雞尾酒效應(yīng)是指,在雞尾酒會(huì)嘈雜的人群中,盡管周圍噪聲很大,兩人可以順利交談,你們似乎聽不到談話內(nèi)容以外的各種噪音。這是因?yàn)槲覀兊拇竽X對(duì)聲音都進(jìn)行了某種程度的預(yù)判,然后才決定聽或不聽。

用特瑞斯曼的注意衰減理論來解釋就是,當(dāng)人的聽覺注意集中于某一事物時(shí),意識(shí)將一些無關(guān)聲音刺激排除在外,而無意識(shí)卻監(jiān)察外界的刺激,一旦一些特殊的刺激與己有關(guān),就能立即引起注意的現(xiàn)象。

但是機(jī)器卻不具備這樣意識(shí)和無意識(shí),因此難以實(shí)現(xiàn)在嘈雜環(huán)境下的語音識(shí)別,這樣看來AI語音鑒黃貌似已經(jīng)走進(jìn)了死胡同。

實(shí)際上,已有公司在解決雞尾酒效應(yīng)上做出了努力。今年4 月,Google曾在博客上發(fā)文稱,谷歌研究人員開發(fā)出了一種深度學(xué)習(xí)系統(tǒng),可識(shí)別和分離出嘈雜環(huán)境中的個(gè)體聲音。

研究人員從YouTube上10萬段“講座和談話”視頻中提取了近2000小時(shí)的視頻片段,然后混合音頻與人工背景噪聲,創(chuàng)造“雞尾酒派對(duì)”。訓(xùn)練技術(shù)人員將混合音頻進(jìn)行拆分,谷歌的系統(tǒng)能夠分辨出哪個(gè)音頻源在給定的時(shí)間內(nèi)屬于哪張人臉,并為每個(gè)揚(yáng)聲器創(chuàng)建單獨(dú)的語音軌跡。

但Google的技術(shù)集中在視頻處理上,主要是對(duì)數(shù)段聲音的分離,而人工聲音鑒黃僅僅依靠聲音,有所不同。前不久,阿里AI語音反垃圾服務(wù)上線公測(cè),它可以通過聲紋識(shí)別技術(shù),識(shí)別語音中存在的涉黃、廣告等違規(guī)信息,不管是中日英俄等語言,還是東北,四川,廣東的方言,甚至連無意義的呻吟聲都可以輕松判別。

具體辦法是,對(duì)那些有語義的內(nèi)容,系統(tǒng)先將語音識(shí)別轉(zhuǎn)成文字,然后再將這些文字跟文本反垃圾模型或關(guān)鍵詞庫比對(duì),判斷是否涉黃,對(duì)那些無語義的聲音,通過聲紋也能識(shí)別出來。但有一點(diǎn)值得注意的是,在語音識(shí)別的過程中,識(shí)別是哪種語言比內(nèi)容更難,機(jī)器翻譯也存在這樣的問題,因此還需要大量數(shù)據(jù)來進(jìn)行訓(xùn)練學(xué)習(xí)。

做好嘈雜環(huán)境的語音識(shí)別,難點(diǎn)是如何將雜音與人聲分離。但對(duì)于聲音鑒黃而言,一開始并不知道哪一個(gè)音源涉黃,很難說誰是噪音,這需要機(jī)器具有全局觀。而上面提到的技術(shù),聲音分離或者將語音識(shí)別轉(zhuǎn)成文字都只是基本,由于尚未在語音復(fù)雜的環(huán)境下試驗(yàn)過,因此這個(gè)結(jié)果嘛……退一萬步講,社交黑話也并不是那么好破譯的。

社交黑話難解,語音識(shí)別障礙重重

時(shí)代要拋棄你,它只會(huì)讓你看不懂,而我們也不能指望人工智能聽懂。

就像你爹媽當(dāng)初看不懂你的那句簽名:”ァ亊實(shí)證明,鱤綪桱淂起fеηɡ雨,卻桱囨起平啖;伖綪桱淂起平啖,卻桱囨起fеηɡ雨。ヤ”(沒亂碼),新一代社交黑話崛起一般人也很難看懂,比如XSWL(笑死我了,相當(dāng)于一連串哈哈哈),NSS(暖說說,指幫點(diǎn)贊評(píng)論轉(zhuǎn)發(fā)說說,增進(jìn)感情),CQY(處Q友的縮寫,想在QQ上找朋友的意思)。

當(dāng)然這也還算好的,無非就是縮寫。除了縮寫,還有一些只能強(qiáng)記的詞語。比如養(yǎng)火(互發(fā)消息三天出現(xiàn)小火花,互發(fā)消息超過三十天出現(xiàn)大火花,養(yǎng)火就是經(jīng)常聯(lián)系的意思),歐洲(想要什么就得到什么的人)……

估計(jì)研究人員在錄入數(shù)據(jù)時(shí)就陣亡了,畢竟這玩意看上去也不算有章可循。值得注意的是,當(dāng)人們?cè)谡f話的時(shí)候,如果省略一兩個(gè)字不說,懂得的人自然也懂,但機(jī)器不一定能識(shí)別人們甚至為了混淆視聽,會(huì)多語夾雜,這就給機(jī)器識(shí)別增添了難度。

這種輸入標(biāo)準(zhǔn)的不統(tǒng)一,是導(dǎo)致語音識(shí)別錯(cuò)誤率高的首要原因。我們常用的鼠標(biāo)和鍵盤雖然看似簡(jiǎn)單,但它具備統(tǒng)一的輸入標(biāo)準(zhǔn)和精準(zhǔn)的視覺反饋這兩點(diǎn),而這正是語音識(shí)別技術(shù)不具備的,也是困擾現(xiàn)階段AI鑒黃的一大挑戰(zhàn)。

毫不意外,現(xiàn)階段的聲音鑒黃師依然是以人為主。早在互聯(lián)網(wǎng)發(fā)展早期,黃色內(nèi)容主要是圖片和文字,靠人工就可以凈化網(wǎng)絡(luò)環(huán)境的目的,但是隨著互聯(lián)網(wǎng)帶來的數(shù)據(jù)爆炸,人工已經(jīng)遠(yuǎn)遠(yuǎn)不能勝任。

雖然聲音鑒黃以人為本,但這并不意味著AI鑒黃師沒有價(jià)值。它能在特定的場(chǎng)景實(shí)現(xiàn)鑒定也無疑算是一種進(jìn)步,而現(xiàn)階段它所呈現(xiàn)的問題,也無疑是技術(shù)發(fā)展過程中難以避免的陣痛。

全球經(jīng)濟(jì)學(xué)家和咨詢公司的主流研究課題,總少不了人工智能會(huì)引發(fā)的失業(yè)規(guī)模,但是中國(guó)的互聯(lián)網(wǎng)已經(jīng)跑出了一條獨(dú)特的路線,因此針對(duì)中國(guó)的研究少之又少。聲音鑒黃師作為互聯(lián)網(wǎng)發(fā)展過程中的獨(dú)特產(chǎn)物,顯然會(huì)存在相當(dāng)長(zhǎng)一段時(shí)間,而現(xiàn)行的人工智能鑒黃也多為輔助人。

一句正確但無用的話是,可以想見未來AI鑒黃會(huì)占據(jù)主流,但這個(gè)未來應(yīng)該以哪個(gè)時(shí)間節(jié)點(diǎn)為基準(zhǔn),誰也無法預(yù)料。

智能相對(duì)論(微信id:aixdlun):深挖人工智能這口井,評(píng)出咸淡,講出黑白,道出vb深淺。重點(diǎn)關(guān)注領(lǐng)域:AI+醫(yī)療、機(jī)器人、智能駕駛、AI+硬件、物聯(lián)網(wǎng)、AI+金融、AI+安全、AR/VR、開發(fā)者以及背后的芯片、算法、人機(jī)交互等。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
ai技術(shù)
ai智能
聲音鑒黃師審核

相關(guān)文章

  • 未來5年,中國(guó)AI的“大洗牌”和“內(nèi)循環(huán)”

    我覺得我們AI的目標(biāo)是:從芯片設(shè)計(jì)到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級(jí)AI體系。所以這是俺對(duì)未來5年中國(guó)AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國(guó)產(chǎn)開車26年國(guó)產(chǎn)芯片會(huì)在推理和垂直場(chǎng)景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會(huì)以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開,訓(xùn)練就

  • H20芯片開賣即叫停,英偉達(dá)如何解圍?

    文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國(guó)科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標(biāo)簽:
    英偉達(dá)
  • 真正的「國(guó)產(chǎn)英偉達(dá)」來了

    文/二風(fēng)來源/節(jié)點(diǎn)財(cái)經(jīng)一場(chǎng)關(guān)于“中國(guó)芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會(huì)已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請(qǐng)。作為中國(guó)半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達(dá)背景、高達(dá)80億元人民幣的募資雄心,以及在國(guó)產(chǎn)GPU領(lǐng)域取

    標(biāo)簽:
    英偉達(dá)
  • AI視頻生成賽道“分野”:小廠重產(chǎn)品,大廠重生態(tài)

    AI視頻生成賽道“分野”:小廠重產(chǎn)品,大廠重生態(tài)

    標(biāo)簽:
    騰訊
    阿里巴巴
    快手
  • 數(shù)據(jù)庫進(jìn)入“內(nèi)存自由”時(shí)代!阿里云PolarDB發(fā)布全球首個(gè)CXL數(shù)據(jù)庫服務(wù)器

    技術(shù)的進(jìn)步永無止境,繼創(chuàng)下TPC-C性能&性價(jià)比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫再度實(shí)現(xiàn)關(guān)鍵突破。9月24日杭州云棲大會(huì)上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術(shù)的PolarDB數(shù)據(jù)庫專用服務(wù)器。在原有RDMA網(wǎng)絡(luò)的基礎(chǔ)上,Polar

  • 為AI時(shí)代云服務(wù)器量身定制 阿里云操作系統(tǒng)Alinux 4重磅發(fā)布

    2025年9月24日,在杭州舉辦的云棲大會(huì)上,阿里云正式發(fā)布全新一代服務(wù)器操作系統(tǒng)AlibabaCloudLinux4(簡(jiǎn)稱Alinux4)。Alinux4基于Linux6.6內(nèi)核打造,是首個(gè)全面遵循龍蜥社區(qū)“開源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開源社區(qū)生態(tài),更針對(duì)阿里云最新9代ECS

  • 阿里云重磅發(fā)布AI安全護(hù)欄 五項(xiàng)安全能力護(hù)航AI安全

    9月24日,杭州云棲大會(huì)技術(shù)主論壇上,阿里云重磅發(fā)布AI安全護(hù)欄,提供五項(xiàng)核心安全能力,護(hù)航AI安全。一方面為客戶提供融入AIAgent開發(fā)全鏈路的原生安全防護(hù),另一方面持續(xù)用AI賦能安全產(chǎn)品智能化升級(jí),打造Agentic-SOC安全運(yùn)營(yíng),提升安全威脅檢測(cè)和響應(yīng)效率。在過去的一年,AIAgent正在

  • 魔搭社區(qū)國(guó)際版上線,并發(fā)布科學(xué)智能專區(qū)與AIGC創(chuàng)作引擎

    9月24日,魔搭社區(qū)舉辦了“全球協(xié)作?科學(xué)突破?創(chuàng)意無限”的專題論壇,并發(fā)布魔搭社區(qū)國(guó)際版、科學(xué)智能專區(qū)與AIGC創(chuàng)作引擎FlowBench,旨在連接全球開發(fā)者、加速科研范式創(chuàng)新、賦能創(chuàng)意表達(dá)。自2022年11月初成立至今,魔搭社區(qū)已成長(zhǎng)為中國(guó)最大AI開源社區(qū),其模型數(shù)量已突破10萬,服務(wù)了全球20

  • 七連發(fā)!阿里多款重磅發(fā)布亮相云棲大會(huì)

    9月24日,2025云棲大會(huì)現(xiàn)場(chǎng),阿里云CTO周靖人接連發(fā)布了七款大模型技術(shù)產(chǎn)品。七款技術(shù)產(chǎn)品覆蓋語言、語音、視覺、多模態(tài)、代碼等模型領(lǐng)域,在模型智能水平、Agent工具調(diào)用以及Coding能力、深度推理、多模態(tài)等方面均實(shí)現(xiàn)突破。在大語言模型中,阿里通義旗艦?zāi)P蚎wen3-Max全新亮相,性能超過G

  • 阿里云擴(kuò)建全球基礎(chǔ)設(shè)施,將新增巴西、法國(guó)和荷蘭數(shù)據(jù)中心

    9月24日,阿里云在云棲大會(huì)上宣布新一輪全球基礎(chǔ)設(shè)施擴(kuò)建計(jì)劃:將在巴西、法國(guó)和荷蘭首次設(shè)立云計(jì)算地域節(jié)點(diǎn)(region),并將擴(kuò)建墨西哥、日本、韓國(guó)、馬來西亞和迪拜的數(shù)據(jù)中心,以便更好服務(wù)全球客戶日益增長(zhǎng)的AI和云計(jì)算需求。目前,阿里云在全球29個(gè)地區(qū)運(yùn)營(yíng)91個(gè)可用區(qū),是中國(guó)最大、亞太第一的云服務(wù)商

編輯推薦