1. 創(chuàng)業(yè)頭條
  2. 前沿領域
  3. 人工智能
  4. 正文

李明強:AI鑒黃師"看懂"圖像迅速走紅

 2018-09-11 18:12  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領券再下單

受訪者供圖

“你的第一個產品,哪怕做得粗糙一點也沒關系,不要想太多!”5年前,李明強帶著騰訊高級副總裁張小龍的“臨別贈言”,躍入創(chuàng)業(yè)的大潮中。共事多年的張小龍給他的建議是,“產品并不需要做得完美無瑕再拿出去。只要有客戶,就說明是有需求的。”

1980年出生的李明強在騰訊工作了7年,先后參與QQ郵箱、微信等項目的開發(fā),成了一名資深的項目經理和T4技術專家。“我離開騰訊時,公司只有幾十個T4技術專家。但我在那里太久了,再不出去創(chuàng)業(yè)就折騰不動了。”2014年,他創(chuàng)辦了國內最早將計算機視覺技術應用在互聯(lián)網(wǎng)內容審核上的AI公司——圖普科技。

“內容審查怎么不能做到?我就可以做!”

圖普科技從“出生”時起,就打上了“鑒黃”的烙印。這源于曾經掀起輿論熱議的“快播案”。快播CEO王欣在法庭上稱:“快播最主要的功能就是播放,就像傳統(tǒng)意義上的DVD,無法知道上傳者是誰,更不知道視頻內容是什么。用戶上傳什么種子,它就播放下載什么種子,它只是忠實地執(zhí)行這個動作而已。”

李明強說:“內容審查在當時的確很難。我就想怎么不能做到?我就可以做!”

根據(jù)《全國人民代表大會常務委員會關于維護互聯(lián)網(wǎng)安全的決定》的規(guī)定,互聯(lián)網(wǎng)公司內容涉黃,有可能被以制作、復制、出版、販賣、傳播淫穢物品牟利罪定罪處罰??觳テ飘a的結局讓眾多網(wǎng)絡平臺意識到,內容審核不僅是維護互聯(lián)網(wǎng)環(huán)境的政策要求,更是關及自身生死存亡的要事。

如今,直播和短視頻市場風起云涌,龐大的流量催生新產業(yè)的同時,審核難度也越來越大。據(jù)新華社報道,今年以來,“掃黃打非”部門加大工作力度。據(jù)統(tǒng)計,“凈網(wǎng)2018”行動從1月到4月,各地共處置淫穢色情等有害信息175萬余條,查辦淫穢色情信息案件390余起。

被網(wǎng)友戲稱高薪和“福利”兼具的神奇職業(yè)“鑒黃師”,在如此大體量的內容檢測面前顯得勢單力薄。“培養(yǎng)一個鑒黃師至少需要兩周。”李明強說,“一天總共8萬多秒,去掉吃飯睡覺等時間,鑒黃師一天最多能看一兩萬張圖片。人工審核難免會有錯漏,還要考慮人員流動、不能實時監(jiān)看等不穩(wěn)定的因素。”

受到快播案的啟發(fā),李明強確立了用人工智能技術進行圖片識別的戰(zhàn)略,他帶著新建的團隊,在一周內做出demo(小樣),在給機器提供大量數(shù)據(jù)的基礎上,通過機器持續(xù)學習,確保系統(tǒng)甄別效能的更新和優(yōu)化。

隨后圖普迎來第一個客戶——迅雷。迅雷之前成立了自己的內容審核團隊。“他們的做法是將違規(guī)內容和審核視頻進行比對,將一樣的部分篩去,但是機器并不理解這個東西是什么。”李明強說,“一個視頻版本傳播出去會有多個變種,分辨率不同、加個水印、字幕或者截取部分,就演變成完全不同的文件了。我們的創(chuàng)新點在于,我們的識別是基于圖像的理解,真的能‘看懂’視頻是否有色情內容”。

“我們在識別的結果上,會劃線區(qū)分為確定和不確定部分。有的圖片非常隱晦,它介于兩者之間,系統(tǒng)的判定是不確定或者很模糊。因此我們也設立新的計費模式,只對于確定部分收費,不確定部分不收費或者少收費,打消客戶的很多疑慮。”李明強解釋,圖普科技的準確率高達99%,對于系統(tǒng)無法識別或無法作出最終判斷的內容,推送至人工審核。盡管還需要鑒黃師的助力,但已經極大地提高效率和降低人力成本。

目前,圖普科技的AI每天的處理量超過10億次,在云端設有幾百個圖像識別接口,相關的算法也落地到不同的行業(yè)里。

“每次嘗試我都更興奮,會有這一次要成功了的錯覺”

任何成功都不是一蹴而就。在圖普科技成長為“AI鑒黃師”之前,李明強有過一次失敗的創(chuàng)業(yè)經歷。

2013年,李明強嘗試開發(fā)一個服裝和鞋帽的搜索引擎,通過圖片來了解用戶喜好并推薦適合用戶的款式。“在當時就能夠完成識別圖中衣物款式、顏色、紋理等一些當時看起來很有難度的事”,但初次創(chuàng)業(yè)不過一年便宣告失敗。

李明強期望能從圖片為切口,突破單一的純文字搜索引擎模式,但高成本的流量和時間消耗難以承受?;仡欉^去的創(chuàng)業(yè)經歷,運營工作太重是失敗的主要原因。用戶對于服裝的偏好、對美的感受千差萬別,需要進行大量的運營工作。

這成為李明強最頭痛的事,“盡管我們嘗試將每一次需求沉淀下來再去改進,但還是會有新的或者隱晦的需求,一次又一次遭受打擊。依靠技術難以量化和把握,無法完成完整的商業(yè)閉環(huán)。”

“這是一次非常慘痛的創(chuàng)業(yè)經歷。”從騰訊的高級技術專家,到事無巨細考慮每一步的創(chuàng)業(yè)老板,身份的轉換帶給了李明強極大的不適應感,“就像一覺醒來漂流在海面上,狂風暴雨,又不知道該往什么方向去走。”

當初,李明強帶著幾位伙伴一起離開騰訊著手創(chuàng)業(yè)。他形容“自己的兄弟特別單純”,“他們就相信我這件事情能做成”。

搜衣引擎的失敗給了李明強當頭一棒。比起自己的挫敗感,李明強對共同戰(zhàn)斗的隊友背負更深的愧疚。

“帶著一幫兄弟,拿著投資人的錢花時間在這個地方,最后發(fā)現(xiàn)都是一些無效勞動。”那一次失敗,讓李明強損失了一半得力干將。他覺得,“失敗就像一個坑,陷進去了就得爬出來。如何找到方向爬出坑最重要”。

“就是不斷嘗試。”李明強在接受中國青年報·中青在線記者采訪時說,“每一次嘗試我都更興奮,會有這一次要成功了的錯覺,但結果方向又不對,那就再來!”

每一次調整狀態(tài)后,他又像打滿了雞血一般,迎接新的挑戰(zhàn),“這件事情一年做不成,我就做十年。因為我知道肯定是存在一條路的。”李明強終于找到了這條路,開創(chuàng)了國內人工智能圖片識別內容審核的先河。

員工的學習時間計入工時——拿工資學習

“AI鑒黃師”迅速走紅。參加了多場人工智能研討會后,李明強發(fā)現(xiàn),“只要一說我們的產品是AI鑒黃,之后再說到其他業(yè)務大家就都不注意聽了”。

“后來想想我們本來就是互聯(lián)網(wǎng)出身,能有這樣的免費熱點蹭,也沒什么不好。 ”李明強介紹,如今圖普科技三條生產線并行:互聯(lián)網(wǎng)、商業(yè)智能、泛安防。鑒黃只是互聯(lián)網(wǎng)生產線的一個小分支。今年圖普科技在商業(yè)智能上持續(xù)發(fā)力,線下門店都開始嘗試配備AI的自動導購機,例如通過攝像頭來識別消費者的形象特征,隨后根據(jù)算法在屏幕上顯示推薦產品,在應用中增添很多趣味性的成分,“這實際上是我們做賦能型零售的破冰嘗試。”

目前,圖普科技總部設在廣州,在北京、成都等地開設了分公司,160多人的團隊中研發(fā)人員占70%。招到優(yōu)秀的人是李明強最關心的事,他和程序員在工作之余“玩”出了5套謎題,以游戲的形式作為選拔人才的考卷。

“這一套謎題是用算法摳出圖里的馬里奧,這張海報的圖標是《三體》里的魚缸……”他甚至在公司開設解題課堂,定期講解這些內容。他還設計了打卡學習系統(tǒng),員工的學習時間計入工時——拿工資學習。

如今,李明強和公司成員溝通時,常常將“在用的過程中完善”這句話掛在嘴邊。李明強坦言,“我一開始總想要把產品做完善再拿出去,反而越做越糟。張小龍的忠告是對的,產品就是應該在推出后根據(jù)需求迭代的。我們也正在不斷更新產品,永遠在路上。”(實習生 黃暢 中國青年報·中青在線記者 王聰聰)

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關文章

  • 未來5年,中國AI的“大洗牌”和“內循環(huán)”

    我覺得我們AI的目標是:從芯片設計到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達造車、國產開車26年國產芯片會在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會以軟件彌補硬件不足,所以訓練和推理分開,訓練就

  • H20芯片開賣即叫停,英偉達如何解圍?

    文/道哥在深陷“后門”風波、接受網(wǎng)信辦問詢之后,英偉達的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達已悄然向其關鍵供應商——包括負責封裝的安靠科技、供應高帶寬內存的三星電子、以及承擔后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標簽:
    英偉達
  • 真正的「國產英偉達」來了

    文/二風來源/節(jié)點財經一場關于“中國芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請。作為中國半導體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達背景、高達80億元人民幣的募資雄心,以及在國產GPU領域取

    標簽:
    英偉達
  • AI視頻生成賽道“分野”:小廠重產品,大廠重生態(tài)

    AI視頻生成賽道“分野”:小廠重產品,大廠重生態(tài)

  • 數(shù)據(jù)庫進入“內存自由”時代!阿里云PolarDB發(fā)布全球首個CXL數(shù)據(jù)庫服務器

    技術的進步永無止境,繼創(chuàng)下TPC-C性能&性價比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫再度實現(xiàn)關鍵突破。9月24日杭州云棲大會上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術的PolarDB數(shù)據(jù)庫專用服務器。在原有RDMA網(wǎng)絡的基礎上,Polar

  • 為AI時代云服務器量身定制 阿里云操作系統(tǒng)Alinux 4重磅發(fā)布

    2025年9月24日,在杭州舉辦的云棲大會上,阿里云正式發(fā)布全新一代服務器操作系統(tǒng)AlibabaCloudLinux4(簡稱Alinux4)。Alinux4基于Linux6.6內核打造,是首個全面遵循龍蜥社區(qū)“開源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開源社區(qū)生態(tài),更針對阿里云最新9代ECS

  • 阿里云重磅發(fā)布AI安全護欄 五項安全能力護航AI安全

    9月24日,杭州云棲大會技術主論壇上,阿里云重磅發(fā)布AI安全護欄,提供五項核心安全能力,護航AI安全。一方面為客戶提供融入AIAgent開發(fā)全鏈路的原生安全防護,另一方面持續(xù)用AI賦能安全產品智能化升級,打造Agentic-SOC安全運營,提升安全威脅檢測和響應效率。在過去的一年,AIAgent正在

  • 魔搭社區(qū)國際版上線,并發(fā)布科學智能專區(qū)與AIGC創(chuàng)作引擎

    9月24日,魔搭社區(qū)舉辦了“全球協(xié)作?科學突破?創(chuàng)意無限”的專題論壇,并發(fā)布魔搭社區(qū)國際版、科學智能專區(qū)與AIGC創(chuàng)作引擎FlowBench,旨在連接全球開發(fā)者、加速科研范式創(chuàng)新、賦能創(chuàng)意表達。自2022年11月初成立至今,魔搭社區(qū)已成長為中國最大AI開源社區(qū),其模型數(shù)量已突破10萬,服務了全球20

  • 七連發(fā)!阿里多款重磅發(fā)布亮相云棲大會

    9月24日,2025云棲大會現(xiàn)場,阿里云CTO周靖人接連發(fā)布了七款大模型技術產品。七款技術產品覆蓋語言、語音、視覺、多模態(tài)、代碼等模型領域,在模型智能水平、Agent工具調用以及Coding能力、深度推理、多模態(tài)等方面均實現(xiàn)突破。在大語言模型中,阿里通義旗艦模型Qwen3-Max全新亮相,性能超過G

  • 阿里云擴建全球基礎設施,將新增巴西、法國和荷蘭數(shù)據(jù)中心

    9月24日,阿里云在云棲大會上宣布新一輪全球基礎設施擴建計劃:將在巴西、法國和荷蘭首次設立云計算地域節(jié)點(region),并將擴建墨西哥、日本、韓國、馬來西亞和迪拜的數(shù)據(jù)中心,以便更好服務全球客戶日益增長的AI和云計算需求。目前,阿里云在全球29個地區(qū)運營91個可用區(qū),是中國最大、亞太第一的云服務商

編輯推薦