2023年可以說是人工智能行業(yè)最振奮的一年,大模型的能力每隔一段時間就會上一個新臺階,洶涌澎湃的技術(shù)革命迅速影響著每一個人的生活,AGI不再是一種技術(shù)理想,而是觸手可及的現(xiàn)實。
到了2024年,人工智能的熱度不減,但口口相傳的“百模大戰(zhàn)”并未上演。資本市場罕見地“降溫”,不少大模型悄無聲息地消失,有機會進入決賽圈的大模型創(chuàng)業(yè)者,僅剩下寥寥數(shù)家。
其中就有孵化出海螺AI的MiniMax,一家不為太多人所熟知,估值卻早已超過25億美元的現(xiàn)象級獨角獸。
01 技術(shù)路線幾乎沒有退路
目前國內(nèi)估值超過10億美元的大模型創(chuàng)業(yè)團隊只有五六家,MiniMax恰恰又是其中最為特殊的存在:
1、月之暗面、百川智能、零一萬物等均成立于2023年,MiniMax卻是一家誕生于2021年的企業(yè),比友商們早了兩年時間。
2、有別于李開復(fù)、王小川等人的“明星”身份和高調(diào)風格,MiniMax的創(chuàng)始人閆俊杰不可謂不低調(diào),很少在公開場合露面。
3、“搶算力”儼然是整個AI行業(yè)的常態(tài),MiniMax沒有夠購買任何GPU,而是以相對便宜的價格找火山引擎租了大量GPU算力。
為何特立獨行的MiniMax能夠活下來?答案就藏在閆俊杰時常提及的一句話里:“我選的技術(shù)路線幾乎沒有退路”。
直接的例子就是MoE(混合專家模型)上的“豪賭”。
時間回到2023年夏天,國內(nèi)的大模型廠商們紛紛加快了研發(fā)進度,擺在MiniMax面前的現(xiàn)實問題是:自家2B和2C的產(chǎn)品已經(jīng)有很多用戶,傳統(tǒng)dense(稠密)模型生成token的成本太高,延時太嚴重;在計算資源有限的情況下,只有MoE才能訓練完當時的數(shù)據(jù)。
理論上講,MoE相較于dense模型的預(yù)訓練速度更快,在相同參數(shù)的情況下,有著更快的推理速度,但在微調(diào)方面存在諸多挑戰(zhàn),比如泛化能力不足容易引發(fā)過擬合現(xiàn)象,屬于典型的“技術(shù)派才有的紅利”。
其他廠商選擇dense模型快速迭代的時候,MiniMax放了80%以上的算力和研發(fā)資源做MoE,而且沒有Plan B。
拐點出現(xiàn)在2024年初,MiniMax發(fā)布了國內(nèi)首個基于MoE架構(gòu)的abab 6,找到了越來越多加速實現(xiàn)Scaling Laws的途徑,包括改進模型架構(gòu)、重構(gòu)數(shù)據(jù)pipeline等等,并在三個月后研發(fā)出了更強大的abab 6.5。
正如外界所熟知的,長文本能力在2024年成為生產(chǎn)力工具的“勝負手”,萬億參數(shù)的abab 6.5已經(jīng)200k tokens 的上下文長度,綜合能力已經(jīng)不遜于國外主流大模型;使用同樣的訓練技術(shù)和數(shù)據(jù)的abab 6.5s,進一步提升了推理速度,可以在1秒內(nèi)處理近3萬字的文本。
按照業(yè)界常用的“大海撈針”機制,即在很長的文本中放入一個和該文本無關(guān)的句子(針),然后通過自然語言提問模型,看模型是否準確將這個針回答出來。在891次問答中,abab 6.5均能正確回答。
現(xiàn)在,MoE模型已經(jīng)上升為行業(yè)共識,被認為是高性能AI大模型的必選項,而MiniMax已經(jīng)在這條路上“搶跑”了一年。
02 技術(shù)驅(qū)動的產(chǎn)品方法論
讓許多人沒想到的是,一群癡迷于技術(shù)的工程師,“意外”做出了多個日活用戶超過100萬的產(chǎn)品,包括Glow、星野、海螺AI等,涵蓋內(nèi)容社區(qū)、生產(chǎn)力工具等不同方向。
曾有媒體在采訪時詢問閆俊杰:“你們第一個模型還沒做出來,就招了產(chǎn)品經(jīng)理,當時你如何向他描述你想要一個怎樣的產(chǎn)品?”出乎預(yù)料的是,閆俊杰給出的回答只要三個字:“不知道。”
閆俊杰口中的“不知道”,源于對技術(shù)的敬畏:當前AI原生的超級產(chǎn)品,無不源自突破性的技術(shù)進步。
比如搜索問答幾乎是所有對話式AI的標配,也是我們使用生產(chǎn)力工具提升工作效率的剛需功能。但越是基礎(chǔ)的功能,越能驗證生產(chǎn)力工具的價值,考驗背后大模型的能力。
百度發(fā)布2024年Q1財報后,我們同時在海螺AI和國外的一款產(chǎn)品進行了對比,用戶體驗可謂高下立見:
海螺AI整理出了百度的核心業(yè)務(wù)信息,包括營收、利潤等關(guān)鍵數(shù)據(jù),以及百度智能云、開發(fā)者社區(qū)、百度APP、蘿卜快快等核心業(yè)務(wù)數(shù)據(jù),有著清晰的邏輯和側(cè)重,并且每條內(nèi)容都關(guān)聯(lián)了對應(yīng)的信息源,甚至在末尾附加了和百度財報相關(guān)的常見問題。
另一款產(chǎn)品也準確回答了財報的核心信息,但僅僅引述了一些媒體報道,輸出內(nèi)容的結(jié)構(gòu)化很弱,需要人工二次處理信息。和直接用搜索引擎查找信息的方式相比,并未節(jié)省太多的時間。
再比如長尾內(nèi)容的檢索和生成能力。像百度財報這樣的熱門議題,很容易找到相關(guān)的媒體報道,一些小眾的長尾內(nèi)容,似乎更能考驗生產(chǎn)力工具的內(nèi)容檢索和生成能力。
我們的問題是皮爾斯·布朗的代表作《火星崛起》,曾被《娛樂周刊》評為2014年度最佳圖書,但知名度不如《火星救援》、《星球崛起》等可能被AI混淆的名著。海螺AI準確理解了我們的需求,生成的故事梗概可圈可點,并給出了深刻的評價;豆包將我們的需求誤解為《星球崛起》,生成的內(nèi)容居然是《火星三部曲》的介紹。
技術(shù)的上限左右著產(chǎn)品的上限。
MiniMax之所以做出了海螺AI這樣“能打”的生產(chǎn)力工具,根源在于技術(shù)驅(qū)動的產(chǎn)品方法論,只有具備足夠好的產(chǎn)品能力,才能承接和轉(zhuǎn)化取得的技術(shù)進展,否則會落得一場空。
當然,MiniMax也有自己的“野心”。就像閆俊杰所籌劃的:“在技術(shù)快速進化的窗口關(guān)閉前,做出用戶量巨大的To C產(chǎn)品。”
03 做普通人每天用的產(chǎn)品
資本圈里流傳著一句話:判斷一位人工智能創(chuàng)業(yè)者是否真正的AGI信仰,就看這個人創(chuàng)業(yè)是在2023年之前還是之后。作為普通用戶,則有另一套判斷標準,即能不能解決實際問題,扎扎實實地提高工作效率。
行事低調(diào)的閆俊杰,很少圍繞AGI的話題高談闊論,但在媒體采訪時講述了自己樸素的信仰:Intelligence with everyone。
怎么理解“與用戶共創(chuàng)智能”?海螺AI無疑是最直觀的研究對象。
生產(chǎn)力工具作為當下最擁擠的大模型賽道,市面上的產(chǎn)品已經(jīng)多達幾十款,豆包、文心一言、智譜清言、Kimi……哪怕是在高度內(nèi)卷的局面下,肩負MiniMax信仰的海螺AI,依然表現(xiàn)出了差異化和稀缺性。
首先是簡潔的產(chǎn)品設(shè)計。
為了爭奪用戶的注意力和時長,越來越多的對話式AI產(chǎn)品在首頁上添加了豐富的菜單欄,努力向用戶表達功能的多樣性。海螺AI不可謂不克制,首頁上除了簡單的功能引導(dǎo)和對話框外,并沒有其他影響注意力的元素。
不同的設(shè)計風格,似乎談不上孰優(yōu)孰劣,但從生產(chǎn)力工具的定位來說,頁面的簡潔與否和大模型能力不無關(guān)系。倘若大模型的能力足夠強大,哪怕沒有花里胡哨的功能露出,也可以通過生成的內(nèi)容占領(lǐng)用戶心智。刻意強調(diào)功能的多樣性和玩法的趣味性,反而在大模型的能力上漏了怯。
其次是過硬的產(chǎn)品能力。
諸如搜索問答、語音對話、長文總結(jié)等功能,早已是對話式AI產(chǎn)品的標配,也是高度同質(zhì)化的主要誘因。但只要深入使用一段時間,或者進行簡單的結(jié)果對比,并不難判斷能力上的高下,找到最適合的生產(chǎn)力工具。
而產(chǎn)品能力的強弱,往往體現(xiàn)在一些細節(jié)中。以我們高頻使用的長文總結(jié)為例,將第三方行業(yè)報告上傳到海螺AI,可以準確梳理報告的核心信息,并根據(jù)報告內(nèi)容進行對話。原先閱讀一篇報告需要至少兩個小時的時間,現(xiàn)在不到5分鐘就能完成,工作效率可以說是實現(xiàn)了指數(shù)級增長。
然后是多元的使用場景。
有些產(chǎn)品盡可能在首頁上推薦足夠多的“角色”,來告訴我們有很多使用場景,適合不同的用戶。僅僅在prompt下功夫,當真可以滿足不同人群的需求嗎?市場初期也許奏效,可終歸不是解決問題的最優(yōu)解。
海螺AI的答案是從能力上滿足不同人群的需求:幫研究人員快速總結(jié)和分析長篇學術(shù)論文或研究報告、幫內(nèi)容創(chuàng)作者整合關(guān)鍵信息并生成爆款文章、幫知識工作者整理和回顧學習資料、為日常用戶提供生活中的即時幫助……就像是一個能打的六邊形戰(zhàn)士,背后是萬億參數(shù)MOE大模型的底氣。
一言以蔽之,只有做出足夠產(chǎn)品化、能服務(wù)大眾的AI技術(shù)和產(chǎn)品,才可以給社會帶來足夠高的反饋。在MiniMax的認知里,AGI不是原子彈那樣的大殺器,而是普通人每天會用的產(chǎn)品和服務(wù)。
04 寫在最后
每一次代際演變的出現(xiàn),都會經(jīng)歷百花齊放到超級APP“統(tǒng)治”市場的過程。
大模型的產(chǎn)品化也不例外。現(xiàn)階段AI產(chǎn)品的核心價值,主要來自模型性能和算法能力,不排除會上演“贏者通吃”的一幕。特別是對于尋求生產(chǎn)力的用戶,擁抱海螺AI這樣的超級APP,卸載掉“嘗鮮”時下載的幾十個APP,將是可以預(yù)見的結(jié)果。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
Manus撕開一道真相
文/八真來源/節(jié)點財經(jīng)具身智能賽道,誰最有可能拔得A股資本市場的頭籌?答案大概率是誕生剛剛兩年,由華為"天才少年"、B站百萬粉絲科技UP主稚暉君(彭志輝)創(chuàng)立的智元機器人。近期,從事新材料研發(fā)與生產(chǎn)的上緯新材(688585.SH)丟出重磅炸彈,宣布智元機器人及相關(guān)主體將通過收購其至少63.62%的股
文/道哥大舉裁員、清空賬號、國內(nèi)IP無法訪問——曾被譽為“中國AIAgent希望之星”的Manus,在估值飆至5億美元的高光時刻“閃離”中國市場。近日,Manus“裁員、出走”的消息在媒體端大量發(fā)酵。消息稱,Manus公司總部將由中國遷至新加坡,其國內(nèi)團隊也將大幅裁撤——原有120人規(guī)模團隊除40余
四個月前邀請碼炒至10萬元,如今官網(wǎng)變灰、社交賬號清空,這家AI新貴的閃電遷移折射中國科技企業(yè)出海潮涌。7月11日,打開Manus官網(wǎng)的用戶發(fā)現(xiàn)一則突兀提示:“Manus在你所在的地區(qū)不可用”。而就在不久前,這個位置還顯示著“Manus中文版本正在開發(fā)中”的樂觀聲明。同時,Manus官方微博和小紅書
文/十界來源/節(jié)點財經(jīng)一場圍繞算力自主的競賽,正在科創(chuàng)板上演。近日,國產(chǎn)全功能GPU廠商摩爾線程遞交科創(chuàng)板招股書,擬募資約80億人民幣,成為今年上半年科創(chuàng)板擬募資規(guī)模最大的沖刺者,也打響了“國產(chǎn)英偉達”上市的第一槍。據(jù)招股書顯示,摩爾線程自2020年成立以來,主營全功能GPU芯片的研發(fā)與銷售,以自主
“AI大模型六小虎”百川智能危機重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵:(1)拿下河北(2)學習科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的
百度AI團隊今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級標志著OCR領(lǐng)域首次實現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準識別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場
“宇樹已形成硬件、算法、場景聯(lián)動的業(yè)務(wù)飛輪,自研率超95%的技術(shù)壁壘讓其成為全球機器人賽道不可忽視的中國力量?!笔壮藤Y本管理合伙人朱方文在追加投資時如是評價。7月7日,據(jù)每日經(jīng)濟新聞從宇樹科技投資方處獲悉,國內(nèi)人形機器人領(lǐng)軍企業(yè)宇樹科技(UnitreeRobotics)已明確計劃于科創(chuàng)板IPO,預(yù)計
推理與多模態(tài)的終極融合,將徹底終結(jié)用戶在不同模型間切換的煩惱。7月7日,OpenAI正式確認將在今年夏季推出新一代人工智能模型GPT-5。這一突破性產(chǎn)品將整合現(xiàn)有的多個強大模型,特別是融合專注推理能力的“O系列”與具備多模態(tài)功能的“GPT系列”,為用戶提供前所未有的統(tǒng)一體驗。OpenAI開發(fā)者體驗負