時(shí)間回到2023年夏天，國內(nèi)的大模型廠商們紛紛加快了研發(fā)進(jìn)度，擺在MiniMax面前的現(xiàn)實(shí)問題是：自家2B和2C的產(chǎn)品已經(jīng)有很多用戶，傳統(tǒng)dense（稠密）模型生成token的成本太高，延時(shí)太嚴(yán)重；在計(jì)算資源有限的情況下，只有MoE才能訓(xùn)練完當(dāng)時(shí)的數(shù)據(jù)。

理論上講，MoE相較于dense模型的預(yù)訓(xùn)練速度更快，在相同參數(shù)的情況下，有著更快的推理速度，但在微調(diào)方面存在諸多挑戰(zhàn)，比如泛化能力不足容易引發(fā)過擬合現(xiàn)象，屬于典型的“技術(shù)派才有的紅利”。

其他廠商選擇dense模型快速迭代的時(shí)候，MiniMax放了80%以上的算力和研發(fā)資源做MoE，而且沒有Plan B。

拐點(diǎn)出現(xiàn)在2024年初，MiniMax發(fā)布了國內(nèi)首個(gè)基于MoE架構(gòu)的abab 6，找到了越來越多加速實(shí)現(xiàn)Scaling Laws的途徑，包括改進(jìn)模型架構(gòu)、重構(gòu)數(shù)據(jù)pipeline等等，并在三個(gè)月后研發(fā)出了更強(qiáng)大的abab 6.5。

正如外界所熟知的，長文本能力在2024年成為生產(chǎn)力工具的“勝負(fù)手”，萬億參數(shù)的abab 6.5已經(jīng)200k tokens 的上下文長度，綜合能力已經(jīng)不遜于國外主流大模型；使用同樣的訓(xùn)練技術(shù)和數(shù)據(jù)的abab 6.5s，進(jìn)一步提升了推理速度，可以在1秒內(nèi)處理近3萬字的文本。

按照業(yè)界常用的“大海撈針”機(jī)制，即在很長的文本中放入一個(gè)和該文本無關(guān)的句子（針），然后通過自然語言提問模型，看模型是否準(zhǔn)確將這個(gè)針回答出來。在891次問答中，abab 6.5均能正確回答。

現(xiàn)在，MoE模型已經(jīng)上升為行業(yè)共識(shí)，被認(rèn)為是高性能AI大模型的必選項(xiàng)，而MiniMax已經(jīng)在這條路上“搶跑”了一年。

02 技術(shù)驅(qū)動(dòng)的產(chǎn)品方法論

讓許多人沒想到的是，一群癡迷于技術(shù)的工程師，“意外”做出了多個(gè)日活用戶超過100萬的產(chǎn)品，包括Glow、星野、海螺AI等，涵蓋內(nèi)容社區(qū)、生產(chǎn)力工具等不同方向。

曾有媒體在采訪時(shí)詢問閆俊杰：“你們第一個(gè)模型還沒做出來，就招了產(chǎn)品經(jīng)理，當(dāng)時(shí)你如何向他描述你想要一個(gè)怎樣的產(chǎn)品？”出乎預(yù)料的是，閆俊杰給出的回答只要三個(gè)字：“不知道。”

閆俊杰口中的“不知道”，源于對(duì)技術(shù)的敬畏：當(dāng)前AI原生的超級(jí)產(chǎn)品，無不源自突破性的技術(shù)進(jìn)步。

比如搜索問答幾乎是所有對(duì)話式AI的標(biāo)配，也是我們使用生產(chǎn)力工具提升工作效率的剛需功能。但越是基礎(chǔ)的功能，越能驗(yàn)證生產(chǎn)力工具的價(jià)值，考驗(yàn)背后大模型的能力。

百度發(fā)布2024年Q1財(cái)報(bào)后，我們同時(shí)在海螺AI和國外的一款產(chǎn)品進(jìn)行了對(duì)比，用戶體驗(yàn)可謂高下立見：

海螺AI整理出了百度的核心業(yè)務(wù)信息，包括營收、利潤等關(guān)鍵數(shù)據(jù)，以及百度智能云、開發(fā)者社區(qū)、百度APP、蘿卜快快等核心業(yè)務(wù)數(shù)據(jù)，有著清晰的邏輯和側(cè)重，并且每條內(nèi)容都關(guān)聯(lián)了對(duì)應(yīng)的信息源，甚至在末尾附加了和百度財(cái)報(bào)相關(guān)的常見問題。

另一款產(chǎn)品也準(zhǔn)確回答了財(cái)報(bào)的核心信息，但僅僅引述了一些媒體報(bào)道，輸出內(nèi)容的結(jié)構(gòu)化很弱，需要人工二次處理信息。和直接用搜索引擎查找信息的方式相比，并未節(jié)省太多的時(shí)間。

再比如長尾內(nèi)容的檢索和生成能力。像百度財(cái)報(bào)這樣的熱門議題，很容易找到相關(guān)的媒體報(bào)道，一些小眾的長尾內(nèi)容，似乎更能考驗(yàn)生產(chǎn)力工具的內(nèi)容檢索和生成能力。

我們的問題是皮爾斯·布朗的代表作《火星崛起》，曾被《娛樂周刊》評(píng)為2014年度最佳圖書，但知名度不如《火星救援》、《星球崛起》等可能被AI混淆的名著。海螺AI準(zhǔn)確理解了我們的需求，生成的故事梗概可圈可點(diǎn)，并給出了深刻的評(píng)價(jià)；豆包將我們的需求誤解為《星球崛起》，生成的內(nèi)容居然是《火星三部曲》的介紹。

技術(shù)的上限左右著產(chǎn)品的上限。

MiniMax之所以做出了海螺AI這樣“能打”的生產(chǎn)力工具，根源在于技術(shù)驅(qū)動(dòng)的產(chǎn)品方法論，只有具備足夠好的產(chǎn)品能力，才能承接和轉(zhuǎn)化取得的技術(shù)進(jìn)展，否則會(huì)落得一場(chǎng)空。

當(dāng)然，MiniMax也有自己的“野心”。就像閆俊杰所籌劃的：“在技術(shù)快速進(jìn)化的窗口關(guān)閉前，做出用戶量巨大的To C產(chǎn)品。”

03 做普通人每天用的產(chǎn)品

資本圈里流傳著一句話：判斷一位人工智能創(chuàng)業(yè)者是否真正的AGI信仰，就看這個(gè)人創(chuàng)業(yè)是在2023年之前還是之后。作為普通用戶，則有另一套判斷標(biāo)準(zhǔn)，即能不能解決實(shí)際問題，扎扎實(shí)實(shí)地提高工作效率。

行事低調(diào)的閆俊杰，很少圍繞AGI的話題高談闊論，但在媒體采訪時(shí)講述了自己樸素的信仰：Intelligence with everyone。

怎么理解“與用戶共創(chuàng)智能”？海螺AI無疑是最直觀的研究對(duì)象。

生產(chǎn)力工具作為當(dāng)下最擁擠的大模型賽道，市面上的產(chǎn)品已經(jīng)多達(dá)幾十款，豆包、文心一言、智譜清言、Kimi……哪怕是在高度內(nèi)卷的局面下，肩負(fù)MiniMax信仰的海螺AI，依然表現(xiàn)出了差異化和稀缺性。

首先是簡(jiǎn)潔的產(chǎn)品設(shè)計(jì)。

為了爭(zhēng)奪用戶的注意力和時(shí)長，越來越多的對(duì)話式AI產(chǎn)品在首頁上添加了豐富的菜單欄，努力向用戶表達(dá)功能的多樣性。海螺AI不可謂不克制，首頁上除了簡(jiǎn)單的功能引導(dǎo)和對(duì)話框外，并沒有其他影響注意力的元素。

不同的設(shè)計(jì)風(fēng)格，似乎談不上孰優(yōu)孰劣，但從生產(chǎn)力工具的定位來說，頁面的簡(jiǎn)潔與否和大模型能力不無關(guān)系。倘若大模型的能力足夠強(qiáng)大，哪怕沒有花里胡哨的功能露出，也可以通過生成的內(nèi)容占領(lǐng)用戶心智?？桃鈴?qiáng)調(diào)功能的多樣性和玩法的趣味性，反而在大模型的能力上漏了怯。

其次是過硬的產(chǎn)品能力。

諸如搜索問答、語音對(duì)話、長文總結(jié)等功能，早已是對(duì)話式AI產(chǎn)品的標(biāo)配，也是高度同質(zhì)化的主要誘因。但只要深入使用一段時(shí)間，或者進(jìn)行簡(jiǎn)單的結(jié)果對(duì)比，并不難判斷能力上的高下，找到最適合的生產(chǎn)力工具。

而產(chǎn)品能力的強(qiáng)弱，往往體現(xiàn)在一些細(xì)節(jié)中。以我們高頻使用的長文總結(jié)為例，將第三方行業(yè)報(bào)告上傳到海螺AI，可以準(zhǔn)確梳理報(bào)告的核心信息，并根據(jù)報(bào)告內(nèi)容進(jìn)行對(duì)話。原先閱讀一篇報(bào)告需要至少兩個(gè)小時(shí)的時(shí)間，現(xiàn)在不到5分鐘就能完成，工作效率可以說是實(shí)現(xiàn)了指數(shù)級(jí)增長。

然后是多元的使用場(chǎng)景。

有些產(chǎn)品盡可能在首頁上推薦足夠多的“角色”，來告訴我們有很多使用場(chǎng)景，適合不同的用戶。僅僅在prompt下功夫，當(dāng)真可以滿足不同人群的需求嗎？市場(chǎng)初期也許奏效，可終歸不是解決問題的最優(yōu)解。

海螺AI的答案是從能力上滿足不同人群的需求：幫研究人員快速總結(jié)和分析長篇學(xué)術(shù)論文或研究報(bào)告、幫內(nèi)容創(chuàng)作者整合關(guān)鍵信息并生成爆款文章、幫知識(shí)工作者整理和回顧學(xué)習(xí)資料、為日常用戶提供生活中的即時(shí)幫助……就像是一個(gè)能打的六邊形戰(zhàn)士，背后是萬億參數(shù)MOE大模型的底氣。

一言以蔽之，只有做出足夠產(chǎn)品化、能服務(wù)大眾的AI技術(shù)和產(chǎn)品，才可以給社會(huì)帶來足夠高的反饋。在MiniMax的認(rèn)知里，AGI不是原子彈那樣的大殺器，而是普通人每天會(huì)用的產(chǎn)品和服務(wù)。

04 寫在最后

每一次代際演變的出現(xiàn)，都會(huì)經(jīng)歷百花齊放到超級(jí)APP“統(tǒng)治”市場(chǎng)的過程。

大模型的產(chǎn)品化也不例外?，F(xiàn)階段AI產(chǎn)品的核心價(jià)值，主要來自模型性能和算法能力，不排除會(huì)上演“贏者通吃”的一幕。特別是對(duì)于尋求生產(chǎn)力的用戶，擁抱海螺AI這樣的超級(jí)APP，卸載掉“嘗鮮”時(shí)下載的幾十個(gè)APP，將是可以預(yù)見的結(jié)果。

申請(qǐng)創(chuàng)業(yè)報(bào)道，分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處，共同探討創(chuàng)業(yè)新機(jī)遇！