文:志剛@互聯(lián)網(wǎng)江湖
電影《I, Robot》的劇情,終于要在現(xiàn)實(shí)上演了?
這兩天,應(yīng)朋友邀請(qǐng)來(lái)了一趟上海,世界人工智能大會(huì)在上海開(kāi)幕了。
這屆WAIC2025,參展的企業(yè)很多,不少都是做技術(shù)應(yīng)用的企業(yè),也有不少車(chē)企。
六座特斯拉剛公布沒(méi)多久,我就想著到特斯拉展臺(tái)看看??蓻](méi)想到真正勾起我探索欲的,卻是隔壁的另一家做大模型的企業(yè):蘑菇車(chē)聯(lián)。

這屆WAIC大會(huì)上作為中美自動(dòng)駕駛玩家的代表,特斯拉帶來(lái)了賽博皮卡,蘑菇車(chē)聯(lián)發(fā)布了首個(gè)實(shí)時(shí)理解物理世界的MogoMind大模型。
MogoMind大模型是一個(gè)為多類(lèi)型智能體提供物理世界實(shí)時(shí)信息的深度理解和規(guī)劃決策服務(wù)的大模型,簡(jiǎn)單地說(shuō),蘑菇車(chē)聯(lián)給大模型裝上了認(rèn)識(shí)真實(shí)世界的“眼睛”。
皮衣教主老黃不久前說(shuō),下一波浪潮將是物理AI。
對(duì)此我深以為然。我一直都認(rèn)為,DeepSeek、ChatGPT、可靈、sora涌現(xiàn)只是個(gè)開(kāi)始,AI真正的浪潮,應(yīng)該是有更多物理交互的AI。
也因此,MogoMind這樣能夠?qū)崟r(shí)理解物理世界大模型,才更有看頭。

用現(xiàn)實(shí)“喂”出來(lái)的AI,能有多炸裂?
MogoMind大模型與其他AI大模型最大的一個(gè)不同在于,它是從實(shí)時(shí)物理世界里長(zhǎng)出來(lái)的,別的AI大模型是“喂數(shù)據(jù)”,而MogoMind本質(zhì)上是“喂現(xiàn)實(shí)”。
MogoMind的數(shù)據(jù)不是產(chǎn)生于某個(gè)特定的數(shù)據(jù)集,而是通過(guò)接入物理世界實(shí)時(shí)動(dòng)態(tài)數(shù)據(jù),形成全局感知、深度認(rèn)知。
舉個(gè)例子,在交通場(chǎng)景下,依靠攝像頭、激光雷達(dá)等硬件,MogoMind能實(shí)現(xiàn)實(shí)時(shí)全局感知,對(duì)暴雨、大霧等惡劣天氣以及道路施工、突發(fā)事件等特殊狀況,MogoMind都能快速認(rèn)知理解。
如果發(fā)生突發(fā)交通事件,MogoMind可在數(shù)秒內(nèi)實(shí)現(xiàn)交通事件的超視距實(shí)時(shí)感知,迅速計(jì)算出受影響的路段范圍,然后將預(yù)警信息推送至周邊車(chē)輛和交通管理部門(mén)。
這個(gè)能力多炸裂?相當(dāng)于給駕駛員“開(kāi)天眼”。
記得去年7月份的山洪導(dǎo)致高速路橋垮塌的新聞嗎?試想一下,如果能夠部署能感知現(xiàn)實(shí)環(huán)境的大模型來(lái)預(yù)警,事故傷亡是不是可能就會(huì)減少甚至避免發(fā)生?

除了識(shí)別風(fēng)險(xiǎn)實(shí)時(shí)預(yù)警這樣的“開(kāi)天眼”的能力,在城市交通中,MogoMind也能感知全局,優(yōu)化信號(hào)燈時(shí)長(zhǎng)、遭遇交通事故時(shí)實(shí)時(shí)規(guī)劃路徑,提升整體的道路通行效率。
MogoMind與傳統(tǒng)大模型的不同在于,它解決了大模型應(yīng)用的兩大核心問(wèn)題:
第一:具有實(shí)時(shí)感知現(xiàn)實(shí)世界的能力。
從現(xiàn)實(shí)世界里學(xué)習(xí),然后通過(guò)物理交互反饋到現(xiàn)實(shí),是MogoMind最大的特點(diǎn)。
DeepSeek也好ChatGPT也罷,市面上的大部分自然語(yǔ)言模型,大都由互聯(lián)網(wǎng)的數(shù)據(jù)集訓(xùn)練而來(lái),所以,語(yǔ)言大模型參數(shù)的大小,一定程度上代表能力的大小。
互聯(lián)網(wǎng)上的信息,其實(shí)是“二手信息”,是由人們創(chuàng)造,而且很可能會(huì)失真。比如AI“說(shuō)謊”的問(wèn)題。
今年3月份,哥倫比亞大學(xué)一份針對(duì)主流AI搜索工具的研究發(fā)現(xiàn),在測(cè)試了8款A(yù)I搜索工具后,發(fā)現(xiàn)AI引用新聞方面平均出錯(cuò)比例達(dá)60%。
各種各樣的AI大模型工具應(yīng)用越來(lái)越多,今天的AI不缺創(chuàng)造世界的能力,而是缺“認(rèn)知物理世界”的能力。
感知、理解真實(shí)世界,才是AI生產(chǎn)力的應(yīng)有之義。
與其他自然語(yǔ)言模型不同,MogoMind大模型則是直接通過(guò)傳感器獲取,比如攝像頭、毫米波雷達(dá)。
換言之,MogoMind是從現(xiàn)實(shí)的應(yīng)用場(chǎng)景里面“長(zhǎng)出來(lái)”的。
自此,AI大模型技術(shù)不再是“紙上談兵”,而是在現(xiàn)實(shí)世界里,能給人類(lèi)的混亂無(wú)序在物理意義上糾偏。
對(duì)此,我稱之為:“物理原生模型”。
實(shí)際上,“物理原生模型”能夠更多地幫助人們解決現(xiàn)實(shí)的問(wèn)題,而“數(shù)據(jù)原生模型”適合作為信息生產(chǎn)力工具,后者多是面向C端的內(nèi)容、創(chuàng)意工具產(chǎn)品。而前者更多地構(gòu)成AI影響物理世界的基礎(chǔ)設(shè)施。
之所以產(chǎn)出如此大的差異,原因之一可能在于,認(rèn)識(shí)感知真實(shí)世界的AI模型,也同樣擁有解決復(fù)雜的現(xiàn)實(shí)問(wèn)題的能力。
就引出了第二個(gè)問(wèn)題:“物理原生模型”有著全局視角下的AI推理、實(shí)時(shí)決策的能力。
實(shí)際上,多維的現(xiàn)實(shí)數(shù)據(jù)的感知、推理、分析、決策能力,使得AI大模型實(shí)現(xiàn)了從“單點(diǎn)智能”到“全局智能”,由此,AI大模型逐漸跨過(guò)“單細(xì)胞時(shí)代”。
過(guò)去的AI大模型的單點(diǎn)智能,就像是生命進(jìn)化到“單細(xì)胞生物”階段。只能對(duì)單一環(huán)境信息作出反應(yīng),執(zhí)行單一場(chǎng)景的任務(wù)。
而有了實(shí)時(shí)物理感知能力和全局AI認(rèn)知系統(tǒng),就有了感知復(fù)雜環(huán)境,并做出應(yīng)對(duì)的能力。從而過(guò)渡到“多細(xì)胞時(shí)代”。
我們還是以MogoMind大模型為例,MogoMind擅長(zhǎng)處理視頻、圖像、文本、氣象等多源數(shù)據(jù)進(jìn)行深度融合分析,所以,能夠?qū)崿F(xiàn)對(duì)物理環(huán)境信息實(shí)時(shí)認(rèn)知理解。
試想這樣一個(gè)場(chǎng)景,暴雨天氣城市積水路段,司機(jī)很難判斷前方涉水深度是否能安全通過(guò),而AI大模型可以結(jié)合實(shí)時(shí)天氣數(shù)據(jù)以及歷史事故數(shù)據(jù)預(yù)測(cè)潛在危險(xiǎn)區(qū)域。從而有效避免人身、財(cái)產(chǎn)損失。
總體來(lái)看,與DeepSeek、ChatGPT們很不同,MogoMind基于現(xiàn)實(shí)數(shù)據(jù)的大模型能力很特別。
看得出來(lái),蘑菇車(chē)聯(lián)選擇的這條路,很有前景也很有想象力。他們的目標(biāo)其實(shí)是實(shí)現(xiàn)一件事兒:把AI的數(shù)字世界,與我們生活的物理世界融合起來(lái)。

MogoMind看似做的是大模型,但其實(shí)是在做一個(gè)連接AI與現(xiàn)實(shí)的操作系統(tǒng)。
這個(gè)“操作系統(tǒng)”能夠用AI連接很多領(lǐng)域,比如自動(dòng)駕駛、智慧交通、城市治理,還能與無(wú)人機(jī)、機(jī)器人產(chǎn)業(yè)深入融合。
目前蘑菇車(chē)聯(lián)的兩大業(yè)務(wù)板塊是“AI網(wǎng)絡(luò)”和“自動(dòng)駕駛車(chē)輛”。
基于MogoMind大模型,蘑菇車(chē)聯(lián)打造出一系列具備AI能力的產(chǎn)品,并在多個(gè)城市應(yīng)用落地。比如,在進(jìn)入嘉定區(qū)實(shí)時(shí)數(shù)字孿生路口,看到車(chē)輛實(shí)時(shí)信息,例如速度、經(jīng)緯度、大小完全瞬時(shí)還原成數(shù)字孿生畫(huà)面。
這些實(shí)時(shí)數(shù)據(jù),可通過(guò)布設(shè)路側(cè)智能終端或利用已有的攝像頭等方式來(lái)獲得,然后通過(guò)AI大模型解讀分析后,再將有價(jià)值信息通過(guò)5G和C-V2X等通信技術(shù),傳輸交管部門(mén)等應(yīng)用側(cè),
對(duì)于交通領(lǐng)域參與量級(jí)最大的車(chē)輛終端,AI網(wǎng)絡(luò)同樣可以提供實(shí)時(shí)數(shù)據(jù)、實(shí)時(shí)預(yù)警和安全效率類(lèi)幫助信息。
自動(dòng)駕駛車(chē)輛業(yè)務(wù)方面,目前L2+級(jí)別的軟件已經(jīng)上車(chē),RoboBus、RoboSweeper 和RoboTaxi也已經(jīng)在北京、上海、天津等十余個(gè)城市落地運(yùn)營(yíng)?;谖锢硎澜绲恼J(rèn)知模型,這些已經(jīng)上路的車(chē)輛,進(jìn)一步深入AI大模型與物理世界的深度交互。

看完蘑菇車(chē)聯(lián)站臺(tái)的內(nèi)容,我不由得想到了由阿西莫夫小說(shuō)改編的電影《I, Robot》。其中有這么一段的劇情:威爾·史密斯飾演的警探發(fā)生交通事故之后,AI迅速出警處理事故現(xiàn)場(chǎng)。
這部電影于2004年上映,不由感慨,短短二十年后,科幻電影里的場(chǎng)景,終于有可能變成了現(xiàn)實(shí)。
其實(shí)很多科幻電影中的概念,都正在成為現(xiàn)實(shí)。
比如,數(shù)字孿生。所謂數(shù)字孿生,簡(jiǎn)單地講,就是用數(shù)據(jù)模擬現(xiàn)實(shí)世界,然后工程師、設(shè)計(jì)師可以在虛擬的世界里,低成本搞出來(lái)各種創(chuàng)新、創(chuàng)造。
現(xiàn)在各個(gè)行業(yè)比如汽車(chē)、飛機(jī)乃至火箭的設(shè)計(jì)、制造過(guò)程中都有數(shù)字孿生技術(shù)的身影。
數(shù)字孿生之外,其實(shí)還有一個(gè)更炸裂,更科幻的概念:實(shí)時(shí)孿生。
所謂實(shí)時(shí)孿生,就是AI能夠認(rèn)識(shí)、理解物理世界之后,通過(guò)數(shù)據(jù)模型的推演、決策,來(lái)實(shí)時(shí)解決現(xiàn)實(shí)里的問(wèn)題。
聽(tīng)起來(lái)有些科幻,但這就是MogoMind大模型在做的事情。
從數(shù)字孿生到實(shí)時(shí)孿生,本質(zhì)上是給AI一個(gè)自我生長(zhǎng)的機(jī)會(huì)。從認(rèn)識(shí)真實(shí)世界,到自我感知世界,AI便有了自我進(jìn)化的機(jī)會(huì)。
由此,當(dāng)AI生長(zhǎng)出自我進(jìn)化的能力,將來(lái)再與機(jī)器人產(chǎn)業(yè)結(jié)合,這便是未來(lái)二十年AI技術(shù)真正的想象力所在。

一場(chǎng)待來(lái)的物理AI應(yīng)用革命
教會(huì)AI認(rèn)知物理世界的能力,是AI技術(shù)應(yīng)用的必然趨勢(shì)。而MogoMind則踏出物理AI應(yīng)用革命的第一步。
AI大模型應(yīng)用最有前景的兩個(gè)領(lǐng)域:機(jī)器人、自動(dòng)駕駛。
本質(zhì)上這兩個(gè)領(lǐng)域的核心是一種技術(shù)體系:AI對(duì)于物理世界的影響和反饋。
馬斯克的理想與最終目的是上火星,但還是創(chuàng)立特斯拉,搞自動(dòng)駕駛,然后又搞機(jī)器人。本質(zhì)上,這是從第一性原理的角度出發(fā):一種技術(shù)要改變世界,必須是能反映到現(xiàn)實(shí)層面里的。
AI也是這個(gè)邏輯。
當(dāng)前的AI技術(shù),影響數(shù)字世界的比例太多,影響現(xiàn)實(shí)世界的比例還是太少了。
未來(lái)AI生產(chǎn)力要發(fā)展,需要一場(chǎng)“物理AI應(yīng)用革命”。
MogoMind的影響在于,它構(gòu)建了一套基礎(chǔ)交通場(chǎng)景下的AI實(shí)時(shí)物理感知能力和全局認(rèn)知系統(tǒng),相當(dāng)于“授AI以漁”。

這就好比老師教一個(gè)在幼兒園階段的孩子,要想讓孩子未來(lái)成為棟梁,就先得教他正確認(rèn)識(shí)這個(gè)世界,然后對(duì)于物理世界要做出正確的反饋。
在“教AI認(rèn)識(shí)世界”這件事兒上,MogoMind大模型踏出了關(guān)鍵的第一步。
還是拿出行領(lǐng)域來(lái)說(shuō),今天的AI大模型、自動(dòng)駕駛技術(shù)、蓬勃發(fā)展,正如當(dāng)年工業(yè)革命如火如荼,汽車(chē)工業(yè)快速增長(zhǎng)一樣。
當(dāng)年的技術(shù)為什么能迅速改變世界?
其中一個(gè)原因可能在于蒸汽機(jī)、內(nèi)燃機(jī)技術(shù)對(duì)物理世界的影響足夠直接。
跨入信息時(shí)代,人們創(chuàng)新知識(shí)的速度變快了,但技術(shù)對(duì)于物理世界的影響也變得沒(méi)那么直接了。
比如互聯(lián)網(wǎng)技術(shù),不是直接推動(dòng)生產(chǎn)力,而是改變生產(chǎn)關(guān)系,進(jìn)而推動(dòng)社會(huì)發(fā)展。
AI時(shí)代與互聯(lián)網(wǎng)時(shí)代不同,技術(shù)對(duì)物理世界的影響正在重回主流。你看,DeepSeek、ChatGPT之后最火的不還是機(jī)器人、自動(dòng)駕駛等產(chǎn)業(yè)?
在出行這個(gè)領(lǐng)域里,這種更直接影響表現(xiàn)的會(huì)更明顯。
比如,全局感知的實(shí)時(shí)交通數(shù)據(jù)流分析、決策,改變了出行效率,早上出門(mén)上班通勤,路上明顯不堵車(chē)了。

再比如,AI多模態(tài)數(shù)據(jù)理解和復(fù)雜場(chǎng)景認(rèn)知能進(jìn)一步提升車(chē)輛自動(dòng)駕駛能力,有了更強(qiáng)的輔助駕駛,開(kāi)車(chē)這件事兒變得更加輕松、愜意了。
也許,我們數(shù)十年后再回看今天發(fā)布的MogoMind,這些感受可能會(huì)更深。
其實(shí)不只是出行,如果放在整個(gè)AI產(chǎn)業(yè),AI大模型技術(shù)融合物理世界,也將成為一個(gè)重要的技術(shù)演化節(jié)點(diǎn)。
紅杉AI峰會(huì)上,OpenAI CEO 奧特曼預(yù)測(cè)了未來(lái)三年AI改變我們的生活的三種方式。他認(rèn)為,2025年,AI智能體真正開(kāi)始走向?qū)嵱茫?026年,AI做出重大科學(xué)發(fā)現(xiàn),推動(dòng)下一波經(jīng)濟(jì)增長(zhǎng);2027年,AI將進(jìn)入物理世界創(chuàng)造價(jià)值。
當(dāng)然,AI真正改變物理世界創(chuàng)造價(jià)值,還需要一個(gè)演化階段。
互聯(lián)網(wǎng)技術(shù)被發(fā)明出來(lái)之后,微軟做出了office,谷歌做出了Chrome,人們才能把PC這個(gè)工具用起來(lái)。后來(lái),隨著摩爾定律演化,PC信息處理的速度幾何倍上升,股票交易速度更快了、信息傳遞的速度也更快了。
由此,互聯(lián)網(wǎng)從技術(shù)生態(tài),走向了經(jīng)濟(jì)生態(tài)。
AI改變世界也需要從技術(shù)生態(tài),走向經(jīng)濟(jì)生態(tài)。這也是AI大模型技術(shù)融合物理世界的意義。
AI融入物理世界,是能產(chǎn)生很多經(jīng)濟(jì)效益的。比如,自動(dòng)駕駛降低了出行成本和風(fēng)險(xiǎn),那么周邊旅游是不是就更火了?再比如,在某些特定行業(yè),有機(jī)器人替代人們做危險(xiǎn)系數(shù)高的工作,是不就能減少必要的安全風(fēng)險(xiǎn)成本?
從機(jī)器人到自動(dòng)駕駛、從出行到千行百業(yè),AI進(jìn)一步融合物理世界,人們經(jīng)濟(jì)活動(dòng)的增長(zhǎng)范式,或?qū)⒕痛烁淖儭?/p>
當(dāng)AI融合物理世界足夠深,機(jī)器人實(shí)體的成本進(jìn)一步降低,電影里的全民Robot的時(shí)代,也許真就不遠(yuǎn)了。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!