1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

 2024-09-03 11:00  來(lái)源:A5專(zhuān)欄  我來(lái)投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?從實(shí)在智能最新發(fā)布的實(shí)在Agent 7.0,看RPA Agent的迭代升級(jí)抓取豆瓣信息、自己制作PPT,這款A(yù)I Agent真的實(shí)現(xiàn)了流程全自動(dòng)化AI Agent構(gòu)建到執(zhí)行全自動(dòng)化,持續(xù)進(jìn)化RPA Agent再次降低智能體應(yīng)用門(mén)檻實(shí)在智能重磅發(fā)布實(shí)在Agent 7.0 ,這款神器做到了B端與C端通吃C端AI Agent構(gòu)建與應(yīng)用實(shí)現(xiàn)端到端,這個(gè)智能體構(gòu)建平臺(tái)真的不一般

文/王吉偉

智能體的爆發(fā),意味著大語(yǔ)言模型的快速落地與應(yīng)用。所以它一經(jīng)提出便如泄洪之水一發(fā)而不可收,直至現(xiàn)在如火如荼。

尤其是在智能體工作流(Agentic Workflow)的加持下,智能體表現(xiàn)出了更強(qiáng)的易用性和適應(yīng)性。除了解決簡(jiǎn)單工作流的自動(dòng)化,也在積極融合進(jìn)入更多的傳統(tǒng)業(yè)務(wù)流程和應(yīng)用場(chǎng)景。

王吉偉頻道在《Agentic Workflow新范式,基于大語(yǔ)言模型的工作流、業(yè)務(wù)流程、智能體大融合》一文中提到過(guò),廣義上的Agentic Workflow是包含傳統(tǒng)軟件(工具、解決方案)、大語(yǔ)言模型、AI Agent等在內(nèi)的新型業(yè)務(wù)流程的集合,其中用RPA等超自動(dòng)化工具將輕量化LLM工作流與傳統(tǒng)工作流相連接的工作流,將會(huì)成為企業(yè)業(yè)務(wù)流程的重要形式。

當(dāng)前的AI Agent構(gòu)建平臺(tái)所構(gòu)建的AI Agent通過(guò)各種插件和工作流已經(jīng)可以做到較長(zhǎng)的流程,但仍然無(wú)法操作沒(méi)有API接口和沒(méi)有開(kāi)放API的大型以及遺留的企業(yè)級(jí)應(yīng)用程序,并且API接口也不能保障絕對(duì)的穩(wěn)定。

因此在智能體的應(yīng)用上,用RPA來(lái)連接多種應(yīng)用系統(tǒng)以保障數(shù)據(jù)的流通是不可或缺的,這對(duì)于已將RPA應(yīng)用于企業(yè)運(yùn)營(yíng)人機(jī)交互層的組織來(lái)說(shuō)則更加重要。

在企業(yè)級(jí)智能體的解決方案上,基于RPA構(gòu)建的或者以RPA為tools的RPA Agent越發(fā)受到廣大組織重視,原因正是它能夠彌補(bǔ)單純的API類(lèi)智能體的不足,可以通過(guò)“API+UI”雙重自動(dòng)化極大提升智能體的應(yīng)用潛力。RPA已經(jīng)成為智能體的重要技術(shù),也是實(shí)現(xiàn)基于LLM的智能自動(dòng)化的必要技術(shù)之一。

從去年LLM爆發(fā)以來(lái),RPA\超自動(dòng)化廠商們也都在持續(xù)進(jìn)化,完成了RPA Agent的產(chǎn)品化進(jìn)階。那么它們進(jìn)化到什么程度了?在王吉偉頻道寫(xiě)這個(gè)選題期間,恰好實(shí)在智能發(fā)布了最新產(chǎn)品實(shí)在Agent 7.0。這篇文章,我們就以這款產(chǎn)品為例,透視國(guó)產(chǎn)RPA Agent產(chǎn)品的發(fā)展情況。

先來(lái)看兩個(gè)例子

在詳細(xì)介紹實(shí)在Agent之前,先來(lái)看幾個(gè)實(shí)際操作案例。

案例1:采集豆瓣新片排行榜發(fā)送給同事

這是一個(gè)娛樂(lè)類(lèi)的案例。如果你想為同事推薦最新的十部電影,過(guò)去需要打開(kāi)豆瓣電影的新品排行榜,逐個(gè)復(fù)制電影名稱(chēng),通過(guò)微信或者釘釘發(fā)送給朋友?,F(xiàn)在使用實(shí)在Agent,只需要打開(kāi)軟件,輸入 「采集豆瓣電影片排行榜前十(電影名、評(píng)分)」,它就能自動(dòng)分析你的需求并拆解成執(zhí)行步驟,然后點(diǎn)一下 執(zhí)行 ,它就會(huì)自動(dòng)采集相關(guān)數(shù)據(jù)并把數(shù)據(jù)填入到釘釘,發(fā)送給你的同事。

案例2:在騰訊文檔制做年終匯報(bào)幻燈片

這是一個(gè)辦公應(yīng)用的案例。按照正常步驟操作這個(gè)業(yè)務(wù)流程,需要打開(kāi)騰訊文檔,搜索相關(guān)文檔,再制作成PPT。使用實(shí)在Agent智能體,只需要告訴它 「明天要去匯報(bào),去騰訊文檔里做一個(gè)叫年中匯報(bào)的幻燈片 」,它就會(huì)把你的需求拆解成相應(yīng)的執(zhí)行步驟,然后點(diǎn)擊 執(zhí)行 按鈕,幾分鐘后就能在騰訊文檔走出一個(gè)幻燈片。

除了這兩個(gè)案例,實(shí)在智能還給王吉偉頻道展示了獲取百度貼吧前10個(gè)熱門(mén)貼吧相關(guān)信息、京東關(guān)注商品降價(jià)通知發(fā)送、京東購(gòu)物車(chē)商品結(jié)算等案例。

王吉偉頻道還實(shí)際測(cè)試了12306查詢車(chē)次、給微信好友添加標(biāo)簽及發(fā)送信息等應(yīng)用案例,都能一一完成。實(shí)在Agent智能體預(yù)制了很多代表性案例,感興趣的朋友可以親自嘗試。

據(jù)悉,目前實(shí)在Agent已經(jīng)能夠?qū)︶斸?、微信、企業(yè)微信等集成辦公軟件進(jìn)行精確操作,并能通過(guò)屏幕識(shí)別技術(shù)對(duì)淘寶、京東、攜程及12306等網(wǎng)站進(jìn)行精確識(shí)別。

實(shí)在智能正在對(duì)更多的軟件系統(tǒng)進(jìn)行適配,以后大家需要操作的工作、生活及學(xué)習(xí)等業(yè)務(wù)流程,都能通過(guò)使用自然語(yǔ)言與實(shí)在Agent智能體交流實(shí)現(xiàn)相應(yīng)業(yè)務(wù)流程的自動(dòng)化,且這些Agent流程都是可以復(fù)用的,一次創(chuàng)建多次使用。

實(shí)在Agent 7.0.0有什么特點(diǎn)?

以上兩個(gè)實(shí)操案例,來(lái)自于實(shí)在Agent 7.0。新版Agent 7.0具備以下幾個(gè)特點(diǎn):

自然對(duì)話交互:“All in One”式助理工作體驗(yàn);意圖理解、流程規(guī)劃:更為強(qiáng)大的意圖理解+流程精準(zhǔn)拆解規(guī)劃能力;多代產(chǎn)品能力集成:實(shí)現(xiàn)一代RPA、二代IPA數(shù)字員工元素拾取、組件、流程編排等全部能力集成;軟件界面精準(zhǔn)操作:Agent多模態(tài)屏幕語(yǔ)義理解,屏幕掃描識(shí)別,界面精準(zhǔn)操作;

實(shí)在智能千億參數(shù)訓(xùn)練的底層TRAS大模型也再次進(jìn)化,訓(xùn)練參數(shù)量更大,支持自然語(yǔ)言溝通工作、科普知識(shí),高效執(zhí)行任務(wù)完成工作,對(duì)話工作兩不誤。

在智能問(wèn)答方面,基于實(shí)在智能文檔系統(tǒng)(IDP),能夠給實(shí)現(xiàn)文件的精確問(wèn)答及處理。

此外,該公司已經(jīng)繼續(xù)深入探索企業(yè)大模型、數(shù)字員工運(yùn)營(yíng)管理平臺(tái)、RAG和Agentic Workflow等技術(shù)和產(chǎn)品整合研究,實(shí)在智能創(chuàng)始人孫林君曾在2024年世界人工智能大會(huì)上提到“企業(yè)大腦”解決方案。

目前它們正在逐步推出企業(yè)知識(shí)庫(kù)定制訓(xùn)練服務(wù),通過(guò)RAG讓Agent能夠回答企業(yè)內(nèi)部專(zhuān)屬的知識(shí)內(nèi)容和流程內(nèi)容,讓知識(shí)和流程資產(chǎn)創(chuàng)新價(jià)值。

之所以能做到這些,在于其對(duì)于技術(shù)和產(chǎn)品研發(fā)的執(zhí)著,并且產(chǎn)研投入量極大。此次版本大更新花費(fèi)近一年時(shí)間,深入更新迭代了底層較多技術(shù)架構(gòu)、功能架構(gòu)、RPA組件等。

實(shí)在智能在RPA有6年技術(shù)沉淀,在AI有6年能力、人才等的積累,多年的技術(shù)沉淀、對(duì)市場(chǎng)需求的準(zhǔn)確把握以及對(duì)技術(shù)走向的前瞻性預(yù)判,使得他們能夠在LLM與AI Agent爆發(fā)之后先一步扛起RPA Agent的行業(yè)大旗。

作為國(guó)內(nèi)首家發(fā)布明確意義上的AI Agent智能體的公司,實(shí)在智能的系列產(chǎn)品已經(jīng)先一步實(shí)現(xiàn)依據(jù)個(gè)人訴求生成工作流程、識(shí)別工作環(huán)境(瀏覽器、網(wǎng)頁(yè)、通訊軟件、工作軟件等)、自主執(zhí)行任務(wù)及流程,在保證智能體能夠在B端為廣大組織提供企業(yè)級(jí)服務(wù)的同時(shí),也用標(biāo)準(zhǔn)化、易用化的產(chǎn)品進(jìn)入C端市場(chǎng)服務(wù)更多個(gè)人用戶。

與Coze等Agent平臺(tái)有什么區(qū)別?

看了上面兩個(gè)案例,是不是感覺(jué)使用實(shí)在Agent超級(jí)簡(jiǎn)單?

沒(méi)錯(cuò),使用實(shí)在Agent智能體的全部流程僅是 「輸入需求-點(diǎn)擊執(zhí)行-收到結(jié)果」 這么簡(jiǎn)單,完全不用考慮其他操作,實(shí)現(xiàn)了軟件使用上的端到端。理論上,隨著軟件的不斷迭代,這種端到端的方式可以做到任何業(yè)務(wù)流程的自動(dòng)化創(chuàng)建和自動(dòng)化執(zhí)行。

提及智能體,目前大家更熟悉的可能是Coze、Dify、GPTs等平臺(tái)上用戶所創(chuàng)建的各種智能體。從上面的案例大家應(yīng)該能夠體會(huì)到,實(shí)在Agent與它們最大的區(qū)別是在智能體構(gòu)建上幾乎不需要人為參與(流程中斷時(shí)需要人為干預(yù)),都由實(shí)在Agent自行完成。

其他平臺(tái)的Agent構(gòu)建方式是:人力構(gòu)建智能體,智能體自動(dòng)化執(zhí)行任務(wù)。實(shí)在Agent的構(gòu)建方式則是:自動(dòng)化構(gòu)建智能體,智能體自動(dòng)化執(zhí)行任務(wù)。這種方式,實(shí)現(xiàn)了從構(gòu)建到執(zhí)行的全自動(dòng)化。

所以,在使用實(shí)在Agent智能體時(shí),用戶不用再像在Coze等平臺(tái)一樣通過(guò)輸入提示詞、選擇插件、搭建工作流等操作去構(gòu)建一個(gè)智能體,極大地節(jié)省了用戶構(gòu)建應(yīng)用的時(shí)間(自動(dòng)化構(gòu)建可以讓用戶忙其他事情),并進(jìn)一步降低了智能體的構(gòu)建門(mén)檻,真正實(shí)現(xiàn)了一句話構(gòu)建智能體,所想即所得。

此外,想要在智能體平臺(tái)構(gòu)建能夠深度操作釘釘、微信等智能體,沒(méi)有相應(yīng)的API接口是無(wú)法實(shí)現(xiàn)的,且平臺(tái)生態(tài)之間的API還存在著一定的連接安全性、限制性等問(wèn)題,通過(guò)RPA模仿人類(lèi)操作的形式則完成杜絕了此類(lèi)問(wèn)題的發(fā)生。

端到端這個(gè)術(shù)語(yǔ)經(jīng)常應(yīng)用于B端企業(yè)級(jí)技術(shù)解決方案,主要強(qiáng)調(diào)技術(shù)、方案、流程及系統(tǒng)的完整性,也更強(qiáng)調(diào)產(chǎn)品應(yīng)用的易用性和廣泛性。

實(shí)在智能的端到端,一方面可以理解為從B端到C端。因?yàn)閷?shí)在智能要做的,不僅是能在B端為企業(yè)提供專(zhuān)業(yè)級(jí)的Agent數(shù)字員工解決方案,更要在C端為個(gè)人用戶帶來(lái)解決長(zhǎng)尾低頻自動(dòng)化需求的智能助理。從全新的實(shí)在Agent 7.0來(lái)看,他們做到了。

另一方面,還可以理解為C端的技術(shù)實(shí)現(xiàn)。實(shí)在Agent把“端到端”的技術(shù)特點(diǎn)和便捷特性賦予了智能體的C端構(gòu)建與應(yīng)用,把“RPA人人可用”的愿景進(jìn)一步拓展為”Agent人人可用”。在LLM的加持下,這個(gè)愿景將會(huì)快速變?yōu)楝F(xiàn)實(shí)。

2023年8月,隨著實(shí)在Agent智能體的面世,實(shí)在智能成為國(guó)內(nèi)首家發(fā)布AI Agent智能體的AI科技公司。2024年8月,實(shí)在Agent 7.0發(fā)布后,實(shí)在智能再次成為RPA業(yè)界首家推出Agent產(chǎn)品形態(tài)的AI科技企業(yè)。

而這個(gè)進(jìn)程,僅用了1年。

【王吉偉頻道,關(guān)注AIGC與IoT,專(zhuān)注數(shù)字化轉(zhuǎn)型、業(yè)務(wù)流程自動(dòng)化與AI Agent,歡迎關(guān)注與交流?!?/p>

全文完

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • Figma股價(jià)熱情僅存1天,AI焦慮成關(guān)鍵隱憂?

    文/道哥美國(guó)設(shè)計(jì)軟件公司Figma近期在紐約證券交易所掛牌上市,首日即上演“狂飆”行情——發(fā)行價(jià)定每股33美元,開(kāi)盤(pán)報(bào)價(jià)85美元,較發(fā)行價(jià)翻倍。首日收?qǐng)?bào)115.50美元,較發(fā)行價(jià)大漲約250%,市值飆升至近670億美元,創(chuàng)下近30年來(lái)同等規(guī)模美股IPO的最大單日漲幅紀(jì)錄。然而,隨著短線資金獲利了結(jié),

    標(biāo)簽:
    ai智能
  • 人類(lèi)首屆機(jī)器人運(yùn)動(dòng)會(huì):跑歪了+撞人了+打哆嗦,但我卻看到了中國(guó)智造的未來(lái)

    8月16日,盧松松非常榮幸的成為了一名《2025世界人形機(jī)器人運(yùn)動(dòng)會(huì)》的觀眾。這是一場(chǎng)超酷的機(jī)器人運(yùn)動(dòng)會(huì),也是人類(lèi)給機(jī)器人辦的第一屆奧運(yùn)會(huì),來(lái)自16個(gè)國(guó)家的280支隊(duì)伍會(huì)參加500多個(gè)比賽項(xiàng)目。看了一天的比賽,晚上就回來(lái)寫(xiě)文章,編輯短視頻。先說(shuō)感悟:(1)這是人類(lèi)首次給機(jī)器人辦的第一屆運(yùn)動(dòng)會(huì),史無(wú)前

    標(biāo)簽:
    智能機(jī)器人
  • AI「帶飛」騰訊業(yè)績(jī)

    文/一燈來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)在當(dāng)前無(wú)人敢缺席的AI軍備競(jìng)賽中,巨頭們一面為巨額的資本支出焦慮,一面又向市場(chǎng)勾勒著未來(lái)的宏偉藍(lán)圖。在各家動(dòng)輒千億級(jí)投入的背景下,市場(chǎng)迫切需要一份關(guān)于AI回報(bào)價(jià)值的有力證明。而騰訊,率先給出了答卷。8月13日,騰訊控股發(fā)布2025年第二季度財(cái)報(bào)。盡管資本開(kāi)支同比劇增119%,達(dá)

    標(biāo)簽:
    ai智能
    騰訊
  • Meta用億元薪酬發(fā)起「人才狙擊」能否買(mǎi)來(lái)一個(gè)AI未來(lái)?

    文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)2025年的硅谷,一場(chǎng)沒(méi)有硝煙的戰(zhàn)爭(zhēng)正以前所未有的烈度上演。這場(chǎng)戰(zhàn)爭(zhēng)的核心武器不是代碼或芯片,而是人——那些全球僅有數(shù)千名、能夠構(gòu)建未來(lái)人工智能基礎(chǔ)模型的頂尖大腦。在這場(chǎng)激烈的人才爭(zhēng)奪戰(zhàn)中,Meta及其首席執(zhí)行官馬克·扎克伯格(MarkZuckerberg)正扮演著最具侵略性的

    標(biāo)簽:
    ai智能
  • 騰訊AI夢(mèng):克制的雄心

    關(guān)乎14億用戶的深刻變化

    標(biāo)簽:
    ai智能
  • 阿里媽媽、巨量引擎、騰訊廣告,誰(shuí)是當(dāng)代“AI印鈔機(jī)”?

    阿里媽媽、巨量引擎、騰訊廣告,誰(shuí)是當(dāng)代“AI印鈔機(jī)”?

編輯推薦