
2026 年齊到 2 月了,你如果還沒傳奇過 Agentic AI,大要率不單是斷網(wǎng)這樣簡便——更像是手機齊丟了。
我我方算是從新看著這波海潮起來的。OpenClaw(那時還叫 ClawdBot)火出圈那陣子,好多東談主第一次真確「看懂」了一件事:咱們瞎想中的 AI Agent 時期,關(guān)節(jié)從來不在它能不可聊得更像東談主,而在它能不可把事辦完。
它能開瀏覽器、能點按鈕、能把一個原來需要你反復(fù)切 App 的任務(wù)拆成步調(diào),一齊推行到掃尾。你致使會在某個須臾產(chǎn)生錯覺:屏幕那頭像的確坐著一個很持重的實習(xí)助理。
與此同期,自動化操作這股風(fēng),早就吹得手機上了。無論是豆包手機這類軟硬件模式,照舊各家手機大廠在系統(tǒng)助手上的「行動化」嘗試,內(nèi)容上齊在作念并吞件事——把 AI 從對話框里拽出來,塞進系統(tǒng)和 App 的縫里,讓它去完成那些「明明很簡便但等于很煩」的操作鏈路:打車、下單咖啡、生成文檔。
但是,單純的云側(cè)智能或單純的端側(cè)推行,齊有著各自難以杰出的「天花板」。
云側(cè)的 OpenClaw 領(lǐng)有雄偉的推明智力,但它看不見你手機當(dāng)下的屏幕,不知談你此刻的地輿位置,更不敢徑直操作你土產(chǎn)貨的微信去發(fā)個紅包;而市面上常見的純端側(cè)助手,誠然能調(diào)用土產(chǎn)貨的數(shù)據(jù)和應(yīng)用,卻通常因為硬件算力松手,在面對高復(fù)雜、長經(jīng)由任務(wù)時顯得「才略不夠用」。
遷徙端 AI Agent 的贏輸手,早就不是「作念云照舊作念端」的遴選題,而是怎樣把兩者的上風(fēng)真確買通。近期,一家清華系團隊「萬象智維」遴選用「小萬」切入阛阓,押注的恰是這樣一套買通端云的智力體系: 讓云表作念「大腦」,講求復(fù)雜邏輯與計劃;讓端側(cè)作念「當(dāng)作」,講求感知與臨了一公里推行。
? 01不僅是「能最先」,
更是「單干明確」
?在 AI Agent 的應(yīng)用場景中,開采的定位互異永久是制約體驗升級的關(guān)節(jié)。電腦與云處事器是天生的后果器用,憑借 7×24 小時不時交啟動的上風(fēng),擅長承載復(fù)雜計較與耐久推行類任務(wù)。而手機則是中樞糊口器用,千里淀著最細碎、最個東談主化的行為民風(fēng)和凹凸文數(shù)據(jù)。
傳統(tǒng)的念念路是:要么把所少見據(jù)傳上云,但這瀕臨陰私和蔓延的挑戰(zhàn);要么在端側(cè)硬跑大模子,但這會燒穿手機的電板和算力。
「萬象智維」的解法是 「端側(cè) GUI + 云側(cè) CLI」 的本事單干。
在「小萬」的居品架構(gòu)中,手機被定位為 凹凸文的主要進口與推行結(jié)尾 。它自然知談你是誰、你咫尺在什么時辰和場地、你正在用哪些應(yīng)用。而云表的 OpenClaw 則發(fā)達其復(fù)雜推理與多任務(wù)頤養(yǎng)智力,講求耐久啟動任務(wù)、系統(tǒng)級 API 操作等中樞使命。
咱們不錯通過兩個實在的場景,來望望這種「端云協(xié)同」是怎樣比單一端側(cè)更聰惠的:
場景一:復(fù)短文檔的「端-云-端」勤勉
當(dāng)你收到一份幾十頁的本事文檔時,單純的端側(cè)模子通常讀不懂深層邏輯,而單純的云表模子又無法徑直操作你的土產(chǎn)貨 App。
在「小萬」的經(jīng)由里, 端側(cè) Agent 最初接管,期騙土產(chǎn)貨算力索求文檔的關(guān)節(jié)信息;隨后,任務(wù)流轉(zhuǎn)至 云表 ,由 OpenClaw 進行深度的邏輯梳理和摘錄生成——這是手機土產(chǎn)貨算力難以企及的。臨了,處理好的論斷回傳至手機,由 端側(cè) Agent 再次接辦,盤考你是否需要「發(fā)送給共事」或「保存到札記」,并徑直調(diào)用微信完成發(fā)送。
用戶感知到的是一次清楚的處事,但后臺其實發(fā)生了兩次「端-云-端」的職能叮嚀。
場景二:基于感知的智能通勤
朝晨醒來, 端側(cè) Agent 基于土產(chǎn)貨傳感器感知到「外面下雨了」,并讀取了你土產(chǎn)貨日程中「朝晨 9 點有會」的信息。
這些凹凸文被脫敏后發(fā)送給 云表 ,云表大腦飛快計劃出一條躲閃擁擠的打車決策,并決策出「需要提前啟程」。
當(dāng)決策篤定后,領(lǐng)導(dǎo)回到 端側(cè) 。此時,「小萬」徑直在手機土產(chǎn)貨喚起打車 App,自動填寫標(biāo)的地、遴選車型,并停在支付證實頁面恭候你點擊。
這種「端側(cè)感知、云側(cè)決策、端側(cè)推行」的高效協(xié)同模式,既隱匿了純端側(cè)智能智力不及的短板,也懲處了純云表智能枯竭場景感知和陰私操心的痛點。
{jz:field.toptypename/} ? 02真確懲處的難點:
算力、成本與陰私
?從 Demo 走向?qū)嵱茫欢〞馐芤欢延矄栴}。先說最履行的: 成本與后果 。
把智能體裝進手機聽起來很容易,但現(xiàn)成決策沒法徑直照搬。高頻調(diào)用的正常場景里,Token 成本繞不外去;手機端還要算澄瑩內(nèi)存、功耗、溫度、蔓延。你不錯在云表把模子堆得很大,手機端必須把每一次 Token、每一次訪存、每一次頤養(yǎng)齊算昭著。
哪怕是 OpenClaw,也會豪恣耗盡大模子處事的 Tokens。不少網(wǎng)友在酬酢媒體吐槽賬單太夸張,時時彩app官方下載好多專科用戶一天就能跑出數(shù)百好意思元。如果讓手機里的每一個小動作齊去問一遍云表大模子,這在營業(yè)上是跑欠亨的。
「萬象智維」給出的旅途,是算法與系統(tǒng)的深度協(xié)同優(yōu)化,重心作念了兩件關(guān)節(jié)本事使命。
最初,是對端側(cè)推理框架的「極限壓榨」。
既然是協(xié)同,端側(cè)就不可太弱。「萬象智維」開發(fā)了一套名為「OmniInfer-VLM」的框架,旨在榨干手機 NPU 的性能。數(shù)據(jù)露出,在不舍棄精度的前提下,該框架能讓多模態(tài)推理速率相對傳統(tǒng) CPU 決策援手接近 20 倍。
這意味著,像屏幕識別、OCR 索求、簡便的意圖判斷這些高頻操作,實足不錯在土產(chǎn)貨毫秒級完成,無需聯(lián)網(wǎng),既快又省。
在此之上,所以「行為」為中樞的牽記系統(tǒng)。
并不是所有任務(wù)齊需要「念念考」。履行中,咱們每天的點咖啡、打卡旅途是高度重疊的。每次齊從零推理不僅慢,也更容易出錯。
團隊引入了一套牽記系統(tǒng),將用戶的高頻操作旅途空洞成數(shù)學(xué)模子記載在土產(chǎn)貨。當(dāng)你第十次點并吞種咖啡時,系統(tǒng)不再需要云表的大腦再行推理「何如點」,而是徑直調(diào)用土產(chǎn)貨的行為牽記,進行自動化推行。
這不僅讓推行速率更快,更貧窮的是,它大幅減少了對騰貴云表算力的調(diào)用次數(shù)——據(jù)測算,這種機制能讓平均推理蔓延鐫汰約 1.49 倍。
此外,還有陰私的「護城河」。
在 Agent 時期,陰私不僅是數(shù)據(jù),更是行為。比擬于部分決策將每一幀截屏齊上傳云表進行分析,端云協(xié)同架構(gòu)提供了一種折衷的安全性:敏銳的凹凸文(如微信聊天記載、支付密碼頁面)永久保留在端側(cè)處理;只好經(jīng)過脫敏、任務(wù)需要的空洞領(lǐng)導(dǎo)才會發(fā)往云表。這誠然無法作念到 100% 的物理遠離,但比擬純云表接管,它在架構(gòu)上為用戶保留了數(shù)據(jù)的「所有權(quán)」。
落地與生態(tài):
清華系團隊的工程化答卷
?AI 硬件需要的是一種低算力、但在高頻場景下仍然鼓脹順的懲處決策。想走到正常使用,總要面對一個履行:算力不可能無窮,體驗卻必須夠穩(wěn)。
咫尺,這套決策也曾不單是停留在 PPT 上。字據(jù)居品信息,「小萬」咫尺已完畢了端側(cè)抓久化的凹凸文牽記,在實足依靠端側(cè)本身算力相助云表頤養(yǎng)的條目下,復(fù)古約 40 款主流應(yīng)用,脫色約 150 個場景任務(wù)。無論是打車、消費、支付等正常任務(wù),照舊計劃聯(lián)系日程,齊不錯通過「小萬」來完成。
這組數(shù)字誠然不可等同于「萬能 Agent」,但卻勾勒了一張澄瑩的工程化道路圖:先把高頻、可考證的任務(wù)作念塌實,再把脫色面鋪開。
而在部署上,「萬象智維」通常把「土產(chǎn)貨化」當(dāng)成中樞智力籌商:「小萬」的端側(cè)任務(wù)主要期騙手機土產(chǎn)貨算力完成;云側(cè)會為每位用戶開設(shè)零丁的編造云處事。對有土產(chǎn)貨部署需求的企業(yè)用戶,他們還提供了土產(chǎn)貨化部署 OpenClaw 的決策,通過 API 無縫接入「小萬」,進一步鐫汰陰私操心。
這套鍛真金不怕火的工程化打法背后,是豐足的本事積蓄。「萬象智維」依托清華大學(xué)端智能聯(lián)系團隊孵化誕生,中樞團隊在清華大學(xué)計較機系任炬副素質(zhì)與清華大學(xué)智能產(chǎn)業(yè)聯(lián)系院李元春助理素質(zhì)的耐久領(lǐng)導(dǎo)下,在端側(cè)模子輕量化與高效推理界限有著塌實積蓄。公司誕生后首輪融資便得回歸自星連老本事投的數(shù)千萬元天神輪投資,也側(cè)面印證了行業(yè)對其本事道路的認同。
? 04以前:從東談主機交互到
Agent-to-Agent
?如果說 OpenClaw 讓咱們看到「Agent 不錯最先」的可能性,那么「小萬」更像在講述另一個問題:當(dāng)最先發(fā)生在更多模式的端側(cè)開采上,智能體還能不可把事辦完,而且辦得讓東談主定心?
以前的端側(cè) AI,無意不會局限在手機這一個模式上。眼鏡、腕表、致使是以前的新式結(jié)尾,它們內(nèi)容上齊是一個個「端側(cè) Agent」。它們各自領(lǐng)有不同的傳感器和推行智力(有的能看,有的能跑),而云表則是一個通用的「超等大腦」。
「萬象智維」正在構(gòu)建的,恰是糾合這兩者的中間層—— Agent-to-Agent 的交互網(wǎng)羅 。
在這套網(wǎng)羅中,任務(wù)不再被綁定在某一臺開采上,而是由云表融合計劃,分發(fā)給最得當(dāng)?shù)亩藗?cè)開采去推行。遷徙端 AI 的「最先時期」也曾開場。真確的分水嶺,無意不在于誰的模子參數(shù)更大,而在于誰能用最工程化的技巧,把聰惠(云)和靠譜(端)真確聯(lián)結(jié)在一齊,懲處那些用戶每天齊要作念、又最怕出錯的瑣事。

備案號: