1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

AI Agent涌向移動(dòng)終端,手機(jī)智能體開啟跨端跨應(yīng)用業(yè)務(wù)連接新場(chǎng)景

 2024-03-06 17:08  來源:A5專欄  我來投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過

AI Agent涌向移動(dòng)終端,手機(jī)智能體勢(shì)不可擋

還沒搞清楚什么是AI Agent,手機(jī)Agent就已經(jīng)橫空出世

AIGC為何涌向移動(dòng)端?背后有哪些邏輯?什么是手機(jī)智能體?一文看明白

科技大廠、手機(jī)廠商、企服領(lǐng)域都在發(fā)力,手機(jī)智能體成AI Agent新趨勢(shì)

AI Agent迎來移動(dòng)端大爆發(fā),手機(jī)智能體將成企業(yè)AIGC新標(biāo)配

AI Agent移動(dòng)應(yīng)用大升級(jí),手機(jī)智能體開啟跨端跨應(yīng)用業(yè)務(wù)連接新場(chǎng)景

文/王吉偉

春節(jié)期間OpenAI推出的AI視頻模型Sora火出天際,到處都是文生視頻模型如何厲害如何改變真實(shí)世界的信息,以至于OpenAI在AI Agent方面的最新動(dòng)向都被掩蓋了。

春節(jié)前的2月8日,科技媒體The Information報(bào)道OpenAI正開發(fā)兩款革命性的Agent軟件,其中一款能夠有效接管客戶的設(shè)備來自動(dòng)執(zhí)行復(fù)雜的任務(wù)。

據(jù)說,這個(gè)Agent能夠自動(dòng)執(zhí)行點(diǎn)擊、光標(biāo)移動(dòng)、文本輸入等操作,與人類操作軟件無異。例如,把文檔中的數(shù)據(jù)傳輸?shù)诫娮颖砀裰羞M(jìn)行分析,或者自動(dòng)填寫費(fèi)用報(bào)告并將其輸入會(huì)計(jì)軟件,或者根據(jù)一定的預(yù)算制定行程或預(yù)訂機(jī)票。

這個(gè)能夠直接操縱個(gè)人電腦自動(dòng)完成各種任務(wù)的智能體,現(xiàn)在被更多媒體稱作AI Agent 2.0。

這些報(bào)道沒有具體說明這款A(yù)gent所接管的設(shè)備是PC還是手機(jī),不過ChatGPT有移動(dòng)端,能夠在手機(jī)或者平板上調(diào)用這個(gè)Agent是遲早的事。

想要在移動(dòng)端構(gòu)建AI Agent的大語言模型(LLM,Large Language Models)廠商,遠(yuǎn)不止OpenAI這一家。

去年12月,騰訊與德州大學(xué)達(dá)拉斯分校合作推出了一個(gè)名為AppAgent的項(xiàng)目。該項(xiàng)目可以通過自主學(xué)習(xí)和模仿人類的點(diǎn)擊和滑動(dòng)手勢(shì),在手機(jī)上執(zhí)行各種任務(wù)。

項(xiàng)目地址:

https://github.com/mnotgod96/AppAgent

論文地址:

https://arxiv.org/abs/2312.13771

包括在社交媒體上發(fā)帖、幫助用戶撰寫和發(fā)送郵件、使用地圖、在線購物,甚至進(jìn)行復(fù)雜的圖像編輯。AppAgent在50個(gè)任務(wù)上進(jìn)行了廣泛測(cè)試,涵蓋了10種不同的應(yīng)用程序。

2月初,阿里巴巴與北京交通大學(xué)聯(lián)合推出了一款全新的手機(jī)操作智能體框架Mobile-Agent。該框架的核心優(yōu)勢(shì)在于其純視覺解決方案。傳統(tǒng)的手機(jī)操作方式往往需要依賴XML等標(biāo)記語言以及系統(tǒng)元數(shù)據(jù),而Mobile-Agent則完全摒棄了這些需求。

項(xiàng)目地址:

https://github.com/X-PLUG/MobileAgent

論文地址:

https://arxiv.org/abs/2401.16158v1

這意味著,用戶無需進(jìn)行復(fù)雜的設(shè)置或修改,只需通過直觀的視覺指示即可完成操作。

除了科技大廠,LLM創(chuàng)業(yè)團(tuán)隊(duì)也推出了相應(yīng)的Agent項(xiàng)目。比如在去年12月,清華&智譜AI團(tuán)隊(duì)推出的CogAgent-Chat。CogAgent是一個(gè)基于180億參數(shù)規(guī)模的視覺語言模型(VLM)的圖形用戶界面(GUI)智能體,專注于GUI圖形交互界面的理解和導(dǎo)航。

CogAgent使用屏幕截圖作為輸入,在PC和Android GUI導(dǎo)航任務(wù)上超越了基于語言模型的方法,如Mind2Web和AITW,引領(lǐng)了GUI理解領(lǐng)域的最新技術(shù)發(fā)展。

論文:

https://arxiv.org/abs/2312.08914

代碼:

https://github.com/THUDM/CogVLM

Demo:http://36.103.203.44:7861/

如今的大語言模型在具體應(yīng)用方面都是多端通用,MAS和SaaS模式使得LLM廠商推出的AI Agent構(gòu)建平臺(tái)及個(gè)體能夠應(yīng)用于手機(jī)端也是必然。

AI智能體涌向移動(dòng)端,已經(jīng)成為AIGC行業(yè)發(fā)展的必然趨勢(shì)。

(注:回復(fù) 手機(jī)Agent 獲取本文提到的所有研報(bào)資源。)

AI Agent趨勢(shì):涌向移動(dòng)端

系統(tǒng)廠商與終端廠商的步子,甚至比大模型廠商邁得還要大。畢竟他們更貼近用戶,了解市場(chǎng)需要什么,也知道自己在哪里突破。

這些廠商對(duì)于AI Agent的探索比我們預(yù)想得要早很多,且已經(jīng)拿出初步成果。

也是在春節(jié)前夕,微軟推出了名為UFO的Windows Agent。這是一款用于構(gòu)建用戶界面(UI)交互智能體的 Agent 框架,能夠快速理解和執(zhí)行用戶的自然語言請(qǐng)求。

項(xiàng)目地址:

https://github.com/microsoft/UFO

技術(shù)報(bào)告:

https://arxiv.org/abs/2402.07939

UFO可以在Windows內(nèi)自主回答用戶查詢,可在單個(gè)或者跨多個(gè)App中無縫導(dǎo)航和操作來滿足Windows 操作系統(tǒng)上的用戶請(qǐng)求??梢愿又悄艿乩斫庥脩舻囊鈭D,不用人工干預(yù),自動(dòng)執(zhí)行相應(yīng)的操作。

如果你想從一份Word文檔中提取文本、對(duì)照片應(yīng)用程序中的圖像進(jìn)行觀察、以及總結(jié) PowerPoint中的內(nèi)容,利用所有這些信息撰寫一封深度的電子郵件內(nèi)容并完全自主發(fā)送時(shí),你只需要借助一個(gè)UFO框架就可以完成。

這意味著,以前需要大量手動(dòng)工作的跨應(yīng)用程序工作流程,現(xiàn)在可以直接簡(jiǎn)化為針對(duì) UFO 的簡(jiǎn)單自然語言指令。

UFO,或許會(huì)成為下一代Windows系統(tǒng)的核心。以后搭載windows系統(tǒng)的筆記本電腦等移動(dòng)終端,將會(huì)因UFO而開啟全新用戶體驗(yàn)。

重點(diǎn)在于,其他系統(tǒng)也會(huì)效仿Windows,AI Agent將會(huì)成為各個(gè)系統(tǒng)的標(biāo)配。

把LLM以及AI Agent裝入PC或者移動(dòng)終端,硬件廠商將其稱作AI PC或者AI 手機(jī)。

自從LLM能夠在端側(cè)部署之后,硬件廠商們就開啟了狂飆模式,而LLM的落地應(yīng)用主要途徑的AI Agent模式也首先進(jìn)入其法眼。

在2024 CES上,聯(lián)想首次提出“智能終端AI OS”,即在AI技術(shù)驅(qū)動(dòng)下,智能終端將內(nèi)嵌個(gè)人Agent(智能體)、個(gè)人大模型、本地知識(shí)庫、應(yīng)用接口,形成下一代AI OS。并認(rèn)為,AI技術(shù)的突破將在PC、手機(jī)、AIoT等所有智能終端產(chǎn)品領(lǐng)域掀起第三次技術(shù)革命浪潮,重塑終端體驗(yàn)及產(chǎn)業(yè)生態(tài)。

據(jù)悉,聯(lián)想個(gè)人Agent或?qū)⒃?月份與用戶見面。

面對(duì)新生代AI硬件設(shè)備AI pin和Rabbit R1 所展現(xiàn)的“準(zhǔn)AI Agent”屬性,手機(jī)廠商們?cè)缫呀?jīng)坐不住,強(qiáng)勢(shì)展開了對(duì)AI智能體的角逐。

1月份,小米、華為、vivo、理想等幾家公司聯(lián)合清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)共同發(fā)布了一篇個(gè)人LLM智能體綜述論文(也是一個(gè)標(biāo)準(zhǔn)),該論文梳理了個(gè)人LLM智能體所需的能力、效率和安全問題,收集并整理了領(lǐng)域?qū)<业囊娊?,還開創(chuàng)性地提出了個(gè)人LLM智能體的5級(jí)(L1—L5)智能水平分級(jí)法。

論文地址:

https://arxiv.org/abs/2401.05459

文獻(xiàn)庫:

https://github.com/MobileLLM/Personal_LLM_Agents_Survey

今后各家的智能體處于什么水平,參照這個(gè)標(biāo)準(zhǔn)便會(huì)一目了然,也為移動(dòng)終端的Agent構(gòu)建提供了更多參考方向。當(dāng)然,這個(gè)標(biāo)準(zhǔn)的推出也意味著廠商們對(duì)于移動(dòng)終端智能體的積極探索與更大的市場(chǎng)需求。

OPPO等推出的AI手機(jī),用戶實(shí)測(cè)后的感觸是越來越像Agent,至少已經(jīng)能夠達(dá)到上述標(biāo)準(zhǔn)的L2級(jí)。

OPPO與IDC在聯(lián)合發(fā)布的《AI手機(jī)白皮書》中,還給AI手機(jī)下了一個(gè)明確的定義。

OPPO還公布1+N智能體生態(tài)戰(zhàn)略,核心包括OPPO AI超級(jí)智能體和AI Pro智能體開發(fā)平臺(tái)。

其中1指的是AI手機(jī)的智能OS,扮演AI時(shí)代操作系統(tǒng)的角色,具備傳統(tǒng)智能手機(jī)不支持的自學(xué)習(xí)感知能力、長(zhǎng)期記憶能力和工具調(diào)用能力。它可以與用戶專屬的智能體、第三方智能體的交互和信息統(tǒng)籌。N指的就是前面所述的用戶智能體和第三方智能體等構(gòu)成的全新智能體生態(tài)。

理想汽車參與這份標(biāo)準(zhǔn)的研究,則映射的是AI Agent適配人車交互場(chǎng)景的廣闊市場(chǎng)。國(guó)盛證券在一篇報(bào)告中指出,AI Agent面向復(fù)雜任務(wù)處理,充分適合人車交互場(chǎng)景,是數(shù)字人的核心演進(jìn)方向。

座艙智能化時(shí)代,用戶在駕乘中會(huì)有各種個(gè)性化需求,數(shù)字人被賦予更多的施展能力的空間,其使命是通過AI Agent實(shí)現(xiàn)AGI向汽車座艙滲透,實(shí)現(xiàn)三屏互動(dòng)(手機(jī)屏、車載屏和家用屏)。

而Meta與雷朋合作推出的第二代智能眼鏡,接入多模態(tài)AI后,也開始向AI Agent”靠攏。不必再為不同任務(wù)選用不同應(yīng)用程序,只需用日常用語告訴設(shè)備需求,眼鏡就能基于軟件獲取的信息,為用戶作出量身回應(yīng)。

企服的爆發(fā):Agent漸成標(biāo)配

科技巨頭公司及企業(yè)服務(wù)廠商,也早在AI Agent移動(dòng)終端的應(yīng)用方面下足了功夫。

字節(jié)跳動(dòng)在2月初正式推出了「Coze 扣子」AI Bot 開發(fā)平臺(tái)。任何用戶都可以快速、低門檻地搭建自己的 Chatbot,且平臺(tái)支持用戶將其一鍵發(fā)布到飛書、微信公眾號(hào)、豆包等渠道。

除了可以創(chuàng)建自己的Chatbot,Coze官方還提供了Bots 商店和插件。插件的使用,可以讓用戶構(gòu)建的機(jī)器人更加強(qiáng)大。

通過Coze構(gòu)建的機(jī)器人,與OpenAI的GPTs類似,主要用于交互并能夠?qū)崿F(xiàn)一定的業(yè)務(wù)流程操作,可以算是初級(jí)智能體。

其更早推出的豆包,也是一個(gè)構(gòu)建智能體的平臺(tái)。

釘釘在1月發(fā)布的釘釘7.5版本,也是全量上線AI Agent產(chǎn)品“AI助理”。釘釘平臺(tái)上的Agent,能夠通過釘釘內(nèi)的企業(yè)協(xié)同場(chǎng)景,迅速將AI Agent用起來,積累數(shù)據(jù)。這個(gè)助理擁有真正的執(zhí)行能力,并非停留在和用戶的交互層面,可以進(jìn)行信息摘要、寫工作總結(jié)、寫文檔等通用的辦公工作。

用友發(fā)布的YonGPT,也能通過上下文記憶、知識(shí)/庫表索引、Prompt工程、Agent執(zhí)行、通用工具集等擴(kuò)充大模型的存儲(chǔ)記憶、適配應(yīng)用和調(diào)度執(zhí)行能力,再結(jié)合財(cái)稅、人力、供應(yīng)鏈、研發(fā)等領(lǐng)域的知識(shí)和最佳實(shí)踐擴(kuò)充大模型專業(yè)能力,從而形成體系化的企業(yè)服務(wù)大模型。

以上這些平臺(tái)的Agent,憑借SaaS屬性,都可以在手機(jī)端絲滑使用。

除了以上公司,一些創(chuàng)業(yè)公司以及專注超自動(dòng)化的廠商,也陸續(xù)推出了能夠應(yīng)用于移動(dòng)端的Agent產(chǎn)品。

比如實(shí)在智能也推出了手機(jī)Agent智能體,只需一句話直接傳達(dá)自己的意圖,就可以幫你操作所有電腦、手機(jī)的軟件完成各類工作和生活的目標(biāo)任務(wù),通過自主學(xué)習(xí)和模仿人類的點(diǎn)擊和滑動(dòng)手勢(shì),可以在手機(jī)上操作App執(zhí)行各種任務(wù)。

背后的邏輯:發(fā)展趨勢(shì)使然

在很多人還沒有弄懂什么是AI Agent的時(shí)候,大部分人以為Agent更適合在PC端執(zhí)行各種任務(wù)的時(shí)候,廠商們已經(jīng)在悄然布局AI Agent在移動(dòng)端的應(yīng)用了。

王吉偉頻道認(rèn)為,廠商們之所以急于將AI Agent拓展至移動(dòng)端,大概有以下幾點(diǎn)原因:

用戶需求:隨著技術(shù)的發(fā)展,用戶對(duì)智能手機(jī)和設(shè)備的期望越來越高,他們希望設(shè)備不僅僅是工具,還能成為日常生活的助手。Agent能夠理解用戶的需要,并為他們提供個(gè)性化服務(wù),改善用戶體驗(yàn)。

增強(qiáng)粘性:通過提供Agent服務(wù),可以讓用戶更頻繁地與設(shè)備互動(dòng),增加用戶對(duì)品牌的忠誠(chéng)度和設(shè)備的使用頻率。

競(jìng)爭(zhēng)優(yōu)勢(shì):隨著市場(chǎng)競(jìng)爭(zhēng)的加劇,廠商需要不斷創(chuàng)新以保持競(jìng)爭(zhēng)力,集成先進(jìn)的Agent技術(shù)可以作為賣點(diǎn),吸引消費(fèi)者購買。

商業(yè)模式創(chuàng)新:AI Agent可以開辟新的收入渠道和商業(yè)模式,比如通過智能推薦系統(tǒng)促進(jìn)銷售,或者通過訂閱服務(wù)提供高級(jí)功能。

開拓新的收入流:智能Agent往往能夠與其他服務(wù)或產(chǎn)品相結(jié)合,為廠商創(chuàng)造新的收入渠道,如智能家居控制、電子商務(wù)購物、內(nèi)容訂閱等。

提高工作效率:在企業(yè)服務(wù)領(lǐng)域,AI Agent可以幫助員工處理日常任務(wù),提高工作效率,減少重復(fù)勞動(dòng),讓員工有更多時(shí)間專注于更有價(jià)值的工作。

客戶服務(wù)改善:AI Agent可以提供24/7的客戶服務(wù),不僅提高了響應(yīng)速度,還能夠處理大量的客戶咨詢,提升客戶滿意度。

除了以上幾點(diǎn)原因,還有重要的一點(diǎn)便在于AI Agent行業(yè)發(fā)展趨勢(shì)。

畢竟,按照比爾蓋茨的觀點(diǎn),AI Agent將徹底改變?nèi)藗兙€下和線上的生活方式,改變每個(gè)人與計(jì)算機(jī)的互動(dòng)方式,還將顛覆軟件行業(yè)。

就智能手機(jī)而言,Gartner在相關(guān)報(bào)告中的觀點(diǎn)認(rèn)為,生成式AI智能手機(jī)配備了硬件和軟件功能,能夠無縫集成和高效執(zhí)行智能手機(jī)上的Gen AI驅(qū)動(dòng)功能和應(yīng)用程序。它們能夠在本地運(yùn)行基礎(chǔ)或微調(diào)的人工智能模型,產(chǎn)生新的衍生版本的內(nèi)容、策略、設(shè)計(jì)和方法。

無疑,這對(duì)于提升用戶體驗(yàn)以及使用手機(jī)提升生產(chǎn)力有著莫大的幫助。

Forrester在相關(guān)報(bào)告中給出的兩組預(yù)測(cè)數(shù)據(jù),也很好地說明了這個(gè)趨勢(shì)。

到2027年,超過60%的個(gè)人電腦微處理器將集成設(shè)備上的人工智能功能。隨著設(shè)備上的人工智能成為標(biāo)準(zhǔn)要求,這一比例將從2023年的10%上升。

同時(shí),到2027年,智能手機(jī)中超過70%的其他應(yīng)用處理器將集成設(shè)備上通用功能,而2023年這一比例為5%,設(shè)備上通用將成為一項(xiàng)標(biāo)準(zhǔn)要求。

處理器集成LLM,將會(huì)極大地拓展AI Agent的存在空間,并會(huì)進(jìn)一步提升用戶體驗(yàn)。

按照OpenAI CEO奧特曼的說法,Open AI的愿景是讓ChatGPT化身“超級(jí)智能工作個(gè)人助理”,為全能的AGI(通用人工智能)鋪路。

顯然,包括GPTs在內(nèi)的AI Agent將會(huì)承載這個(gè)使命,而移動(dòng)端Agent才是變革過往生產(chǎn)效率的真正開始。

手機(jī)智能體:跨端跨應(yīng)用場(chǎng)景開啟

前文我們不只一次提到了手機(jī)上的AI智能體。能夠在手機(jī)上應(yīng)用并執(zhí)行各種任務(wù)的Agent,都可以視作手機(jī)Agent\手機(jī)智能體。

而AI手機(jī)本身,也是一個(gè)Agent。在OPPO AI中心產(chǎn)品總監(jiān)張峻看來,AI手機(jī)不僅有底層硬件的需求,也有OS層面AI化和交互體驗(yàn)的革新,它更像是一個(gè)超級(jí)智能體。

手機(jī)智能體不僅是智能助手的升級(jí)版,更是一種新的互動(dòng)方式。它們能夠感知用戶的需求、自主決策執(zhí)行,甚至學(xué)會(huì)用戶的習(xí)慣,為用戶提供更為個(gè)性化的服務(wù)。這種技術(shù)的發(fā)展將為我們帶來更加智能化、便捷和高效的手機(jī)體驗(yàn)。

與PC端的Agent類似,目前的手機(jī)Agent一般分為兩種:一種是被釘釘稱作交互式的Agent,主要用于各種文字、圖片等的生成以及各種問答;另一種是能夠直接操作部分生態(tài)內(nèi)業(yè)務(wù)應(yīng)用的業(yè)務(wù)類Agent。在表現(xiàn)形式上,它們都是軟件機(jī)器人。

但手機(jī)Agent的構(gòu)建并不一定在手機(jī)端,也可以在PC端。

手機(jī)Agent的目的是通過在手機(jī)上運(yùn)行Agent程序或者軟件去執(zhí)行各種對(duì)于手機(jī)的操作,以完成各種辦公場(chǎng)景中的任務(wù),所以這個(gè)Agent的形態(tài)可能就是一個(gè)應(yīng)用,或者是通過APP去調(diào)用的某個(gè)打包的可執(zhí)行文件。

事實(shí)上,受限于手機(jī)訪問屏障門檻越發(fā)變高的趨勢(shì),從PC端構(gòu)建AI智能體是目前TO B領(lǐng)域的主流移動(dòng)Agent解決方案。從電腦端觸發(fā)手機(jī)智能體會(huì)有更大的優(yōu)勢(shì),更能滿足B端客戶移動(dòng)業(yè)務(wù)實(shí)現(xiàn)的需求,并能兼顧用戶的工作與生活細(xì)節(jié)。

在王吉偉頻道看來,我們?nèi)粘9ぷ髦械拇蟛糠謽I(yè)務(wù)流程會(huì)分散到多端設(shè)備上,構(gòu)建一個(gè)能夠跨終端的Agent去處理跨端、跨軟件、跨部門的業(yè)務(wù)流程是非常必要的,也是所有企業(yè)及辦公人員的剛需。

手機(jī)智能體最強(qiáng)的能力展現(xiàn)就是調(diào)用手機(jī)端的一切應(yīng)用,一邊滿足企業(yè)用戶工作+生活并兼顧用戶在各場(chǎng)景中的便利,另一邊讓個(gè)人用戶一句話就暢享專屬手機(jī)智能體助理的貼心服務(wù)。

此外,由企業(yè)服務(wù)廠商推出的企業(yè)級(jí)手機(jī)Agent能夠做到足夠的安全級(jí)別,不用擔(dān)心隱私數(shù)據(jù)泄露等安全隱患。

以實(shí)在智能推出“手機(jī)+Agent”結(jié)合的手機(jī)智能體為例,它可以打破手機(jī)App的界限,跨應(yīng)用操作任何手機(jī)軟件完成任務(wù)。

手機(jī)Agent能夠通過模仿人類的直觀動(dòng)作來與手機(jī)應(yīng)用程序交互,就像一個(gè)真人用戶一樣,可以查詢天氣訂機(jī)票、預(yù)約餐廳訂位、進(jìn)行在線購物、編輯圖片或制作視頻,也可以操作辦公軟件發(fā)送郵件、采集業(yè)務(wù)數(shù)據(jù)和處理表格、提交工作流程審批單等等,只需一個(gè)指令,手機(jī)Agent智能體在瞬息間即可幫你完成。

例如,春節(jié)開工期間,您正忙于工作,無暇分身向客戶發(fā)送開工問候,類似于此的重復(fù)性工作,在手機(jī)智能體的幫助下就可以自動(dòng)完成,只需對(duì)手機(jī)說出“向標(biāo)簽為客戶的好友發(fā)送開工問候”的需求,它就可以識(shí)別您的微信標(biāo)簽備注,向該標(biāo)簽下所有客戶發(fā)送專屬問候語,成為你的手機(jī)辦公助理。

與傳統(tǒng)的Siri等智能語言助手不同的是,這個(gè)手機(jī)智能體不是簡(jiǎn)單的命令執(zhí)行者,而是規(guī)劃、決策和執(zhí)行的多面手,通過ISSUT(智能屏幕語義理解技術(shù))視覺能力進(jìn)行整個(gè)操縱過程,無侵入接口,也不需要系統(tǒng)后臺(tái)訪問用戶的隱私、敏感數(shù)據(jù)來實(shí)現(xiàn)操作。

此外,PC智能體已經(jīng)生成的業(yè)務(wù)流程跟蹤,也已經(jīng)在手機(jī)端實(shí)現(xiàn)。比如,企業(yè)的高管通過手機(jī)智能體就可以輕松獲取當(dāng)日最新控制臺(tái)業(yè)務(wù)分析數(shù)據(jù),掌握第一手業(yè)務(wù)動(dòng)態(tài),及時(shí)將需要關(guān)注的動(dòng)態(tài)發(fā)送給技術(shù)或支持人員等,提高工作的靈活性和信息反饋效率。

這個(gè)邏輯,是用手機(jī)去控制PC端智能體去執(zhí)行相關(guān)的業(yè)務(wù)操作,這種跨系統(tǒng)、跨終端的連接型操作是基于手機(jī)Agent平臺(tái)構(gòu)建的Agent所無法實(shí)現(xiàn)的。

這也意味著,在B端的具體業(yè)務(wù)應(yīng)用上,AI Agent已經(jīng)完成從原來的 “你說,PC做”到“你說,手機(jī)做”的跨越,并實(shí)現(xiàn)了“你說,PC+手機(jī)一起做”。

短短幾個(gè)月時(shí)間,AI Agent就已經(jīng)涌向移動(dòng)終端,手機(jī)智能體實(shí)現(xiàn)了跨端跨應(yīng)用、場(chǎng)景聯(lián)動(dòng)。國(guó)產(chǎn)廠商對(duì)于AI Agent的應(yīng)用探索,一直處于潮流前端,真的是難能可貴。

從PC端智能體無縫切到手機(jī)智能體,以及用手機(jī)操作PC智能體的應(yīng)用場(chǎng)景絲滑轉(zhuǎn)換,可以說是繼PC智能體后的又一智能體的突破性落地范例。

實(shí)在智能推出的手機(jī)Agent智能體,驗(yàn)證了AI Agent的實(shí)用性,在移動(dòng)Agent領(lǐng)域做出了一個(gè)很好的應(yīng)用示范,其未來有更多創(chuàng)新的多模態(tài)框架探索。

手機(jī)智能體未來:終端Agent智能革命

手機(jī)智能體將會(huì)為大家?guī)硇碌幕?dòng)方式與個(gè)性化服務(wù),并帶來更加智能化、便捷和高效的手機(jī)體驗(yàn)。

未來,隨著手機(jī)智能體的不斷發(fā)展,它將會(huì)成為更加強(qiáng)大、智能化的存在,成為我們生活的一部分。當(dāng)然手機(jī)智能體嶄露頭角,也預(yù)示著手機(jī)和移動(dòng)終端行業(yè)新紀(jì)元的到來。

比爾·蓋茨認(rèn)為,AI智能體最令人興奮的影響是它們將使當(dāng)今對(duì)大多數(shù)人來說過于昂貴的服務(wù)民主化。并指出,智能體不僅會(huì)改變每個(gè)人與計(jì)算機(jī)交互的方式,還將顛覆軟件行業(yè),帶來自我們從鍵入命令到點(diǎn)擊圖標(biāo)以來最大的計(jì)算革命。

現(xiàn)在看來,手機(jī)智能體帶來的終端Agent智能革命,大概率會(huì)承載這一重要的歷史使命。

【王吉偉頻道,關(guān)注AIGC與IoT,專注數(shù)字化轉(zhuǎn)型、業(yè)務(wù)流程自動(dòng)化與RPA?!?/p>

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
ai智能

相關(guān)文章

  • 百度AI,能否“投”出未來?

    這是一道AI時(shí)代的必答題,如今還沒有人交卷。

    標(biāo)簽:
    ai智能
    百度
  • 2024,AI落地起風(fēng)云,廠商如何搶先機(jī)?

    作者|曾響鈴文|響鈴說在ChatGPT引爆大模型熱潮的2023年,很多人其實(shí)都還處于只聽說沒用過的階段。到了國(guó)內(nèi)最早獲批的百度文心一言、中科院紫東太初、商湯日日新等正式對(duì)公眾開放服務(wù)后,最先進(jìn)的AI科技,才絲滑地飛入尋常百姓家了。人工智能帶來的顛覆性讓大家伙短暫地?fù)?dān)憂過生成式應(yīng)用“會(huì)不會(huì)把我的飯碗搶

    標(biāo)簽:
    ai技術(shù)
    ai智能
  • 熱鬧人工智能VS酷寒資本寒冬,2023年AI Agent項(xiàng)目盤點(diǎn)與融資分析

    2023年都有哪些國(guó)內(nèi)廠商推出了AIAgent?哪些廠商成功融資?對(duì)創(chuàng)業(yè)有什么啟示?一文看明白。

    標(biāo)簽:
    ai智能
  • 揭秘AI時(shí)代的致富密碼:挖金子 vs. 賣鏟子

    如何創(chuàng)造更多財(cái)富?如何讓生意更好做?如何海量獲客和精準(zhǔn)獲客?如何跟用戶拉近距離?如何自動(dòng)成交?如何讓客戶自動(dòng)裂變?這些都是秦剛公眾號(hào)后臺(tái)留言最多的問題。特別是在AI時(shí)代,我們都希望能夠找到一條通往財(cái)富的捷徑,作為一名24年的互聯(lián)網(wǎng)創(chuàng)業(yè)老板,秦剛非常理解這些的感受。有人說,挖金子是不會(huì)致富的,賣鏟子才

    標(biāo)簽:
    ai智能
  • 2023傳神者沉浸式高峰論壇圓滿舉行 拒絕AI威脅論 強(qiáng)調(diào)數(shù)智共生

    12月17日,以“數(shù)智·共生”為主題的2023傳神者沉浸式高峰論壇在北京成功舉行,論壇由北京語言大學(xué)國(guó)家語言服務(wù)出口基地、新譯科技國(guó)家語言服務(wù)出口基地、傳神語聯(lián)國(guó)家語言服務(wù)出口基地,三家國(guó)家級(jí)特色服務(wù)出口基地(語言服務(wù))聯(lián)合主辦,瞻勝傳播協(xié)辦,匯聚了國(guó)內(nèi)外數(shù)十位來自語言服務(wù)領(lǐng)域、文化傳播領(lǐng)域、高校教

    標(biāo)簽:
    ai智能
  • “創(chuàng)造市場(chǎng)”與“算法進(jìn)化”,中美AI競(jìng)速的岔路口

    “人工智能的商業(yè)模式,是要?jiǎng)?chuàng)造一個(gè)市場(chǎng),而非一個(gè)算法”。這是世界AI泰斗MichaelI.Jordan的觀點(diǎn)。而當(dāng)前的全球AI市場(chǎng),占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個(gè)方向,或許已經(jīng)無法直接進(jìn)行排位先后、優(yōu)

    標(biāo)簽:
    ai智能
  • 智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實(shí)在智能最新發(fā)布的實(shí)在Agent7.0,看RPAAgent的迭代升級(jí)抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實(shí)現(xiàn)了流程全自動(dòng)化AIAgent構(gòu)建到執(zhí)行全自動(dòng)化,持續(xù)進(jìn)化RPAAgent再次降低智能體應(yīng)用門檻實(shí)在智能重磅發(fā)布實(shí)

  • 崔大寶:大模型降溫背后的難點(diǎn)、卡點(diǎn)、節(jié)點(diǎn)

    崔大寶|節(jié)點(diǎn)財(cái)經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢(shì):資本市場(chǎng),與之關(guān)聯(lián)的概念炒不動(dòng)了,英偉達(dá)股價(jià)動(dòng)輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費(fèi)市場(chǎng),BATH們的推新活動(dòng)少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場(chǎng)酣仗:自5月15日字節(jié)跳動(dòng)宣布“以厘計(jì)費(fèi)”,打響國(guó)內(nèi)大模型

    標(biāo)簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對(duì)論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個(gè)數(shù)字人。圖片來源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來越多的傳統(tǒng)企業(yè)和機(jī)構(gòu)開始用上了“數(shù)字員工”。甚至很多中國(guó)人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡(jiǎn)單翻看一下全國(guó)各地事業(yè)單位的“錄

    標(biāo)簽:
    數(shù)字人
  • 來到IPO關(guān)口,地平線離“三分天下”還有多遠(yuǎn)?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過中國(guó)證監(jiān)會(huì)IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計(jì)籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級(jí)輔助駕駛(ADAS)和高階自動(dòng)駕駛(AD)解決方案供

  • 機(jī)器人大會(huì)引領(lǐng)產(chǎn)業(yè)動(dòng)向,卓翼飛思繪制無人系統(tǒng)教科研新藍(lán)圖

    8月21日,萬眾矚目的2024世界機(jī)器人大會(huì)暨博覽會(huì)在北京亦創(chuàng)國(guó)際會(huì)展中心盛大開幕。這場(chǎng)為期5天,集“展覽”“論壇”“賽事”于一體的機(jī)器人盛會(huì),反映了當(dāng)下機(jī)器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計(jì)數(shù)據(jù),今年現(xiàn)場(chǎng)逛展觀眾高達(dá)25萬人次,比去年增加25%。機(jī)器人行業(yè)有多火?看看2024世界機(jī)器人大會(huì)火爆程度便可知

  • 卓翼智能:超大載重高烈度環(huán)境特種智能系留無人平臺(tái)的應(yīng)用與未來

    瞄準(zhǔn)場(chǎng)景需求,打造國(guó)內(nèi)領(lǐng)先的自主可控、高質(zhì)量超大載重高烈度環(huán)境特種智能系留無人平臺(tái)。卓翼智能亮相HICOOL峰會(huì)以科技實(shí)力榮摘?jiǎng)?chuàng)業(yè)大賽一等獎(jiǎng)這個(gè)比賽5年培育出16家“獨(dú)角獸”HICOOL2024全球創(chuàng)業(yè)者峰會(huì)暨創(chuàng)業(yè)大賽已于8月25日在北京圓滿落下帷幕,大賽共吸引了124個(gè)國(guó)家和地區(qū)的7406個(gè)創(chuàng)業(yè)項(xiàng)

  • 60萬獎(jiǎng)金召喚AI創(chuàng)新者,2024無錫國(guó)際人工智能創(chuàng)新應(yīng)用大賽火熱進(jìn)行中!

    人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量。無錫市作為中國(guó)的科技創(chuàng)新中心之一,正通過構(gòu)建人工智能"算力+算法+數(shù)據(jù)"三要素齊備的產(chǎn)業(yè)生態(tài),為產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用提供強(qiáng)大支撐,通過“AI+”行動(dòng)推動(dòng)人工智能與多個(gè)產(chǎn)業(yè)交叉融合,實(shí)現(xiàn)技術(shù)落地和產(chǎn)業(yè)化,加速形成新質(zhì)生產(chǎn)力,打造具有國(guó)際競(jìng)爭(zhēng)力的產(chǎn)業(yè)創(chuàng)新智造

  • “云+AI”驅(qū)動(dòng)操作系統(tǒng)創(chuàng)新升級(jí),龍蜥堅(jiān)持可持續(xù)發(fā)展路線

    近日,2024龍蜥操作系統(tǒng)大會(huì)(OpenAnolisConference)在北京圓滿召開,此次大會(huì)由中國(guó)計(jì)算機(jī)學(xué)會(huì)開源發(fā)展委員會(huì)、中關(guān)村科學(xué)城委員會(huì)、海淀區(qū)委網(wǎng)信辦、中國(guó)開源軟件推進(jìn)聯(lián)盟指導(dǎo),龍蜥社區(qū)主辦,阿里云、浪潮信息、Intel、中興通訊、Arm、中科方德等24家理事單位共同承辦,主題為“進(jìn)化

編輯推薦