10月26日,據(jù)The Information報(bào)道,谷歌(GOOGL.US)將開(kāi)發(fā)可控制計(jì)算機(jī)的人工智能,計(jì)劃最早在12月預(yù)覽這款新的AI產(chǎn)品。
報(bào)道稱,這款產(chǎn)品也稱為“計(jì)算機(jī)使用代理”,旨在接管用戶的瀏覽器,以幫助消費(fèi)者完成諸如收集研究、購(gòu)買(mǎi)產(chǎn)品或預(yù)訂航班等各種日常任務(wù)。據(jù)The Information援引的三位知情人士表示,該項(xiàng)目的代號(hào)為“Project Jarvis”,與Anthropic本周宣布的一款產(chǎn)品類似。
他們還透露,12月還將發(fā)布谷歌下一代旗艦Gemini大型語(yǔ)言模型,該模型將為Jarvis提供動(dòng)力。
致力于追趕OpenAI,定制化適配Chrome
不過(guò),Jarvis的發(fā)布時(shí)間表表明,盡管谷歌在AI技術(shù)的基礎(chǔ)研究方面有著一定積累,但谷歌顯然還在追趕其競(jìng)爭(zhēng)對(duì)手。目前,谷歌仍在開(kāi)發(fā)具有所謂“推理能力”的AI,而OpenAI早在9月份就已經(jīng)推出了這一功能。
分析認(rèn)為,谷歌的Gemini聊天機(jī)器人在與OpenAI的ChatGPT競(jìng)爭(zhēng)中嚴(yán)重落后,導(dǎo)致企業(yè)紛紛轉(zhuǎn)向了OpenAI的大型語(yǔ)言模型LLMs,這也使得谷歌的Gemini模型難以迎頭趕上。為了提高AI開(kāi)發(fā)效率,上周,谷歌將負(fù)責(zé)Gemini聊天機(jī)器人的團(tuán)隊(duì)并入了其主要AI團(tuán)隊(duì)DeepMind.
值得注意的是,當(dāng)前,AI開(kāi)發(fā)人員已經(jīng)將“代理(agents,即能夠完成復(fù)雜任務(wù)而無(wú)需人類監(jiān)督的AI系統(tǒng))”視為行業(yè)的下一階段。Salesforce、微軟和Workday等企業(yè)紛紛從OpenAI和其他公司購(gòu)買(mǎi)了LLMs,并競(jìng)相使用這一技術(shù)開(kāi)發(fā)AI代理。
Anthropic和谷歌則試圖通過(guò)與個(gè)人計(jì)算機(jī)或?yàn)g覽器直接交互的軟件,將AI代理概念推向更深的層次。OpenAI今年的大部分時(shí)間也在開(kāi)發(fā)類似的軟件。
知情人士表示,谷歌的這款A(yù)I代理產(chǎn)品與Anthropic推出的產(chǎn)品類似,都是通過(guò)頻繁截取用戶計(jì)算機(jī)屏幕上的內(nèi)容,并在采取點(diǎn)擊按鈕或輸入文本等行動(dòng)前對(duì)截圖進(jìn)行解釋以響應(yīng)用戶的命令。
不過(guò),兩家公司的代理產(chǎn)品也存在關(guān)鍵差異:
Anthropic表示其產(chǎn)品可以操作安裝于電腦不同應(yīng)用程序上,而Jarvis目前只能操作瀏覽器,并且已經(jīng)針對(duì)谷歌的Chrome瀏覽器進(jìn)行了“定制化”調(diào)整。
知情人士還表示,至少在目前,Jarvis的目標(biāo)用戶為那些希望實(shí)現(xiàn)網(wǎng)頁(yè)日常任務(wù)自動(dòng)化的人。在谷歌今年春天的開(kāi)發(fā)者大會(huì)上,首席執(zhí)行官Sundar Pichai暗示,未來(lái)的Gemini版本可以自主執(zhí)行多項(xiàng)操作,如幫助用戶退回一雙鞋子等。
產(chǎn)品響應(yīng)速度慢,安全性或受質(zhì)疑
知情人士還提示道,“Jarvis”的計(jì)劃是暫定的,也可能會(huì)有所變動(dòng)。報(bào)道稱,谷歌可能會(huì)先向少數(shù)早期測(cè)試者發(fā)布該產(chǎn)品,以幫助識(shí)別和修復(fù)其不足之處。該代理目前運(yùn)行速度相對(duì)較慢,因?yàn)槟P托枰诓扇∶總€(gè)行動(dòng)前思考幾秒鐘。
此外,由于谷歌還需要訪問(wèn)客戶的隱私信息如登錄密碼和信用卡信息等,才能訪問(wèn)不同的網(wǎng)站來(lái)完成任務(wù)或根據(jù)客戶的要求進(jìn)行購(gòu)買(mǎi)。
分析指出,谷歌需要讓人們相信,其AI代理能夠安全地處理他們的個(gè)人數(shù)據(jù),這是它執(zhí)行任務(wù)所必需的。
除此之外,LLMs還有一些普遍的漏洞,比如可能會(huì)產(chǎn)生錯(cuò)誤答案,此前,谷歌在其搜索引擎中使用LLM驅(qū)動(dòng)的對(duì)話式答案,出現(xiàn)了許多明顯的錯(cuò)誤。
本文轉(zhuǎn)載自“華爾街見(jiàn)聞”,智通財(cái)經(jīng)編輯:徐文強(qiáng)。