把3B端側大(dà)模型裝進手機(jī),vivo還(hái)發布 ♦£≤了(le)适配手機(jī)的(de)智能(néng)體(tǐ)丨最前♠γ♠>線
10月(yuè)10日↓≈®(rì),2024 vivo開(kāi)發者大(dà)會(hu∑ €∞ì)(ODC)在深圳國(guó)際會(huì)展中心舉辦。此次,vivo秀出₹♥了(le)他(tā)們在大(dà)模型上(shàng)的(de)全新進展。→↕
最近(jìn)兩年(nián)的(de)vivo開(kāi)發者大(dà±∏)會(huì)上(shàng),AI一(yī)直占據了(le)最大→€¶(dà)的(de)篇幅—&mΩδdash;vivo AI全球研究院院長(>♥₹§cháng)周圍向36氪在內(nèi)的(de)媒體(tǐ∏ ¥↔)表示,投入AI的(de)6年(nián)來(lái),vi™≈vo在AI方面的(de)投入,累計(jì)超過×€230億元。
在去(qù)年(nián)開(kāi)發者大(dà§'>∞)會(huì)上(shàng),vivo發布了(le)自(zì)研十億、百億、千億三₩ §個(gè)參數(shù)量級、由5款語言大(dà)模型組成的(de)藍(lán)心<∑♠←大(dà)模型矩陣。如(rú)果說(shuō),去(qσù)年(nián)vivo在大(dà)模型上(shàng)更追求“大(dà)而全&r'★© dquo;,經過一(yī)年(nián)的(de)沉澱,vivo今年"αδ≤(nián)在AI上(shàng)的(de)戰略,更追求AI落地✘✘✘¥(dì)、以及與實際場(chǎng)景的(de)結合。
藍(lán)心大(dà)模型矩陣
端側大(dà)模型與手機(jī)場(chǎng)景天然匹配,是(s& hì)這(zhè)次開(kāi)發者大(dà)會(huì)AI部分(fēn)的(de)重點。此次,∑∑vivo發布了(le)30億參數(shù)量級的(de)藍(lán)心<端側大(dà)模型(下(xià)稱“藍(lán)心3B&r®'dquo;)——而此前,手$∏¥機(jī)廠(chǎng)商基本上(shàng)在卷6B、7B參數(s•≠•hù)量的(de)模型。
周圍表示,過去(qù)行(xíng)業(y☆∑δ£è)對(duì)于大(dà)模型量級有(yǒu)著(zhe)尺寸上(shàng)限的✔☆→♣(de)執著(zhe)追求。不(bù)過,過度追求端側大(dà)參數(shù)并無意義,在手機∞↔(jī)有(yǒu)限的(de)空(kōng)間(jiān)裡(l✔→εǐ),反而擠占內(nèi)存和(hé)電(diàn)量,也(yě)起不(bù)到(dào₩✔)什(shén)麽作(zuò)用(yòng)。而vivo團隊發現(xiàn),3B的(deπλ&)模型才是(shì)最适合手機(jī)端側應用≤π™β(yòng)的(de)參數(shù)量。
根據介紹,在對(duì)話(huà)寫作(zuò) 、摘要(yào)總結、信息抽取等能(néng)力上(shà¥$λng),“藍(lán)心3B”幾乎可(kě)比肩行(xíng)業(α←∞★yè)7B-9B模型。vivo方面給出了(le)一(≥≠≠yī)系列參數(shù)對(duì)比——相(xiàng)比藍(lán"™)心7B,藍(lán)心3B性能(néng)提升了(le)300%、功耗優>δδ∞化(huà)達46%、內(nèi)存占用(yòng)僅1.4GB。
不(bù)過,vivo的(de)“藍(l§≠→×án)心大(dà)模型矩陣”不☆∑>↓(bù)僅僅隻有(yǒu)端側大(dà)模型,vivo此次也(yě)公布了(le)他(tā₽∞)們其他(tā)類型的(de)大(dà)模型(語音(yīn)、圖像、多(duō)模态)的(de)升π∏級。
比如(rú),vivo如(rú)今全新的(de)語言大(dà)模型,是(shì)基于千∑♥§™億級的(de)雲端大(dà)模型,此次vivo重點優化(huà)了(le)意圖理(l$∞>ǐ)解和(hé)任務規劃能(néng)力,相(xiàng≠✘)比去(qù)年(nián),整體(tǐ)能(néng)力提升→≥÷30%;
vivo全新的(de)藍(lán)心語音(yīn)大(dà)模型,則強化Ω↓ >(huà)了(le)準确理(lǐ)解自(zì)然語"≠義,模拟人(rén)聲的(de)能(néng)力;
vivo的(de)藍(lán)心圖像大(dà)模型,今年(nián)則著(zhe)重強化(huà±<)了(le)東(dōng)方美(měi)學和(hé)中國(guó)特色;
藍(lán)心多(duō)模态大(dà)模型,則升級了(le)其視(s€€₽hì)覺感知(zhī)理(lǐ)解能(néng)力。
周圍表示,目前雲端大(dà)模型在手機(£↓jī)上(shàng)的(de)調用(yòng),成本已經下(xià)降至¶∞↔“不(bù)到(dào)一(yī)分(fēn' )錢(qián)一(yī)次”。
降本,不(bù)僅僅源于雲端成本下(xià)降,也(yě)由于vivo持續推進大♣'(dà)規模端側普及,“今年(nián)我們有(yǒu)十幾 '個(gè)、數(shù)十個(gè)功能(n☆"éng)都(dōu)端側化(huà)了(le),以後可(kě)能(néng)閑聊、識别、決策☆¶ ™、執行(xíng)全部都(dōu)端側化(huà)了(le)”。
截至目前,vivo的(de)AI能(néng)力已覆蓋全球60多(duō)個(gè)國(guó)Ω≥×家(jiā)和(hé)地(dì)區(qū),服務超過5億手機(jī)用(yòng≤π)戶,大(dà)模型token輸出量超過了(le)3萬億個(gè)。
不(bù)過,種種大(dà)模型升級,打好(hǎo)了(le)底層技(jì)術(shù) 設施,而要(yào)讓用(yòng)戶感知(zhī)到(dào),還(hái)需要(yào)≈ 進一(yī)步産品化(huà)。在此次開(kāi)發者大(dà)會(huì)上(shà₹♠ng), vivo基于藍(lán)心大(dà)模型技(jì)術(shù),在手機(jī)上(sγ≥hàng)探索落地(dì)了(le)“PhoneGPT&rdquo→≤";手機(jī)智能(néng)體(tǐ)。
PhoneGPT
從(cóng)演示中,這(zhè)一(yī)智能(nénφ<±↑g)體(tǐ)重構了(le)用(yòng)戶與手機(jī)的(de)交互方式。比如(rú),β基于vivo的(de)語音(yīn)交互“藍(lánαΩ↑)心小(xiǎo)V”,用(yòng)戶可(kě)以對(duì)屏幕界面進行(xí↓♣¥δng)識别操作(zuò),直接接管音(yīn)頻(pín)進行(xíng)♠ π☆自(zì)主對(duì)話(huà),以完✘→φ成用(yòng)戶交代的(de)任務,例如(£>¶'rú)幫助用(yòng)戶去(qù)訂餐廳、訂咖啡等等。
AI在手機(jī)上(shàng)的(de)實現(xiàn),離(lí)不(bù)開(kāi)↓↕強大(dà)操作(zuò)系統的(de)支撐,vivo也(yě)在以藍<↕&(lán)心大(dà)模型為(wèi)基礎技(jì)術(shù)底Ω©↓₹座,探索AI與OS的(de)深度融合。此次開(kāi)發者大(dà)會(huì)★ε→β上(shàng),vivo推出新一(yī)代操作(zuò)系統“原系統5&rσ♥dquo;(OriginOS 5)。
周圍表示,操作(zuò)系統的(de)重構包括,重構完整的(de)交互、數(sh☆✔ù)字服務體(tǐ)驗。
在交互體(tǐ)驗上(shàng),基于“原系統 5&rdqu±↑☆o;,用(yòng)戶可(kě)以用(yòng)一(yβε ī)按一(yī)複制(zhì)、一(yī)&±按一(yī)拖拽,滿足用(yòng)戶的(de)多(duō)任務需求。α 此外(wài),系統還(hái)支持全新的(de)語音(yīn)₩×,比如(rú)苗家(jiā)、壯族的(de)方言等等。
在重構數(shù)字服務體(tǐ)驗方面,在σαα✔藍(lán)心多(duō)模态大(dà)模型技(jì)術(shγ∏€ù)的(de)加持下(xià),vivo全新推出小(xiǎo)V圈搜功能(néng)δε。
據vivo方面介紹,在既有(yǒu)的(de)文(wén)本搜索基礎φ≠上(shàng),通(tōng)過圖像識别與圈選交互的(de)結合,精準搜索對(duìσ≥≠)象,提供更便捷的(de)“一(yī)圈即搜”。
原系統5還(hái)全新升級了(le)“原子(zǐ)島”β¶™±功能(néng),除通(tōng)知(zhī)功能(néng©∞γΩ)外(wài),“藍(lán)心小(xiǎo)V&δ↕rdquo;的(de)意圖識别能(néng)力,♥♠÷δ可(kě)以分(fēn)析、判斷用(yòng)戶當前的(de)需求,主動為(wè→±i)用(yòng)戶提供後項服務。