大模型拼應(yīng)用最新戰(zhàn)況：智能助手扎堆襲來

來源：中國(guó)青年報(bào) 中國(guó)青年網(wǎng)朱彩云2024-09-10

分享到 :

核心提示：AI將成為人類從事各種生產(chǎn)和活動(dòng)的代理,。AI等技術(shù)的大規(guī)模應(yīng)用將重塑人的內(nèi)涵,，進(jìn)而重塑人們的社會(huì)關(guān)系,。——————————“出圈”近兩年的大模型,，正迎來應(yīng)用邊界的進(jìn)

AI將成為人類從事各種生產(chǎn)和活動(dòng)的代理。AI等技術(shù)的大規(guī)模應(yīng)用將重塑人的內(nèi)涵,，進(jìn)而重塑人們的社會(huì)關(guān)系,。

——————————

“出圈”近兩年的大模型，正迎來應(yīng)用邊界的進(jìn)一步拓寬,。

9月5日開幕的2024Inclusion·外灘大會(huì)上，復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授黃萱菁分享了AI智能體（AI Agent）最近有多“熱”：不僅工業(yè)界的國(guó)際國(guó)內(nèi)巨頭公司開始布局研發(fā)基于大語(yǔ)言模型的智能體,，學(xué)術(shù)界把智能體用于科研創(chuàng)新如預(yù)測(cè)、分析多蛋白復(fù)合物結(jié)構(gòu),，眾多開發(fā)者還在聊天,、購(gòu)物、游戲,、具身智能（具有物理實(shí)體并具備感知,、決策、執(zhí)行及交互能力的智能體——記者注）等領(lǐng)域應(yīng)用智能體,。

“大語(yǔ)言模型更偏向于對(duì)話與答疑,，基于大模型的智能體更像人類的助手，偏向于感知環(huán)境,、規(guī)劃決策并采取行動(dòng),。”黃萱菁介紹,，目前,，智能體應(yīng)用已經(jīng)適配在出行、政務(wù)民生,、餐飲,、景區(qū)、醫(yī)療,、金融等領(lǐng)域場(chǎng)景,。

大會(huì)開幕當(dāng)天，AI生活管家,、AI金融管家,、AI健康管家等AI智能體亮相黃浦江畔。在大會(huì)所在地,、曾見證我國(guó)工業(yè)發(fā)展的江南造船廠舊址,，共30余項(xiàng)AI新成果相繼發(fā)布。

在清華大學(xué)人工智能研究院常務(wù)副院長(zhǎng)孫茂松看來,，當(dāng)前智能體的發(fā)展得益于語(yǔ)言大模型在生成能力,、代碼生成,、圖像處理及3D建模等方面的進(jìn)步。他認(rèn)為,，智能體技術(shù)正潤(rùn)物細(xì)無聲地走進(jìn)大眾生活,，但這是一個(gè)量變引起質(zhì)變的過程，“可能需要通過幾年迭代和積累,，其性能才會(huì)有顯著提升,。”

從“拼參數(shù)”到“拼應(yīng)用”

從1年半前的百模大戰(zhàn),，到今年5月大模型領(lǐng)域掀起的價(jià)格戰(zhàn),，出席本次大會(huì)的不少大模型廠商感受著大模型近兩年來發(fā)生的變化：性能提升和成本下降。

“去年行業(yè)主要在做模型基礎(chǔ),，中國(guó)也在巨大的市場(chǎng)期望里跟進(jìn)追趕,、證明自己?！卑俅ㄖ悄軇?chuàng)始人兼CEO王小川習(xí)慣用“全新的時(shí)代”形容智能時(shí)代,，他說，在智能時(shí)代,，大模型帶來的是生產(chǎn)力的直接提升,。

一個(gè)明顯的案例是，去年12月谷歌公司推出的大語(yǔ)言模型Gemini在MMLU（大規(guī)模多任務(wù)語(yǔ)言理解）測(cè)試中,，以90.0%的高分首次超過人類專家,。該大模型從一開始就被創(chuàng)建為多模態(tài)模型，這意味著它可以歸納并流暢地理解,、操作以及組合不同類型的信息,，包括文本、代碼,、音頻,、圖像和視頻。

“大模型正從‘拼參數(shù)’走向‘拼應(yīng)用’,?！蔽浵伡瘓F(tuán)總裁韓歆毅認(rèn)為，大模型產(chǎn)品的目標(biāo)可以濃縮為：好用,、有用和用得起,。對(duì)于用戶,，這意味著一種全新的,、更加直觀的交互體驗(yàn)；而對(duì)于商家,，則意味著能夠更深入地理解用戶需求,，進(jìn)而提供更加結(jié)構(gòu)化和個(gè)性化的服務(wù),。

他以大會(huì)開幕首天發(fā)布的AI生活管家“支小寶”為例說,，該應(yīng)用基于螞蟻百靈大模型打造,，具備國(guó)內(nèi)首創(chuàng)的服務(wù)執(zhí)行與智能陪伴能力。

具體來看,，用戶說句話就能辦到的事包括快速訂票,、點(diǎn)餐、打車,、查詢附近吃喝玩樂、看醫(yī)保余額,、異地就醫(yī)備案、給親友轉(zhuǎn)賬或發(fā)紅包,、搜尋電子社?？ǖ?。

“智能體能發(fā)揮大語(yǔ)言模型的專業(yè)性,，帶來各種服務(wù)的迭代升級(jí),?！痹邳S萱菁看來，具身語(yǔ)言智能體所具備的視覺問答,、圖片生成,、標(biāo)題生成、動(dòng)作規(guī)劃和操控等多模態(tài)的輸入和具身輸出的方式,，很可能是邁向通用人工智能的關(guān)鍵之一。

《連線》雜志創(chuàng)始主編,、《5000天后的世界》作者凱文·凱利則認(rèn)為,，AI落地產(chǎn)業(yè)需要時(shí)間,，“僅僅消化現(xiàn)有技術(shù),，可能就需要5-8年時(shí)間,?！彼谂c韓歆毅線上對(duì)談時(shí)表示,，目前人們把AI主要運(yùn)用于一些工具型任務(wù)，價(jià)值主要體現(xiàn)在提升效率上,。他認(rèn)為，金融和醫(yī)療領(lǐng)域會(huì)最先應(yīng)用并受益于AI的發(fā)展,，“因?yàn)檫@兩個(gè)行業(yè)信息密度高,。此外,，廣告和營(yíng)銷行業(yè)也會(huì)是最早受到影響的行業(yè)之一?！?

人機(jī)交互新方式

讓數(shù)字分身分擔(dān)工作，由AI健康管家找醫(yī)生,、讀報(bào)告,、陪看診，用語(yǔ)音喊AI金融管家?guī)椭庾x市場(chǎng)熱點(diǎn),、分析行業(yè)板塊……適配不同領(lǐng)域場(chǎng)景的AI助手正進(jìn)入人們的生產(chǎn)與生活,。在復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授、上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華看來,，AI將成為人類從事各種生產(chǎn)和活動(dòng)的代理。AI等技術(shù)的大規(guī)模應(yīng)用將重塑人的內(nèi)涵,，進(jìn)而重塑人們的社會(huì)關(guān)系,。

香港科技大學(xué)校董會(huì)主席,、美國(guó)國(guó)家工程院外籍院士沈向洋則認(rèn)為，AI智能體時(shí)代的到來,，不會(huì)是一個(gè)神奇而強(qiáng)大的模型突然代替了所有的工作流,，“它涉及技術(shù)、工程與市場(chǎng)的不斷磨合,，最終以超預(yù)期的服務(wù)呈現(xiàn)給人類,。”

他尤其提到人機(jī)交互的新方式指向“AI與IA（Intelligent Augmentation,，即智能增強(qiáng)——記者注）”的融合共進(jìn)。這意味著一種以人為本的AI發(fā)展路徑,，它聚焦于運(yùn)用技術(shù)提升人類的能力,，而非取代人類，強(qiáng)調(diào)人類與AI之間的協(xié)作關(guān)系,。

“（大模型產(chǎn)業(yè)）未來的發(fā)展路徑已經(jīng)非常明確,，將會(huì)從之前的大語(yǔ)言模型到多模態(tài)模型，未來邁向世界模型,。未來一定會(huì)往具身智能方向上發(fā)展,，往機(jī)器人方向走，其中一個(gè)特殊形態(tài)就是自動(dòng)駕駛,?！鄙蛳蜓髲乃懔嵌冉榻B，大模型可分為通用大模型,、行業(yè)大模型,、企業(yè)大模型和個(gè)人大模型，其中通用大模型是AI的基礎(chǔ),，要訓(xùn)練一個(gè)通用大模型至少需要萬卡,，行業(yè)大模型是做領(lǐng)域應(yīng)用的底座，需要千卡級(jí)別的訓(xùn)練,。

國(guó)家網(wǎng)信辦數(shù)據(jù)顯示,，截至2024年7月30日，我國(guó)已經(jīng)完成備案的生成式人工智能服務(wù)大模型已達(dá)197個(gè),，從大模型的類型看,，通用大模型、行業(yè)大模型分別占比31％,、69％,。從行業(yè)大模型的類型看，教育領(lǐng)域19款,、金融領(lǐng)域18款,、辦公領(lǐng)域15款、政務(wù)領(lǐng)域11款、醫(yī)療領(lǐng)域11款,，且正在向傳媒,、招聘、家裝,、心理等更廣闊的場(chǎng)景延伸,。

“更多高質(zhì)量、高價(jià)值的數(shù)據(jù)是在私域,，在垂直行業(yè),，在千行百業(yè)，再往前走就是個(gè)人數(shù)據(jù),?！痹谛ぱ鋈A看來，目前的大模型還不能夠勝任專業(yè)任務(wù),，要想做到提供專業(yè)任務(wù),，用好私域數(shù)據(jù)可能是關(guān)鍵，“所以數(shù)據(jù)待挖掘的潛力仍然十分之大,?！?

關(guān)注“走得慢”的人

可以肯定的是，以智能體為代表的AI助手在幫助解決具體問題上具備優(yōu)勢(shì),。用西湖大學(xué)深度學(xué)習(xí)實(shí)驗(yàn)室成果轉(zhuǎn)化負(fù)責(zé)人,、西湖心辰CEO醒辰的話來說，大部分語(yǔ)音大模型在智商賽道不停比拼,，“但大量的溝通場(chǎng)景不是光靠智力就可以完成,，還需要情商與溝通能力?！?

這也是很多人面對(duì)AI助手的真實(shí)需求,。既是教師又是父親的嚴(yán)鋒，是復(fù)旦大學(xué)中文系教授,、博士生導(dǎo)師,，他在大會(huì)期間參加圓桌討論“AI重塑未來生活的無限可能”時(shí)坦言，自己最希望有一個(gè)AI助手,、機(jī)器人來陪伴自己的孩子,。“因?yàn)槲业暮⒆邮且粋€(gè)孤獨(dú)癥患者,，孤獨(dú)癥的核心問題是人際交往（存在）障礙,。”

“我買了很多智能音箱,，我相信這是未來通向陪伴機(jī)器人的一種先驅(qū),，它們也在進(jìn)化,。”嚴(yán)鋒說,，正是通過有意識(shí)地問這些放在客廳,、臥室的智能音箱，他知道了孩子感興趣的是遠(yuǎn)古動(dòng)物,、中世紀(jì)歷史,，“我再向音箱提問的時(shí)候，孩子就會(huì)主動(dòng)參與進(jìn)來,?！?

好消息是，針對(duì)陪伴領(lǐng)域的個(gè)性化需求如情緒疏導(dǎo),、客戶服務(wù),、兒童陪伴等，已有應(yīng)用落地,。醒辰以大會(huì)期間正式發(fā)布的國(guó)內(nèi)首款端到端通用語(yǔ)音大模型心辰Lingo為例說,，該大模型在處理對(duì)話時(shí)直接理解語(yǔ)音,，捕捉語(yǔ)氣,、節(jié)奏和情緒，并進(jìn)行語(yǔ)音回復(fù),，通過減少信息處理過程中的損失,，讓“機(jī)器”更懂人。

“近幾年大部分AI數(shù)字人都是以工具來設(shè)計(jì)的,，所以它首要目的是解決用戶遇到的問題,，其次才是提供情緒價(jià)值。但是隨著很多AI技術(shù)的快速發(fā)展,，大模型智能體對(duì)話能力越來越強(qiáng),，設(shè)計(jì)者開始更多關(guān)注數(shù)字人等AI助手如何更好地去解決情感方面的問題，提供情緒價(jià)值,?！蔽浵伡瘓F(tuán)數(shù)字人算法負(fù)責(zé)人楊明暉告訴中青報(bào)·中青網(wǎng)記者，隨著動(dòng)態(tài)大模型包括視頻生成技術(shù)的快速發(fā)展,，可能到明年就會(huì)有比較成熟的數(shù)字人方面的應(yīng)用,，“你輸入一張圖片，然后就可以和圖片中的角色語(yǔ)音對(duì)話,，角色的表情和動(dòng)作都可以生動(dòng)自然,。”

強(qiáng)腦科技創(chuàng)始人兼CEO韓璧丞認(rèn)為,，在技術(shù)發(fā)展非?？斓臅r(shí)候,，科研工作者應(yīng)該更關(guān)注那些“走得慢”的人，比如肢體障礙人士,、腦疾病患者群體,。

過去10多年，這名哈佛大學(xué)腦科學(xué)中心博士生一直專注于腦機(jī)接口底層技術(shù)的研發(fā),。他認(rèn)為,，腦機(jī)接口技術(shù)在未來5-10年內(nèi)，會(huì)發(fā)生3個(gè)階段的變化,，分別是修復(fù),、增強(qiáng)和更高階的交互?！跋乱淮慕换?huì)變得更高階,，比如現(xiàn)在是通過語(yǔ)言對(duì)話，未來可能不需要再通過語(yǔ)言對(duì)話,，收到提問我們想一想就（把想法）傳遞出去了,。”

(編輯:月兒)

返回315記者攝影家首頁(yè)>>

相關(guān)閱讀：大模型拼應(yīng)用智能助手扎堆襲來

“大模型+影視劇”玩出文化產(chǎn)業(yè)新花樣2024-07-22
從拼參數(shù)到拼應(yīng)用,、拼落地大模型將“飛入尋常百姓家”2023-09-11
AI大模型可助力孤獨(dú)癥早期篩查2024-08-28
國(guó)產(chǎn)AI大模型加速“上車”2024-05-08
AI大模型潮起年輕人如何應(yīng)對(duì)2025-03-04

關(guān)閉窗口

[責(zé)任編輯: 315xwsy_susan]

免責(zé)聲明：

1,、本網(wǎng)內(nèi)容凡注明"來源：315記者攝影家網(wǎng)"的所有文字、圖片和音視頻資料,，版權(quán)均屬315記者攝影家網(wǎng)所有,，轉(zhuǎn)載、下載須通知本網(wǎng)授權(quán),，不得商用,，在轉(zhuǎn)載時(shí)必須注明"稿件來源：315記者攝影家網(wǎng)"，違者本網(wǎng)將依法追究責(zé)任,。
2,、本文系本網(wǎng)編輯轉(zhuǎn)載，轉(zhuǎn)載出于研究學(xué)習(xí)之目的,，為北京正念正心國(guó)學(xué)文化研究院藝術(shù)學(xué)研究,、宗教學(xué)研究、教育學(xué)研究,、文學(xué)研究,、新聞學(xué)與傳播學(xué)研究、考古學(xué)研究的研究員研究學(xué)習(xí),，并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),。
3,、如涉及作品、圖片等內(nèi)容,、版權(quán)和其它問題,，請(qǐng)作者看到后一周內(nèi)來電或來函聯(lián)系刪除,。