博鰲亞洲論壇2024年年會期間,人民網(wǎng)正式發(fā)布《2024年中國AI大模型產(chǎn)業(yè)發(fā)展報告》。
報告系統(tǒng)性分析了AI大模型產(chǎn)業(yè)發(fā)展背景、現(xiàn)狀、典型案例、挑戰(zhàn)以及未來趨勢。旨在給政府部門、行業(yè)從業(yè)者、社會公眾提供價值參考。
大模型熱潮中,關(guān)于技術(shù)解讀分析的報告不少,但是由人民網(wǎng)主導(dǎo)發(fā)布的不多。而且還選在博鰲這樣的重要時間節(jié)點上發(fā)布,足見其意義非凡。更深層傳遞出的信息是,大模型產(chǎn)業(yè)發(fā)展轟轟烈烈,轉(zhuǎn)瞬即逝的機會點會出現(xiàn)在哪里?報告給出了初步判斷。
報告重點關(guān)注了AI大模型的當(dāng)下與未來。
當(dāng)下階段,一方面,在大眾、廠商、政府等共同推動下,過去一年多時間里,大模型產(chǎn)業(yè)發(fā)展突飛猛進。
聚焦到中國市場,推動產(chǎn)業(yè)發(fā)展主要有三大驅(qū)動力:
其中,語言大模型技術(shù)演進給產(chǎn)業(yè)帶來本源動力。經(jīng)典Transformer架構(gòu)是技術(shù)趨勢最核心主干,基于人類反饋強化學(xué)習(xí)(RLHF)、指令微調(diào)、模型提示等重點技術(shù),進一步提升語言大模型能力。
市場驅(qū)動力以實際存在的廣泛需求為主,報告重點提到了辦公、制造、金融、醫(yī)療、政務(wù)等場景。大模型能帶來的影響主要體現(xiàn)在降本增效、生產(chǎn)自動化、降低風(fēng)險、提高診斷準(zhǔn)確率、提高政務(wù)服務(wù)效率等。
政策方面,從去年年初大模型趨勢發(fā)生以來,北京、深圳、杭州、成都、福建、安徽、上海、廣東等地均發(fā)布了關(guān)于AI大模型的相關(guān)政策,加快各地產(chǎn)業(yè)持續(xù)發(fā)展。
在多方因素影響下,“百模大戰(zhàn)”一觸即發(fā),并將“戰(zhàn)火”延續(xù)至今。
按照部署方式劃分,已發(fā)布模型可分為云端大模型和端側(cè)大模型。云端大模型可進一步分為通用大模型和行業(yè)大模型,端側(cè)大模型主要分為手機大模型和PC大模型。
目前,每一個分類中都涌現(xiàn)出了代表玩家和代表案例。深入落地場景包括金融、醫(yī)療、政務(wù)等。
可以看到,通用大模型代表玩家主要是互聯(lián)網(wǎng)大廠、初創(chuàng)企業(yè);行業(yè)大模型代表玩家以具備專業(yè)數(shù)據(jù)、行業(yè)知識壁壘的場景玩家為主;端云協(xié)同大模型代表廠商則是終端廠家。
值得一提的是,端云協(xié)同是大模型部署方面熱議的方向,也是公認(rèn)的未來趨勢,當(dāng)下正搶先在手機行業(yè)落地應(yīng)用。
報告中以vivo藍(lán)心大模型為例,展開介紹端云結(jié)合大模型的特點。
vivo藍(lán)心大模型是行業(yè)首個在手機端運行的開源自研大模型,包含十億、百億、千億三個參數(shù)數(shù)量級,共5款自研大模型(10億、70億、700億、1300億和1750)。
通過不同參數(shù)量級、多種部署方式,矩陣化大模型能夠在帶來AIGC功能同時,實現(xiàn)低時延推理、低內(nèi)存占用。
1B和7B的端側(cè)模型,出詞更快、內(nèi)存占用小、安全性高、無網(wǎng)弱網(wǎng)條件都能使用。同時模型具備扎實底座,可實現(xiàn)精準(zhǔn)的指令跟隨,保持正確的價值觀取向。
70B模型是面向云端服務(wù)的主力,主要針對角色扮演、知識問答等場景,能兼顧成本和性能。130B和175B兩款千億參數(shù)模型專門針對復(fù)雜任務(wù)。
而作為內(nèi)嵌于手機內(nèi)、和廣大手機用戶直接交互的大模型,藍(lán)心大模型在底層算法上還強調(diào)了3方面:基礎(chǔ)能力、指令跟隨和價值觀取向。
預(yù)訓(xùn)練階段,vivo在Transformer架構(gòu)上改良了注意力機制、位置編碼等模塊,采用混合精度訓(xùn)練以及梯度縮放策略縮短訓(xùn)練周期。采用“target only loss”方法,通過聚類分析對指令進行適應(yīng)性處理,能實現(xiàn)更精準(zhǔn)、均衡的指令跟隨。
并且專門建立了300人規(guī)模的專業(yè)審核團隊,制定200余項安全審查機制,對模型輸出進行篩查和標(biāo)注,確保模型價值觀正確。離線采樣策略和雙重獎勵模型等策略,還進一步提升了模型的安全性。
由此,端云結(jié)合大模型能直接以手機為載體,在設(shè)備上提供離線/在線AIGC功能。
vivo大模型已經(jīng)支持了兩款應(yīng)用:
藍(lán)心小V是vivo OriginOS 4上搭載的一款全局智能輔助功能,可提供超能語義搜索(利用自然語言搜索手機照片文檔日程等)、超能問答(快速總結(jié)文檔、基于文檔回答問題)、AI路人消除、智能識屏等能力。
藍(lán)心千詢則是一個AI私人小幫手APP。它無需付費,支持AI對話和AI靈感兩大能力,帶來更多生產(chǎn)力功能,如PPT大綱生成、文案創(chuàng)作等。
以上是過去一年里,大模型產(chǎn)業(yè)落地取得的成績。
但從另一面來看,隨著趨勢演進,大模型產(chǎn)業(yè)落地也浮現(xiàn)出更多復(fù)雜問題。
報告關(guān)注了四方面問題:
首先,最具代表性的問題體現(xiàn)在算力方面。
大模型規(guī)模呈指數(shù)級增長,其訓(xùn)練速度、產(chǎn)出質(zhì)量都和算力直接相關(guān)。一萬塊英偉達(dá)A100,是公認(rèn)的AI大模型算力門檻。但國內(nèi)能擁有萬卡規(guī)模的企業(yè)少之又少,相反缺卡才是絕大多數(shù)玩家的現(xiàn)狀。哪怕是閹割版的英偉達(dá)A800,也出現(xiàn)了嚴(yán)重缺貨和溢價的情況。我國本土高性能芯片雖在奮力追趕,但與國際領(lǐng)先水平仍存在較大差距。
其次在架構(gòu)上,主流Transformer本身對算力資源消耗就很大,目前提升模型智能化水平主要靠擴大參數(shù)規(guī)模,動輒千億參數(shù)規(guī)模意味著消耗巨量的算力資源。而且Transformer架構(gòu)的大模型對存儲設(shè)備要求也更高,如1000億個參數(shù)的Transformer模型,存儲這些參數(shù)就需要400GB的空間。
并且國內(nèi)的AI大模型數(shù)據(jù)存在質(zhì)量不高、體量嚴(yán)重不足、缺乏數(shù)據(jù)源調(diào)用等問題。行業(yè)需要構(gòu)建高質(zhì)量訓(xùn)練數(shù)據(jù)集。
如悟道語料庫,其包括文本、圖文和對話數(shù)據(jù)集,最大的僅5TB,其中開源的文本部分僅為200GB。作為對比,GPT-3的訓(xùn)練數(shù)據(jù)達(dá)到45TB。訓(xùn)練數(shù)據(jù)來源主要來自互聯(lián)網(wǎng)、電商、社交、搜索等渠道,存在數(shù)據(jù)類型不全面、信息可信度不高等問題。以及可供大模型訓(xùn)練的有效數(shù)據(jù)源呈現(xiàn)碎片化分散狀態(tài),導(dǎo)致大模型聯(lián)網(wǎng)無法直接調(diào)用的情況(如微信公眾號文章僅在搜狗引擎支持調(diào)用)。
最后,國內(nèi)大模型領(lǐng)域仍未出現(xiàn)爆款應(yīng)用。
報告提出,相比于ChatGPT而言,國內(nèi)爆款大模型應(yīng)用打造還任重道遠(yuǎn),主要原因在于尚未找到商業(yè)化思路,缺乏滿足客戶需求的個性化應(yīng)用。我國大模型產(chǎn)業(yè)要推出爆款級應(yīng)用,勢必要在應(yīng)用領(lǐng)域做深做細(xì),讓每一個用戶都可以充分享受到大模型所帶來的的真正便利。
相比于當(dāng)前,更為關(guān)鍵的是大模型產(chǎn)業(yè)發(fā)展下一步該怎么走。
尤其是對于中國大模型領(lǐng)域,產(chǎn)業(yè)該如何最大化發(fā)揮自身優(yōu)勢?需要把握住哪些命脈?這關(guān)乎中國AI在全球格局下的站位。
報告認(rèn)為,目前我國大模型產(chǎn)業(yè)可以從四個方向洞見未來:
第一點,端側(cè)大模型成為把握C端用戶的主力。
原因在于端側(cè)大模型成本低、移動性強、更能保障數(shù)據(jù)安全,主要應(yīng)用在手機、PC等終端設(shè)備上。
端側(cè)大模型接入個人終端設(shè)備后,能提供更加個性化的專屬服務(wù)。同時還將云上計算分?jǐn)偟搅私K端芯片上,大大降低服務(wù)器成本。
瑞銀預(yù)計生成式AI智能手機出貨量將從2023年的5000萬部增長到2027年的5.83億部,到2027年收入將達(dá)5130億美元。未來面向廣大C端用戶的端側(cè)大模型市場前景廣闊。
第二點,行業(yè)大模型將成為主戰(zhàn)場。
報告認(rèn)為,未來大模型真正的價值體現(xiàn)在更多行業(yè)及企業(yè)的應(yīng)用落地層面。
一方面,行業(yè)大模型將通用大模型用于形成多領(lǐng)域能力的資源集中于特定領(lǐng)域,模型參數(shù)相對較小,對于企業(yè)落地而言具有顯著的成本優(yōu)勢。
另一方面,行業(yè)大模型結(jié)合企業(yè)或機構(gòu)內(nèi)部數(shù)據(jù),為B端用戶的實際經(jīng)營場景提供服務(wù),能更加體現(xiàn)模型對于機構(gòu)的降本增效作用。
第三點,大模型將廣泛開源。
閉源or開源是大模型領(lǐng)域爭論已久的話題。報告認(rèn)為,開源能降低大模型開發(fā)者的使用門檻,同時提高算法的透明度和可信度。目前如GLM、Baichuan、Qwen等都在開源領(lǐng)域取得了不錯進展。
小型開發(fā)者是推動AI應(yīng)用落地的關(guān)鍵力量之一。開源則能進一步提高小型開發(fā)者的開發(fā)效率。
第四點,高性能芯片不斷升級、產(chǎn)業(yè)生態(tài)不斷完善。
芯片方面,英偉達(dá)作為市場主導(dǎo)還在不斷迭代架構(gòu)。可以預(yù)見未來芯片性能還會不斷升級。
產(chǎn)業(yè)生態(tài)方面,我國已經(jīng)初步建成包括算力基礎(chǔ)設(shè)施、大模型服務(wù)平臺、數(shù)據(jù)平臺、大模型及應(yīng)用場景等層面在內(nèi)的體系。
各個層級都有代表玩家,如算力基礎(chǔ)設(shè)施層面的華為昇騰、服務(wù)平臺方面的百度千帆、大模型層面的百度、阿里、科大訊飛、vivo等。
綜上四個方面,概括了當(dāng)下對于大模型趨勢的主要展望。
它們最終都指向了一個方面“大模型接下來將朝著影響更多人的方向發(fā)展”。
對C端用戶的影響、開源、垂直領(lǐng)域滲透等,都是大模型的逐步破圈。
而且這種大趨勢,其實已經(jīng)開始發(fā)生了。代表性事件就是國內(nèi)外手機廠商紛紛擁抱大模型。
具體數(shù)據(jù)可以參考vivo的最新披露,目前藍(lán)心大模型已經(jīng)覆蓋了超過2000萬用戶,實現(xiàn)了2761萬次高質(zhì)量問答、畫了1757萬張畫,寫了649萬份報告,去掉了85萬個路人。
同時對于模型本身,手機廠商也在不斷升級、繼續(xù)驗證端云協(xié)同趨勢。藍(lán)心大模型整體數(shù)據(jù)量已升級到“端側(cè)7B”+“云側(cè)70B”的超大組合,能帶來更好的大模型體驗。
vivo副總裁、vivo AI全球研究院院長周圍表示,從產(chǎn)業(yè)趨勢來看,投入基礎(chǔ)模型訓(xùn)練的公司可能會大幅減少,轉(zhuǎn)而更多的公司去尋找應(yīng)用場景和爆款應(yīng)用。
手機正是目前場景落地中,推進比較快的領(lǐng)域。由此他們也為更多玩家提供了一定參考。
之所以能在手機行業(yè)快速形成大模型落地終端趨勢,有以下幾方面優(yōu)勢:
其一,有設(shè)備本身的優(yōu)勢。
手機現(xiàn)在是覆蓋人群最為廣泛、最為便攜、日常使用次數(shù)最多的一塊屏幕。在手機上引入大模型,能最快讓大眾感受到先進AI能力;同時作為智能終端,手機本身也需要向著更便捷、智能、專屬化的方向發(fā)展,這和大模型的特性不謀而合。
其二,有落地形式帶來的優(yōu)勢。
手機想要落地大模型,只調(diào)用云端大模型無法全面覆蓋使用場景,端云協(xié)同是一種必然。這一形式對于算力的處理方式,加速了大模型應(yīng)用落地。
其三,有手機廠商本身帶來的優(yōu)勢。
在大模型趨勢里,手機廠商屬于場景玩家隊列,目前業(yè)界已經(jīng)達(dá)成共識,在大模型應(yīng)用落地過程中,場景玩家基于多年對行業(yè)的理解,能夠更快速形成閉環(huán),正向推動落地進程。加之大模型應(yīng)用開發(fā)需要遵循人機加交互基本邏輯,手機廠商對于交互的深刻理解,也能為大模型落地個人終端提供更多經(jīng)驗參考。
總之,對于我國大模型產(chǎn)業(yè)而言,機會正在不斷涌現(xiàn),手機行業(yè)已經(jīng)搶先得到驗證。
來到2024年,行業(yè)內(nèi)外默默達(dá)成共識,這會是更AI化的一年。
如今,隨著人民網(wǎng)在博鰲亞洲論壇上發(fā)布《2024年中國AI大模型產(chǎn)業(yè)發(fā)展報告》,正式為這一趨勢帶來了官方定調(diào)。
這一動作,不僅能推動AI大模型向更多行業(yè)滲透,更是對當(dāng)下大模型產(chǎn)業(yè)的肯定。它給產(chǎn)業(yè)帶來信心、鼓勵生態(tài)圈內(nèi)各層玩家繼續(xù)向前,更從宏觀層面給出了發(fā)展建議,為下一階段集中資源解決核心問題提供綱領(lǐng)建議。
▲文章來源于:量子位
法律聲明
歡迎登陸全志官網(wǎng)!
? 珠海全志科技股份有限公司("全志")在此特別提醒訪問本網(wǎng)站的用戶或瀏覽者認(rèn)真閱讀、充分理解下列條款。您的登陸和使用行為視為您接受下列條款并受其約束,包括全志后續(xù)對其修改。如您不同意,請停止使用。
? 更多詳細(xì)信息,請點擊此處進行瀏覽,謝謝。
以上規(guī)則的解釋權(quán)歸全志所有,并保留隨時對本網(wǎng)站上的內(nèi)容和規(guī)則進行更新和補充的權(quán)利,請你隨時訪問以便獲取最新消息。
★ ?2024 珠海全志科技股份有限公司 |
粵ICP備16116213號-6
粵公網(wǎng)安備 44049102496526號
★