透視2025丨中國(guó)AI模型廠商已在特定領(lǐng)域形成一定優(yōu)勢(shì)

2024-12-26 19:18:24 中新經(jīng)緯

　　編者按：2024漸行漸遠(yuǎn)，2025源源而來(lái)。各行業(yè)如何應(yīng)變局，如何開(kāi)新局？中新經(jīng)緯廣邀經(jīng)濟(jì)學(xué)者，梳理過(guò)去關(guān)鍵事件，展望新年潛在機(jī)遇，以期為您提供有價(jià)值的參考。

　　中新經(jīng)緯12月26日電 (袁媛)2024年被稱為AI(人工智能)元年。在這一年里，關(guān)于AI的大事件不絕于耳：諾貝爾物理學(xué)獎(jiǎng)?lì)C發(fā)給AI領(lǐng)域科學(xué)家，英偉達(dá)市值一度超越蘋(píng)果、微軟，蘋(píng)果推出Apple Intelligence AI系統(tǒng)等等。

　　而在AI大模型方面，最主要事件則是OpenAI推出多模態(tài)大模型ChatGPT-4o，這一版本具有實(shí)時(shí)處理和生成文本、音頻以及圖像等多種模態(tài)的能力，被譽(yù)為技術(shù)上一個(gè)巨大突破。

　　事實(shí)上，中國(guó)在AI大模型方面也已有足夠競(jìng)爭(zhēng)力。有數(shù)據(jù)顯示，中國(guó)在2024年自然指數(shù)科學(xué)貢獻(xiàn)榜單上名列前茅，而且2014年至2023年，中國(guó)生成式AI專利申請(qǐng)量居全球第一。此外，2024年中國(guó)生成式AI領(lǐng)域的私人投資較上一年增長(zhǎng)更為顯著。

　　而智源研究院近日發(fā)布最新一期FlagEval大模型評(píng)測(cè)。結(jié)果顯示，2024年下半年，國(guó)內(nèi)大模型發(fā)展更聚焦綜合能力提升與實(shí)際應(yīng)用，其中，多模態(tài)模型發(fā)展迅速，涌現(xiàn)了不少新的廠商與新模型。

　　國(guó)內(nèi)廠商“全面開(kāi)花”

　　對(duì)于國(guó)內(nèi)大模型的發(fā)展趨勢(shì)，智源研究院智能評(píng)測(cè)組負(fù)責(zé)人楊熙表示，中國(guó)的AI模型廠商已經(jīng)在特定領(lǐng)域形成了一定優(yōu)勢(shì)�！皣�(guó)產(chǎn)模型在安全評(píng)測(cè)和用戶體驗(yàn)優(yōu)化方面的表現(xiàn)尤為突出，尤其是在用戶意圖識(shí)別和適應(yīng)性調(diào)整上，國(guó)內(nèi)廠商具備較大的競(jìng)爭(zhēng)力。”

　　具體來(lái)看，語(yǔ)言模型主觀評(píng)測(cè)顯示，目前針對(duì)一般中文場(chǎng)景的開(kāi)放式生成任務(wù)，各大模型表現(xiàn)已趨于飽和。字節(jié)跳動(dòng)、百度等國(guó)產(chǎn)模型表現(xiàn)優(yōu)異。不過(guò)，在邏輯推理、觀點(diǎn)表達(dá)等維度，國(guó)內(nèi)廠商仍需進(jìn)一步與國(guó)際巨頭看齊。此外，多模態(tài)模型發(fā)展迅速，特別是在視覺(jué)語(yǔ)言模型和文生圖、文生視頻等方向上取得突破——開(kāi)源模型如阿里巴巴的Qwen系列在某些任務(wù)上表現(xiàn)出色。

　　隨著AI模型能力的提升，隱私保護(hù)和安全問(wèn)題日益成為業(yè)界關(guān)注的焦點(diǎn)。楊熙指出，在評(píng)測(cè)中，智源團(tuán)隊(duì)特別設(shè)計(jì)了“引誘問(wèn)題”，以測(cè)試模型在隱私保護(hù)和數(shù)據(jù)安全方面的表現(xiàn)，結(jié)果顯示，國(guó)產(chǎn)大模型在防護(hù)隱私數(shù)據(jù)方面表現(xiàn)較好。

　　值得注意的是，整體來(lái)看，復(fù)雜場(chǎng)景的表現(xiàn)依然是國(guó)內(nèi)外所有模型的短板。而動(dòng)態(tài)視頻場(chǎng)景中，模型普遍存在物體變形和物理規(guī)律認(rèn)知不足的問(wèn)題。

　　智源研究院副院長(zhǎng)兼總工程師林詠華指出，未來(lái)的AI生態(tài)發(fā)展將更加注重應(yīng)用落地與動(dòng)態(tài)評(píng)測(cè)�！凹夹g(shù)的演進(jìn)不只是能力的疊加，更需要通過(guò)實(shí)際應(yīng)用場(chǎng)景反饋，促進(jìn)模型能力的深度提升。”

　　在她看來(lái)，商業(yè)化路徑也是模型發(fā)展中的一大難題。如何在確保開(kāi)源精神的同時(shí)實(shí)現(xiàn)商業(yè)價(jià)值，是廠商必須面對(duì)的現(xiàn)實(shí)考驗(yàn)。從技術(shù)開(kāi)發(fā)到應(yīng)用落地，這一過(guò)程需要更多的跨界合作和創(chuàng)新模式。

　　楊熙則談到，看未來(lái)趨勢(shì)，小模型和大模型的端云結(jié)合將成為重要的發(fā)展方向�！岸藗�(cè)模型表現(xiàn)出色，而小模型通過(guò)精細(xì)化訓(xùn)練可以在特定任務(wù)中表現(xiàn)更優(yōu)。端云結(jié)合的方式，不僅能降低算力成本，還能為用戶提供更加靈活和高效的解決方案�！�

　　模型測(cè)評(píng)的機(jī)遇與挑戰(zhàn)

　　近年來(lái)，大模型技術(shù)的廣泛應(yīng)用催生了復(fù)雜的測(cè)評(píng)需求。從文本生成到圖像識(shí)別，從語(yǔ)音分析到多模態(tài)理解，模型測(cè)評(píng)正從學(xué)術(shù)研究走向產(chǎn)業(yè)化。上述智源研究院最新發(fā)布的FlagEval秋冬模型測(cè)評(píng)，評(píng)估了全球100多個(gè)開(kāi)源和閉源模型的能力，并且首次加入了金融量化交易等應(yīng)用場(chǎng)景的專項(xiàng)評(píng)測(cè)。這些多元化的測(cè)評(píng)結(jié)果，在一定程度上為AI模型的能力邊界提供了標(biāo)尺。

　　模型測(cè)評(píng)市場(chǎng)為何能引發(fā)關(guān)注？林詠華認(rèn)為，一方面，測(cè)評(píng)為企業(yè)提供了清晰的技術(shù)能力對(duì)比，有助于優(yōu)化資源配置。另一方面，測(cè)評(píng)結(jié)果為資本選擇投資對(duì)象提供了有力依據(jù)。在資本密集型的AI行業(yè)中，測(cè)評(píng)已成為“資本看得懂”的標(biāo)準(zhǔn)工具。此外，模型參與者格局日趨復(fù)雜，從傳統(tǒng)的學(xué)術(shù)機(jī)構(gòu)到全球科技巨頭，從互聯(lián)網(wǎng)大廠到創(chuàng)業(yè)公司，競(jìng)爭(zhēng)的廣度和深度都在加劇。

　　然而，模型測(cè)評(píng)也面臨多重挑戰(zhàn)。首先是數(shù)據(jù)問(wèn)題。測(cè)評(píng)結(jié)果的準(zhǔn)確性和可信度，依賴于高質(zhì)量、多樣化的數(shù)據(jù)集。然而，數(shù)據(jù)孤島和數(shù)據(jù)泄露問(wèn)題限制了評(píng)測(cè)的深度和廣度。此外，缺乏統(tǒng)一的評(píng)測(cè)標(biāo)準(zhǔn)，也讓不同機(jī)構(gòu)的評(píng)測(cè)結(jié)果缺乏可比性。林詠華在談及這一問(wèn)題時(shí)表示，“評(píng)測(cè)體系的開(kāi)放性和科學(xué)性是關(guān)鍵，要實(shí)現(xiàn)統(tǒng)一標(biāo)準(zhǔn)，仍需克服多方利益博弈的障礙。”

　　在林詠華看來(lái)，隨著技術(shù)的不斷發(fā)展，單一任務(wù)測(cè)評(píng)正向多任務(wù)和多模態(tài)評(píng)測(cè)轉(zhuǎn)型。而隨著AI在醫(yī)療、教育、金融等領(lǐng)域的深度滲透，垂直領(lǐng)域的專項(xiàng)評(píng)測(cè)需求也在快速增長(zhǎng)。(中新經(jīng)緯APP)

　　中新經(jīng)緯版權(quán)所有，未經(jīng)授權(quán)，不得轉(zhuǎn)載或以其他方式使用。

責(zé)任編輯：張芷菡

來(lái)源：中新經(jīng)緯

編輯：王永樂(lè)

廣告等商務(wù)合作，請(qǐng)點(diǎn)擊這里

未經(jīng)過(guò)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文，侵權(quán)必究

中新經(jīng)緯版權(quán)所有，未經(jīng)書(shū)面授權(quán)，任何單位及個(gè)人不得轉(zhuǎn)載、摘編或以其它方式使用。

關(guān)注中新經(jīng)緯微信公眾號(hào)(微信搜索“中新經(jīng)緯”或“jwview”)，看更多精彩財(cái)經(jīng)資訊。

今日推薦