小明成人免费视频一区,亚洲欧美精,日韩中文欧美,江湖电影粤语完整版在线观看,不忠未删减完整版电影在线看,日韩国产,未删减越南电影完整版

下載

小詞元撬動智能經(jīng)濟大市場

時間:2026-04-03 09:33
來源:人民網(wǎng)

數(shù)據(jù)來源:國家發(fā)展改革委、國家數(shù)據(jù)局 制圖:沈亦伶

頭條看點

詞元(Token),大模型處理信息的最小信息單元。我國日均詞元調(diào)用量大幅增長,不僅折射智能經(jīng)濟的澎湃活力,也意味著一套新型商業(yè)邏輯正在加速演進。智能時代,有了可計量、可定價、可交易的詞元,人工智能有望成為像水、電一樣支撐社會運轉(zhuǎn)的基礎(chǔ)資源。

用戶端,查資料、寫代碼、改文案;企業(yè)端,金融風(fēng)控、智能客服、代碼修正……如今,人工智能應(yīng)用落地的每一個場景,都離不開對詞元(Token)的海量調(diào)用。

詞元,大模型處理信息的最小信息單元。今年3月,中國日均詞元調(diào)用量突破140萬億,兩年增長超千倍。怎么理解詞元?詞元和人工智能產(chǎn)業(yè)的關(guān)系是什么,未來發(fā)展趨勢如何?記者進行了采訪。

詞元調(diào)用量爆發(fā)性增長,背后是模型能力提升

有人疑惑,詞元和常見的數(shù)據(jù)有何不同?

“人工智能大模型的本質(zhì)是一套復(fù)雜的數(shù)學(xué)運算系統(tǒng),它無法像人類一樣直接讀懂文字、聽懂聲音、看懂畫面?!敝袊苿友芯吭壕W(wǎng)絡(luò)與IT技術(shù)研究所副所長唐華斌說,人工智能大模型必須先將各類原始數(shù)據(jù)轉(zhuǎn)化為自己能識別的“語言”,再通過運算輸出結(jié)果,詞元就是這套“語言”中最基礎(chǔ)的單元。

具體來看,文字詞元像“樂高積木”,一個單詞或一個漢字被拆成一塊塊詞元;音頻詞元像“樂譜上的音符”,一段聲音被切成極短的時間片段,每一片包含音調(diào)、音量;視頻詞元像“拼圖碎片”,每一幀畫面被切成一個個小方格,并且還要考慮時間上的連續(xù)性……

“在大模型看來,三種模態(tài)的詞元完全沒有差別。在模型眼里,它不覺得自己是在讀文字或看視頻,它只覺得自己是在處理一串極其復(fù)雜的數(shù)字序列?!被鹕揭嬷悄芩惴ㄘ撠?zé)人吳迪表示。

一個個基礎(chǔ)的詞元,構(gòu)成了智能經(jīng)濟運行的“細胞”。今年3月,中國人工智能大模型周詞元調(diào)用量連續(xù)3周占據(jù)領(lǐng)先地位,成為全球大模型應(yīng)用活躍度最高的國家之一。

“詞元調(diào)用量爆發(fā)性增長,最直接的原因是模型能力的提升。每一次模型能力的提升,就會解鎖更多應(yīng)用場景,從而使大模型詞元調(diào)用量進一步激增?!眳堑辖榻B,以Seedance(豆包視頻生成模型)2.0為例,生成1分鐘視頻大約會消耗超過100萬個詞元。

同時,新的應(yīng)用形態(tài)、新的商業(yè)模式,也會驅(qū)動大模型詞元調(diào)用量大幅上漲。唐華斌表示,最近興起的智能體和傳統(tǒng)單輪問答不一樣,它的運行往往意味著更長的上下文、更頻繁的模型調(diào)用、更多輪次的任務(wù)拆解,以及工具執(zhí)行過程中的持續(xù)反饋。

“簡單任務(wù),如果只需要單輪或幾輪工具調(diào)用就能搞定,消耗詞元只需要幾千;如果需要幾十輪工具調(diào)用,則需要至少消耗幾萬詞元乃至更多?!眳堑险f,智能體等新業(yè)態(tài)的涌現(xiàn),讓詞元調(diào)用量又進入了一個快速增長的通道。

詞元調(diào)用集中在信息密度高、迭代周期快的領(lǐng)域

60億,是愛問答科技創(chuàng)始人李加義過去一年的詞元調(diào)用量。

走進位于北京海淀區(qū)的AI原點社區(qū),一間約16平方米的工作室里,李加義團隊正在調(diào)試剛剛設(shè)計完成的AI玩具。

“這個玩具要具備交互能力,離不開相應(yīng)的軟件系統(tǒng)。放在以前,同等體量的軟件系統(tǒng)開發(fā)至少要半年,還得多人共同配合。”李加義說,在AI大模型與輔助編程的深度賦能下,消耗數(shù)億詞元,開發(fā)周期被壓縮至兩個月。

2025年初,非計算機科班出身的李加義接觸AI輔助編程工具后,借助新技術(shù)打破了軟件開發(fā)的專業(yè)壁壘。“一年間,我們高效地完成了兩款A(yù)PP和一個AI玩具的開發(fā)設(shè)計。前不久,我們還將自研的AI硬件產(chǎn)品推向了國際消費電子展(CES)?!崩罴恿x說,AI助力不僅讓開發(fā)成本大大降低,也讓小微企業(yè)的創(chuàng)新探索有了更多可能。

軟件開發(fā),是人工智能應(yīng)用落地的典型場景之一??傮w看,詞元調(diào)用量的分布呈現(xiàn)出鮮明的行業(yè)與場景特征,主要集中在那些信息密度更高、產(chǎn)品迭代周期更快以及模型與生產(chǎn)系統(tǒng)之間聯(lián)系更緊密的領(lǐng)域。

以豆包大模型2.0為例,吳迪介紹,從行業(yè)分類看,互聯(lián)網(wǎng)行業(yè)詞元調(diào)用比例最高,消費電子、金融、新零售和商務(wù)服務(wù)緊隨其后。

從場景來看,非結(jié)構(gòu)化信息的處理和分析占比最大;教育、內(nèi)容創(chuàng)作和“搜索與推薦”次之。

觀察未來的發(fā)展趨勢,軟件開發(fā)、深度研究、個人助理等智能體應(yīng)用場景或?qū)⒊蔀樵~元調(diào)用量爆發(fā)的重要領(lǐng)域?!疤貏e是軟件開發(fā),當(dāng)前人工智能正從簡單寫代碼轉(zhuǎn)向理解整個項目,不僅能排查錯漏、自動優(yōu)化,甚至能通過智能體自主完成整個開發(fā)任務(wù)。代碼上下文長、交互輪次多,企業(yè)為提升效率的付費意愿較強,這將成為一個巨大的需求增長點?!碧迫A斌說。

詞元可計量,人工智能有望成為社會運轉(zhuǎn)基礎(chǔ)資源

“今年1月底以來,有的模型企業(yè)創(chuàng)下20天收入超越2025年全年總收入的業(yè)績紀(jì)錄。這組數(shù)字背后,是一套以詞元計費為基礎(chǔ)的新型商業(yè)邏輯正在加速演進。”國家數(shù)據(jù)局局長劉烈宏表示。

回顧人工智能產(chǎn)業(yè)發(fā)展歷程,過去一段時期,行業(yè)聚焦于模型性能的比拼,技術(shù)創(chuàng)新與商業(yè)落地之間缺乏可量化的銜接橋梁,難以形成“技術(shù)迭代—價值產(chǎn)出—持續(xù)投入”的良性循環(huán)。

“詞元本身具備可計量、錨定算力能耗、跨模態(tài)通用結(jié)算的特點,使其能夠成為連接技術(shù)供給與商業(yè)需求的結(jié)算單位。打個比方,大模型輸出的智能好比電,智算中心好比發(fā)電廠,電用千瓦時來計量,智能調(diào)用就用詞元來計費?!甭?lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)群戰(zhàn)略管理總監(jiān)黃山表示,展望未來的智能社會,人工智能有望成為像水、電一樣運轉(zhuǎn)的基礎(chǔ)資源,隨取隨用,用多少買多少。

從詞元的視角出發(fā),打造智能經(jīng)濟新形態(tài),我國有何優(yōu)勢?有哪些發(fā)展著力點?

算法創(chuàng)新持續(xù)實現(xiàn)突破,國產(chǎn)大模型通過底層架構(gòu)優(yōu)化,與全球頂尖技術(shù)的代差逐漸縮小。吳迪說,我國的大模型廠商做了非常多的算法創(chuàng)新,在推理成本、響應(yīng)速度上不斷優(yōu)化,能以更少的詞元完成復(fù)雜任務(wù)。

基礎(chǔ)設(shè)施具備領(lǐng)先優(yōu)勢。每生成一個詞元,都在調(diào)用數(shù)據(jù)中心的算力,伴隨著電力消耗。我國已建成全球門類最全、規(guī)模最大的能源體系,電源足、電網(wǎng)強、市場活。唐華斌表示,我國發(fā)電供給持續(xù)提升、電力成本不斷降低,能夠有效降低詞元調(diào)用成本。

“能耗和算力是詞元調(diào)用的兩個關(guān)鍵成本。讓每個詞元用更少的算力和更少的能耗生產(chǎn)出來,體現(xiàn)的是智算中心等基礎(chǔ)設(shè)施的生產(chǎn)能力和效率?!秉S山表示,要構(gòu)建起安全、高效、普惠的人工智能基礎(chǔ)設(shè)施,持續(xù)提升大模型推理效率、降低單個詞元成本,讓人工智能最大程度走向規(guī)模化應(yīng)用落地。

北疆新聞 | 內(nèi)蒙古自治區(qū)重點新媒體平臺,內(nèi)蒙古出版集團?內(nèi)蒙古新華報業(yè)中心主管主辦的國家互聯(lián)網(wǎng)新聞信息采編發(fā)布服務(wù)一類資質(zhì)平臺。

【查看原文】 【編輯:方琳】

閱讀全文