南城 12 2026-04-05 05:50:23
日前,国家数据局明确将AI领域的Token定名为“词元” 。所谓词元 ,是人工智能大模型处理信息的最小单元,它可以是一个汉字 、一个标点,亦或是一个词汇片段 ,用户向AI的每一次提问、AI生成的每一段内容、识别的每一幅图像,本质都是词元的调用与运算。
今年以来,随着“龙虾 ”等智能体的爆发 ,带动词元消耗量显著增长。数据显示,2024年初我国日均词元调用量为1000亿,到2025年底跃升至100万亿 ,到今年3月底已突破140万亿 。日均超140万亿的词元调用量,相当于1000万亿个中文词汇,也相当于250个中国国家图书馆的资源量 ,不仅印证着词元已成为智能时代的基础资源,更标志着以词元为核心的价值体系与商业逻辑正在形成。
长期以来,AI服务面临难结算的困境。算力成本高昂,模型调用难以量化 ,用户往往需要为整体服务支付固定费用,导致供需双方都难以找到精准的价值锚点 。词元作为一种可计量 、可定价、可交易的最小计算单位,让AI服务拥有了清晰的“结算货币”。就像我们按流量付费使用网络、按度数缴纳电费一样 ,未来企业可以按实际消耗的词元数向用户收费,用户也可以根据自身需求灵活选择服务规模,不再为冗余能力买单。这种标准化 、精细化的计费模式 ,不仅让AI服务的商业化路径变得清晰可循,更将激活整个产业链 。词元与AI芯片、AI数据中心深度绑定,随着其调用量激增 ,算力租赁、内容分发网络(CDN)等领域需求也将大幅增长。词元串联起模型研发 、算力支撑、场景应用,让智能产业形成良性循环,真正实现从技术到价值的跨越。
140万亿日均词元调用量的背后 ,是我国在政策、算力 、电力等多维度形成的全链条创新优势的集中体现,是国家战略布局下智能经济发展的必然结果 。在政策层面,依托超前的绿电优势,近年来我国推动新能源与算力产业、人工智能产业深度耦合 ,今年政府工作报告首次将“算电协同”列为新基建工程,为词元的海量调用提供了稳定且低成本的能源支撑;同时,我国全面部署实施“人工智能+ ”行动 ,纵深推进数据要素市场化配置改革,更让数据、算力、算法的协同供给有了明确的战略导向。在算力布局层面,“东数西算”工程持续落地 ,西部算力枢纽与东部数据需求高效联动,让算力资源得到优化配置,从基础设施层面放大了词元生产的效率优势。在数据基础层面 ,截至2025年底我国已建成高质量数据集超10万个,规模超890PB,为词元生成筑牢了数据根基。在技术创新层面 ,国产推理芯片 、模型架构与系统优化的持续突破,不仅让相同的AI需求能够以更少的算力、更短的时延完成运算,更在深层次上改变了词元的成本结构 。
目前,我国已在全球智能经济竞争中形成了独特优势。数据表明 ,我国AI大模型周调用量已连续多周领跑全球,国产大模型包揽全球调用量前四席位,而国产词元价格仅为海外同类产品的十几分之一。随着词元逐渐成为全球智能经济的通用计量单位 ,我国依托海量应用场景、规模化供给能力和显著成本优势,让“中国词元”成为全球人工智能产业链中不可或缺的基础资源,也将在无形中带动以清洁能源为底色的算力电力协同出海 。
也要清醒认识到 ,词元调用量的大幅增长,更多反映的是AI应用规模与使用热度,并不完全等同于原始创新能力。未来 ,我们要抓住词元调用量大幅增长带来的机会窗口,大力推动我国人工智能创新发展,强化原始创新能力建设 ,力争关键核心技术取得突破。既要紧紧依托庞大应用场景与完整产业基础,在大规模真实应用中发现问题 、提炼需求、补上短板,持续优化产品,也要加快布局具身智能、人机协同等前沿方向 ,让人工智能从“能说会写”真正走向“能干活 、能赋能、能创造 ”,在推动新质生产力发展、服务经济社会高质量发展中发挥更大作用 。
发表评论
暂时没有评论,来抢沙发吧~