读懂上海公共数据运营服务费:从服务计价到可持续运营

2026年5月12日,上海数据资源运营有限公司通过企业微信公众号发布《上海数据集团公共数据运营服务费收费标准(试行)》。理解这份标准,不能只看“价格表”,更要看清几个直接关系开发主体用数成本的关键词:一是“有限收费的准公共服务”,即收费对象不是公共数据资源本身,而是数据产品使用、基础设施支撑和持续运营服务;二是“数元计量”,即用相对统一的计量单位把不同形态的数据使用转化为可核算用量;三是“阶梯计费”,即按计费周期内最终数据使用量分档累加;四是“优惠安排”,即通过按产品、按用户的包月包年上限降低规模化用数成本;五是“公益减免”,即公共治理、公益事业等场景仍保留无偿使用空间。

因此,这项标准的意义不只是明确收费上限,更在于把公共数据授权运营中的“谁来供给、怎样计量、如何结算、哪些优惠、如何监管”转化为可执行规则。对被收费方而言,最需要回答的问题也很直接:我用的是什么产品,按什么单位计量,落在哪个价格档位,能否适用优惠或减免,是否会产生基础设施资源费用。

收费定性:针对准公共服务的有限收费

公共数据具有公共属性,但公共数据开发利用并不是“零成本交付”。公共数据从资源形态转化为可用、好用、安全使用的数据产品,需要持续的数据汇聚、清洗治理、质量校验、接口维护、权限管理、安全隔离、日志审计、计量对账和技术支持。这些工作贯穿数据产品全生命周期,并非一次性投入。

因此,公共数据运营服务费的本质,是对公共数据治理、产品开发、基础设施支撑和持续运营服务的合理计价,而不是对公共数据资源本身进行所有权转让。换言之,开发主体支付的不是“买数据”的对价,而是在授权范围和安全环境内使用公共数据产品及相关服务的费用。

这也解释了为什么该项收费具有“准公共服务”的特征:一方面,它面向产业发展、行业应用等市场化场景,可以依法依规收取费用,用于支撑持续供给;另一方面,它又不同于完全市场化商品价格,公共数据运营服务费实行政府指导价管理,收费标准以试行方式发布,并接受有关部门监管和社会公众监督。对于公共治理、公益事业等场景,收费标准还保留了依规无偿使用的安排。

计量单位:“数元”计量的是公共数据产品使用量

收费标准提出,数据使用服务费以“数据单元”(简称“数元”)为基本计量单位,原则上按照“核心数据项个数×使用记录条数×使用次数”计算数据使用量。这里的“数元”,可以理解为公共数据产品运营中的计量单位,主要服务于公共数据产品使用量核算、费用计算和双方对账。

需要注意的是,近期社会上也较多讨论的“词元”(Token),其指人工智能大模型处理信息的最小信息单元,具有可计量、可定价、可交易的特征,并成为人工智能服务调用、分发和结算的重要基础。

二者虽然都体现“按实际使用计量”的趋势,但适用对象不同。“词元”主要用于衡量大模型输入、输出和推理过程中的信息处理量,是人工智能服务的计量和结算单位;“数元”则是本收费标准下公共数据产品使用量的计量单位,重点衡量开发主体使用了多少数据项、多少记录或多少次接口调用。简单说,词元回答的是“AI模型处理了多少信息”,数元回答的是“公共数据产品被使用了多少”。如果未来公共数据产品进一步嵌入大模型应用,词元可能影响下游AI服务成本,但并不替代本标准中数据使用服务费的数元计量。

计费规则:最终用量、阶梯累进与对账关键

(一)第一步:先算最终数据使用量V

收费标准中的核心公式是:最终数据使用量V=∑(单个产品数据使用量Vn)。这句话的意思是,开发主体在一个计费周期内如果订阅或使用多个公共数据产品,应当分别计算每个产品的数据使用量,再汇总形成最终数据使用量V。运营机构据此进行统计、对账,并作为数据使用服务费的计费依据。

单个产品的数据使用量,原则上按照“核心数据项个数×使用记录条数×使用次数”计算。其中,“核心数据项个数”通常指剔除技术主键、创建时间戳等非业务字段后的数据项数量,或者API返回参数数量;“使用记录条数”通常指实际使用的数据集记录数;“使用次数”则指产品被使用的次数。

不同产品形态的计量重点不同。对数据集类公共数据产品而言,使用次数通常按每个计费周期计一次,计算重点在于“核心数据项个数×数据记录条数”;对API类公共数据产品而言,使用记录条数通常默认为1,计算重点在于“核心数据项个数×成功调用次数”。因此,开发主体在测算成本时,首先要弄清楚自己使用的是数据集、API,还是其他基础公共数据产品。

(二)第二步:再按三档阶梯累进计费

收费标准对数据使用服务费设置三档上限单价:0—200万(含)数元部分,上限单价为0.05元/数元;200万—2000万(含)数元部分,上限单价为0.04元/数元;2000万以上部分,上限单价为0.03元/数元。其基本思路是使用量越大,边际单价越低,以适配从小规模试用到规模化调用的不同场景。

这里的“阶梯累进”不是把全部用量统一按最高档或最低档计算,而是分档累加。收费标准中的计算公式为:数据使用服务费=∑(各档位计费用量×对应档位单价)。例如,某API产品有10个核心返回参数,一个月成功调用30万次,则该产品当月数据使用量约为10×1×30万=300万数元。按阶梯上限计算,其中前200万数元按0.05元/数元计,超出部分100万数元按0.04元/数元计,合计为14万元。若该产品符合按产品优惠计价安排,则还需要进一步比较包月或包年上限价格,以确定更适合的订阅方式。

从设置依据看,三档阶梯并非孤立设计,而是回应了公共数据授权运营中的三类需求:一是小规模验证场景需要清晰试错成本;二是中等规模应用需要稳定预算预期;三是高频调用、规模化应用需要通过边际单价下降和封顶安排降低综合用数成本。对开发主体而言,重点不是只看单价,而是结合自身调用规模、产品数量和使用周期,测算“阶梯计费”和“优惠计价”哪一种更合适。

(三)第三步:明确对账关键和各方关注点

费用计算的关键,不在公式本身,而在四个基础数据是否清楚:核心数据项个数是多少,实际使用记录条数是多少,成功调用次数是多少,计费周期如何确定。对开发主体而言,应重点关注产品形态、核心字段范围、调用成功口径、是否存在重复计量、是否适用优惠或减免;对运营机构而言,应重点保证计量口径透明、日志记录完整、对账结果可复核;对监管部门而言,则应关注收费是否在上限标准内,公益减免是否落实,是否存在超范围收费或不合理收费。

换言之,公式解决的是“如何算”的问题,对账机制解决的是“算得是否清楚”的问题。只有把字段、记录、调用、周期和优惠口径讲明白,开发主体才能形成稳定成本预期,运营机构也才能形成可持续服务闭环。

配套安排:优惠机制、免费额度与基础设施费用

除阶梯计费外,收费标准还设置了按产品和按用户两类优惠方案。按产品优惠计价,适合目标场景明确、长期稳定使用某一数据产品的主体;按用户优惠计价,适合多产品、多场景、多频次调用的综合型开发主体。对被收费方而言,这部分是成本控制的重点:如果调用量较小,按阶梯计费可能更合适;如果调用量较大,尤其是单产品或多产品长期高频使用,则应重点评估包月、包年上限价格。

基础设施使用费则主要对应安全可控开发环境和资源占用。收费标准提出,为符合条件的开发主体免费提供一定规格的基础设施资源,超出免费规格的部分按相关目录价格据实收费;同时免费提供数据治理工具、数据开发工具等基础工具服务。隐私计算、区块链、高性能算力等特殊服务,则由双方遵循公平合理原则协商收费。

这意味着,开发主体在看数据使用服务费之外,还要同步评估是否会产生额外的算力、存储、隐私计算或高性能计算资源需求。特别是面向模型训练、批量核验、复杂融合分析等场景,基础设施费用可能成为整体成本的重要组成部分。

结语:读懂收费标准,关键是读懂成本规则

总体来看,上海公共数据运营服务费收费标准并不是单纯“定价格”,而是把公共数据授权运营中的产品使用、计量核算、服务支撑、优惠减免和监管约束纳入规则化框架。其制度价值在于,在公共属性不变的前提下,为产业发展和行业应用场景提供更清晰的服务价格信号。

对开发主体而言,读懂这份标准应抓住几个直接问题:是否属于收费场景,使用的是哪类数据产品,数元如何计算,最终用量落在哪个阶梯,能否适用按产品或按用户优惠,是否存在基础设施超额费用。把这些问题弄清楚,才能真正判断公共数据产品是否“用得起、算得清、可持续”。对公共数据授权运营而言,价格机制只是起点,更重要的是通过透明计量、合理收费和持续服务,让公共数据在安全合规前提下更好转化为治理能力、产业能力和创新能力。

本文作者:朱扬勇 上海数据研究院学术副院长

直通车game推荐阅读
OKX下载 交易所排行 比特币平台下载