跳转到主要内容

TL;DR

本页解释了 codatta 如何将数据转化为创收资产(版税经济),**先训练后付费(TNPL)**商业模式如何在此基础上运作,并简要说明了为什么区块链基础是使其大规模运作的最实用方法。 要了解大局,请参见我们的愿景:https://codatta.io/vision关键概念:
  • 版税经济:基于使用、持续为数据所有者和验证者分配收入。
  • TNPL:开发者先训练,后通过版税在有价值后付费。
  • 区块链(简要理由):可编程的所有权、可证明的来源和自动支付。

版税经济

它是什么

一种协议级机制,将数据使用(训练、微调和评估消费,加上对源自许可数据的下游 AI 模型进行计量推断)与数据所有者(贡献者、验证者、支持者)和协议金库的持续版税流关联。

为什么重要

  • 将 AI 数据从一次性销售转向流式、基于使用的收益
  • 激励对齐:更好的数据 → 更好的模型 → 更多使用 → 更多版税
  • 使高技能贡献(如专家标签、基于证据的信号)在经济上可行。

如何运作(概念性)

  1. 贡献和指纹识别:数据被贡献并绑定到贡献指纹谱系-资产记录
  2. 所有权份额:通过贡献、验证和质押即信心建立所有权(分割、时间限定)。
  3. 使用计量和归属
    • 训练/微调:消费事件被记录以建立谱系和归属(谁在何时使用了什么)。
    • 推断(服务):对源自许可数据的模型使用进行计量(如请求/代币/API 调用)以计算版税。
  4. 版税路由:智能合约将收入分配给所有者和金库,遵循当前的所有权份额。

分配控制

  • 按训练付费:在训练/微调消费期间的小额版税(或仅归属,按交易);派生模型的推断被计量以进行结算。
  • 与绩效挂钩:达到商定的质量阈值时解锁倍数。
  • 协议份额:小部分公共份额维持基础设施、审计和研究。
类比:像音乐流媒体版税,但适用于知识:您的数据的每次有意义使用都会回馈给您。

新商业模式:TNPL(先训练后付费)

定义:让开发者无需预先购买即可访问数据;如果/当训练模型创造价值时,版税回流给数据所有者。

开发者工作流

  1. 请求访问 → 同意 TNPL 条款(版税率、KPI 条款、终止条件)。
  2. 训练/评估 → 协议在类似托管协议下跟踪谱系和使用。
  3. 启动和货币化 → 模型/API 盈利;智能合约按 TNPL 条款分配收益。

为什么开发者喜欢它

  • 降低前期成本和风险;实验得以解锁
  • 现金专注于产品-市场契合,而非数据获取。

为什么贡献者喜欢它

  • 随着实际采用而扩展的长尾收入
  • 公平:支付与测量的影响可验证的使用挂钩。

为什么协议喜欢它

  • 最大化数据利用;吸引独立和企业级构建者。
  • 创造加强代币和库需求的经常性流动。

为什么是区块链(精简版)

我们在此保持简要,并在专门章节中深入探讨。
  • 可编程所有权:可更新的分割、时间限制所有权,随着质押/验证演变。
  • 可证明来源:链上指纹和谱系使谁贡献了什么可审计。
  • 自动支付:智能合约即时且在全球范围内路由版税。
  • 开放市场访问:任何人都可以发现、许可和构建—没有围墙花园。
  • 可组合性:所有权份额可以重新打包成投资组合(风险/回报调整)。
  • 隐私设计(混合):敏感数据保持在链下;证明、哈希和策略在链上。
综合起来:这些原语构成了运作版税经济的最小可行基础。可编程所有权表达和更新获得报酬的权利;来源将每次使用绑定到正确的贡献者;自动支付开放市场访问使每事件微额版税在经济和全球范围内可行;可组合性将原本非流动的数据份额转化为可融资、可发现的资产;混合隐私模型满足企业治理和监管。如果没有这个完整组合,归属将无法执行,结算将发展到不可扩展,或市场保持封闭—在这些条件下,TNPL和按使用版税无法蓬勃发展。

版税经济中的模式

模式何时支付触发典型使用注释
按训练付费训练/服务期间计量使用微调、评估、API平滑的微流动
与绩效挂钩KPI 达到后准确性/延迟/SLA安全评估、风险信号增加公平性和严谨性
TNPL成功后货币化事件初创公司、试点无预付款;分享收益
这三种可以在单个合约中组合。

数据(知识)生命周期和版税流

这个流程说明了 codatta 的版税经济中数据和版税的生命周期。 数据经历四个紧凑阶段:采购和标注(贡献者通过质押创建和验证数据), 上市和许可(数据被发布和许可使用),模型构建(开发者训练、微调, 并使用许可数据启动 AI 模型),以及使用和结算(模型被部署,用户互动, 版税回流给贡献者)。虚线反馈循环显示所有权份额如何演变以及 版税声誉更新如何持续滋养生态系统—确保贡献者继续获得收益以及 所有权已验证参与保持动态一致。
示例 — 合规信号(简化)加密货币有大量账户必须快速正确地标注。每次注释都需要证据可靠的推理,并必须反映最新状态(分钟级,而非周级)。Codatta 运行全球情报网络—贡献者、验证者和 AI—以大规模产生和更新这些注释。以下步骤说明了从创建到版税的关键流程