跳转到主要内容
贡献指纹(CF) 就像一张带来源的工作收据。每当有人提交样本标签验证(我们称之为原子贡献),系统都会创建一个 CF,永久关联:
  • 贡献了什么(内容的稳定引用),
  • 是谁完成的(贡献者的钱包或去中心化 ID),
  • 何时发生(时间戳/锚点),
  • 为何可信(附带的证据与评审信号)。
CF 是整个架构的第一块砖。它让作者身份清晰、支撑透明的所有权与版税,并可让任何人把数据集追溯到起源。

CF 在大图中的位置

  1. 贡献 → 每个原子贡献对应一个 CF
  2. 资产化 → 多个 CF 组装成数据资产与可版本化的数据集
  3. 使用 → AI 构建者通过策略网关访问数据集;使用被计量。
  4. 版税 → 收入 + 计量事件 + 所有权份额 = 可确定的分配。

CF 如何被创建

步骤说明
  • 提交: 贡献者发送内容。我们保存加密副本与稳定引用(内容 ID 或 URL)。
  • 预扫描: 轻量检查格式、隐私脱敏与去重。部分项目自动通过;其余可能需要人工快速审核。
  • 创建记录: 标准化细节,标注是否为样本标签验证,并附上证据与信号
  • 绑定身份: 贡献者用钱包或 DID 签名记录。
  • 链上锚定: 指纹以不可变方式锚定到区块链(单条或批量)。
  • 发布: CF 可被发现;原始内容的访问受策略门控
  • 评估与修订: 评审者会新增他们自己的 CF(评估)或提交争议。我们不覆盖原记录;更新通过新 CF引用旧 CF,完整保留历史。

证据与信号(我们如何支撑主张)

为在不暴露隐私数据的前提下保持高信任,每个 CF 可携带结构化证据信号
  • 证据(artifact): 交易 ID、文档或图像哈希、稳定链接或已签名的凭证等。
  • 信号: 说明主张如何获得(来源类别:启发式、模型推断、原始文档、链上真实等)以及如何验证(验证类别:无、同行评审、质押验证、裁决等)。也可记录一致性程度评审者声誉
评审者与算法不会编辑原始 CF。他们附加自己的 CF进行引用,这保持了可解释的审计轨迹。

CF 能带来什么

  • 作者清晰: 每个原子贡献在诞生时就有 CF;署名永不丢失。
  • 数据集可追溯: 任何数据集都能回溯至资产与构成它们的 CF。
  • 可证明所有权: CF 锚定可转移的代币化所有权份额。
  • 公平分配: 当数据被使用时,计量事件与所有权份额可回指正确的 CF,从而实现确定性版税。
  • 可问责改进: 验证与修正以新 CF 追加,而非静默编辑。

示例:从贡献到版税

以林医生为例:他为一张医疗图像提供了标签(该图像由患者提供,来自近期病理诊断)。图像上传创建了一个 CF(样本);林医生的标签创建了第二个 CF并与第一个关联。二者均链上锚定并发布(内容仍受策略门控)。独立评审者添加他们自己的 CF以确认或质疑该标签;若出现分歧则进入争议流程并产出新 CF(修订/弃用),且不改写历史。 这些 CF 被组装进版本化数据集代币化所有权份额记录给患者(样本)、林医生(标签)、验证者(评审)、任何支持者以及金库。AI 构建者通过访问网关访问数据集;计量记录使用;支付流入其收入账户版税引擎结合收入、使用事件与时间快照的所有权份额进行分配。

不变量(必须成立)

  • 仅追加的 CF: 每个原子贡献在创建时只有一个 CF;之后任何更改都会创建新 CF并链接原记录(如修正标签、添加证据、验证者结论、隐私处理)。视图指向最新有效 CF;早期 CF 不可变且可审计。
  • 可审计的确定性: 相同输入产出相同 CF 与相同分配。
  • 可追溯: 提供的数据可从数据集 → 资产 → CF → 贡献者完整追溯。
  • 最小披露: 敏感载荷保持加密;访问受策略门控。