- 贡献了什么(内容的稳定引用),
- 是谁完成的(贡献者的钱包或去中心化 ID),
- 何时发生(时间戳/锚点),
- 为何可信(附带的证据与评审信号)。
CF 在大图中的位置
- 贡献 → 每个原子贡献对应一个 CF。
- 资产化 → 多个 CF 组装成数据资产与可版本化的数据集。
- 使用 → AI 构建者通过策略网关访问数据集;使用被计量。
- 版税 → 收入 + 计量事件 + 所有权份额 = 可确定的分配。
CF 如何被创建
步骤说明- 提交: 贡献者发送内容。我们保存加密副本与稳定引用(内容 ID 或 URL)。
- 预扫描: 轻量检查格式、隐私脱敏与去重。部分项目自动通过;其余可能需要人工快速审核。
- 创建记录: 标准化细节,标注是否为样本、标签或验证,并附上证据与信号。
- 绑定身份: 贡献者用钱包或 DID 签名记录。
- 链上锚定: 指纹以不可变方式锚定到区块链(单条或批量)。
- 发布: CF 可被发现;原始内容的访问受策略门控。
- 评估与修订: 评审者会新增他们自己的 CF(评估)或提交争议。我们不覆盖原记录;更新通过新 CF引用旧 CF,完整保留历史。
证据与信号(我们如何支撑主张)
为在不暴露隐私数据的前提下保持高信任,每个 CF 可携带结构化证据与信号:- 证据(artifact): 交易 ID、文档或图像哈希、稳定链接或已签名的凭证等。
- 信号: 说明主张如何获得(来源类别:启发式、模型推断、原始文档、链上真实等)以及如何验证(验证类别:无、同行评审、质押验证、裁决等)。也可记录一致性程度与评审者声誉。
CF 能带来什么
- 作者清晰: 每个原子贡献在诞生时就有 CF;署名永不丢失。
- 数据集可追溯: 任何数据集都能回溯至资产与构成它们的 CF。
- 可证明所有权: CF 锚定可转移的代币化所有权份额。
- 公平分配: 当数据被使用时,计量事件与所有权份额可回指正确的 CF,从而实现确定性版税。
- 可问责改进: 验证与修正以新 CF 追加,而非静默编辑。
示例:从贡献到版税
以林医生为例:他为一张医疗图像提供了标签(该图像由患者提供,来自近期病理诊断)。图像上传创建了一个 CF(样本);林医生的标签创建了第二个 CF并与第一个关联。二者均链上锚定并发布(内容仍受策略门控)。独立评审者添加他们自己的 CF以确认或质疑该标签;若出现分歧则进入争议流程并产出新 CF(修订/弃用),且不改写历史。 这些 CF 被组装进版本化数据集。代币化所有权份额记录给患者(样本)、林医生(标签)、验证者(评审)、任何支持者以及金库。AI 构建者通过访问网关访问数据集;计量记录使用;支付流入其收入账户;版税引擎结合收入、使用事件与时间快照的所有权份额进行分配。不变量(必须成立)
- 仅追加的 CF: 每个原子贡献在创建时只有一个 CF;之后任何更改都会创建新 CF并链接原记录(如修正标签、添加证据、验证者结论、隐私处理)。视图指向最新有效 CF;早期 CF 不可变且可审计。
- 可审计的确定性: 相同输入产出相同 CF 与相同分配。
- 可追溯: 提供的数据可从数据集 → 资产 → CF → 贡献者完整追溯。
- 最小披露: 敏感载荷保持加密;访问受策略门控。