Open Source · Apache 2.0GitHub →

RVDon · RISC-V Domain-specific Open Node

站在巨人的肩上
造中国人自己的加速硅片

从开源的 Vortex RISC-V GPU 出发,为 AlphaFold3 / Protenix 的 Pairformer 模块加上硬件原生指令——三角遮罩矩阵乘与 Flash Attention 不再是软件模拟,而是硅片上的第一公民。

Vortex GPU+WGMMA 数据通路+PF Extension=RVDon

WHY RVDon

为什么必须做这件事

不是重复造轮子,是在开源巨人的肩上造一架我们自己的望远镜

站在巨人肩上

Vortex 是开源的,RISC-V 是开源的,Protenix 是开源的。我们用别人的肩膀,造自己的路——然后也把路开源。

真实硅片,不是 PPT

637 行 VX_tcu_fa.sv,3 级流水线,16 项 LUT exp 近似——每一行 RTL 都跑过 Verilator 仿真,0/128 错误验证通过。

开源是信仰也是策略

RTL 是图纸,芯片才是产品。开源图纸不损害商业利益——它消除信任成本,吸引 FPGA 验证者,建立学术影响力。

ARCHITECTURE

芯片架构堆叠

三层递进——从通用 GPU 基座到领域专用指令

Vortex RISC-V GPGPU

Open-source RISC-V GPGPU Base

基于 Vortex 开源 RISC-V GPGPU 架构的多核 GPU——为 RVDon 提供成熟的 WGMMA 数据通路和线程调度基础设施。

L0 · GPU

TCU · WGMMA 流水线

Tensor Core Unit · WGMMA

Vortex Core 内的 Tensor Compute Unit,提供 WGMMA(Warp Group Matrix Multiply-Accumulate)——RVDon PF 扩展复用此数据通路。

L1 · TCU

PF 扩展指令集

Pairformer Extension ISA

PF_TMM / PF_TMM_INC / PF_FLASH_ATTN——在 TCU 流水线中原生支持三角遮罩矩阵乘和 Flash Attention,消除冗余计算与软件掩码开销。

L2 · PF ISA
L0 GPUL1 TCUL2 PF ISA

PAIRFORMER EXTENSION ISA

PF 扩展指令集

在 TCU 流水线中原生支持 Pairformer 核心计算——替代软件掩码,消除冗余

Pairformer 核心计算模式

🔺

Triangle Multiplication

三角矩阵乘法 + 对称性掩码——通用 GPU 上一半计算是冗余的,PF_TMM 硬件三角掩码直接跳过

Triangle Attention

三角注意力 + 因果掩码 + 在线 Softmax——FA_SOFTMAX 在 TCU 流水线内完成,无需全局同步

funct3=3✅ RTL + SimX 验证

PF_TMM

出向三角遮罩矩阵乘(Triangle Multiplication Outgoing)

funct3=4✅ RTL + SimX 验证

PF_TMM_INC

入向三角遮罩矩阵乘(Triangle Multiplication Incoming)

funct3=5✅ RTL 0/128 错误

PF_FLASH_ATTN

Flash Attention(FA_MMA / FA_SOFTMAX / FA_UPDATE 子操作)

funct3=⏸ 预留

PF_SLOAD

Strided Load——未来扩展预留

PROGRESS

开发进度

每一步都跑过仿真——0/128 errors 才算完成

Phase 1.0PF_TMM RTL0/128 errors
Phase 1.1VX_tcu_fa.sv 637行FA Online Softmax 流水线
Phase 2.1流水线时序对齐fa_p_delay_pipe
Phase 2.3FP32 算术修复fp32_sub + fp32_floor_int
Phase 2.4FA_SOFTMAX 验证0/128 errors ✅
Phase 3FPGA 原型验证下一步

OPEN SOURCE

开源策略 · 开放设计 · 自由使用

全部 Apache 2.0——设计、代码、文档,任何人可自由使用、修改、商用

RTL 代码 + SimX 模型

Apache 2.0

Vortex 基础上的 RVDon PF 扩展 RTL(VX_tcu_fa.sv 等)及 SimX 行为模型(tcu_unit.cpp)以 Apache 2.0 开源。任何人可以使用、修改、商用——但必须保留署名和专利授权条款。

PF Intrinsics + 测试框架

Apache 2.0

vx_pf.h 头文件定义的 PF 扩展 intrinsics(pf_tmm_sync / pf_tmm_inc_sync / fa_mma_sync 等)及回归测试框架同样以 Apache 2.0 发布——完整工具链开源。

架构文档 + 设计报告

Apache 2.0

ARCHITECTURE.md 架构规范(PF 扩展 ISA、寄存器映射、编程模型)及 docs/ 设计文档、阶段报告全部开源——让社区理解每一根信号线的意图。

强制署名条款

所有衍生作品(硬件、软件、文档)必须在 NOTICE / README / 产品说明中包含以下署名:

Based on DiVo Gen²AI RVDon (RISC-V Domain-specific Open Node) by 王觉菊 Jueju.Wang, https://github.com/sealionking/rvdon

RVDon、DiVo、Gen²AI 为项目自命名——代码归你,署名归我们。

BUSINESS

两层价值闭环

开源建品牌 → 咨询赚收入

开源层

RVDon PF 扩展 RTL + SimX 行为模型 + intrinsics + 回归测试——硬件开发者可自由使用、改造、做自己的 Pairformer 加速器

社区共建,品牌渗透

咨询层

芯片设计咨询——从架构选型到 PF 扩展 RTL 定制,帮客户在 RVDon 基础上做 Pairformer / Attention 加速优化

付费服务,1对1定制

ECOSYSTEM

从硅片到靶点

RVDon 不是孤立的硬件项目——它是 DiVo 生物计算全栈的最底层

RVDon PF 扩展Protenix 结构预测pMHC 三维结构新抗原 / CAR-T

Pairformer 是 AlphaFold3 / Protenix 的核心模块。RVDon 的 PF 扩展指令在硅片层面加速三角矩阵乘和 Flash Attention,直接提升 Protenix 的推理吞吐——而 Protenix 是 DiVo 新抗原管线 S5(pMHC 结构预测)和 CAR-T 管线 CT5(结构验证)的引擎。从硬件指令到患者靶点,这是一条完整的因果链。

用 RVDon 做你的 device

拿开源设计来做自己的硬件——或者找我们来定制你的领域专用芯片。