RVDon · RISC-V Domain-specific Open Node
站在巨人的肩上
造中国人自己的加速硅片
从开源的 Vortex RISC-V GPU 出发,为 AlphaFold3 / Protenix 的 Pairformer 模块加上硬件原生指令——三角遮罩矩阵乘与 Flash Attention 不再是软件模拟,而是硅片上的第一公民。
WHY RVDon
为什么必须做这件事
不是重复造轮子,是在开源巨人的肩上造一架我们自己的望远镜
站在巨人肩上
Vortex 是开源的,RISC-V 是开源的,Protenix 是开源的。我们用别人的肩膀,造自己的路——然后也把路开源。
真实硅片,不是 PPT
637 行 VX_tcu_fa.sv,3 级流水线,16 项 LUT exp 近似——每一行 RTL 都跑过 Verilator 仿真,0/128 错误验证通过。
开源是信仰也是策略
RTL 是图纸,芯片才是产品。开源图纸不损害商业利益——它消除信任成本,吸引 FPGA 验证者,建立学术影响力。
ARCHITECTURE
芯片架构堆叠
三层递进——从通用 GPU 基座到领域专用指令
Vortex RISC-V GPGPU
Open-source RISC-V GPGPU Base基于 Vortex 开源 RISC-V GPGPU 架构的多核 GPU——为 RVDon 提供成熟的 WGMMA 数据通路和线程调度基础设施。
TCU · WGMMA 流水线
Tensor Core Unit · WGMMAVortex Core 内的 Tensor Compute Unit,提供 WGMMA(Warp Group Matrix Multiply-Accumulate)——RVDon PF 扩展复用此数据通路。
PF 扩展指令集
Pairformer Extension ISAPF_TMM / PF_TMM_INC / PF_FLASH_ATTN——在 TCU 流水线中原生支持三角遮罩矩阵乘和 Flash Attention,消除冗余计算与软件掩码开销。
PAIRFORMER EXTENSION ISA
PF 扩展指令集
在 TCU 流水线中原生支持 Pairformer 核心计算——替代软件掩码,消除冗余
Pairformer 核心计算模式
Triangle Multiplication
三角矩阵乘法 + 对称性掩码——通用 GPU 上一半计算是冗余的,PF_TMM 硬件三角掩码直接跳过
Triangle Attention
三角注意力 + 因果掩码 + 在线 Softmax——FA_SOFTMAX 在 TCU 流水线内完成,无需全局同步
PF_TMM
出向三角遮罩矩阵乘(Triangle Multiplication Outgoing)
PF_TMM_INC
入向三角遮罩矩阵乘(Triangle Multiplication Incoming)
PF_FLASH_ATTN
Flash Attention(FA_MMA / FA_SOFTMAX / FA_UPDATE 子操作)
PF_SLOAD
Strided Load——未来扩展预留
PROGRESS
开发进度
每一步都跑过仿真——0/128 errors 才算完成
OPEN SOURCE
开源策略 · 开放设计 · 自由使用
全部 Apache 2.0——设计、代码、文档,任何人可自由使用、修改、商用
RTL 代码 + SimX 模型
Apache 2.0Vortex 基础上的 RVDon PF 扩展 RTL(VX_tcu_fa.sv 等)及 SimX 行为模型(tcu_unit.cpp)以 Apache 2.0 开源。任何人可以使用、修改、商用——但必须保留署名和专利授权条款。
PF Intrinsics + 测试框架
Apache 2.0vx_pf.h 头文件定义的 PF 扩展 intrinsics(pf_tmm_sync / pf_tmm_inc_sync / fa_mma_sync 等)及回归测试框架同样以 Apache 2.0 发布——完整工具链开源。
架构文档 + 设计报告
Apache 2.0ARCHITECTURE.md 架构规范(PF 扩展 ISA、寄存器映射、编程模型)及 docs/ 设计文档、阶段报告全部开源——让社区理解每一根信号线的意图。
强制署名条款
所有衍生作品(硬件、软件、文档)必须在 NOTICE / README / 产品说明中包含以下署名:
RVDon、DiVo、Gen²AI 为项目自命名——代码归你,署名归我们。
BUSINESS
两层价值闭环
开源建品牌 → 咨询赚收入
RVDon PF 扩展 RTL + SimX 行为模型 + intrinsics + 回归测试——硬件开发者可自由使用、改造、做自己的 Pairformer 加速器
社区共建,品牌渗透
芯片设计咨询——从架构选型到 PF 扩展 RTL 定制,帮客户在 RVDon 基础上做 Pairformer / Attention 加速优化
付费服务,1对1定制
ECOSYSTEM
从硅片到靶点
RVDon 不是孤立的硬件项目——它是 DiVo 生物计算全栈的最底层
Pairformer 是 AlphaFold3 / Protenix 的核心模块。RVDon 的 PF 扩展指令在硅片层面加速三角矩阵乘和 Flash Attention,直接提升 Protenix 的推理吞吐——而 Protenix 是 DiVo 新抗原管线 S5(pMHC 结构预测)和 CAR-T 管线 CT5(结构验证)的引擎。从硬件指令到患者靶点,这是一条完整的因果链。