L2 · 模型层

Model Training · Fine-tuning · Deployment

模型训练与微调及部署

自研模型核心 · 蒸馏 · 微调 · 防逆向——不是调用第三方 API,是自主训练、自主部署、自主保护。

自研训练+蒸馏微调+防逆向部署=自主模型主权

SELF-DEVELOPED MODELS

自研模型矩阵

六个核心模型——覆盖基因组、蛋白质、细胞、通路、RNA、知识检索

DiVoGenome

pLDDT 92+

Genome Triple-Model Cross-Interpretation

基因组三模型交叉解读——融合变异预测、功能注释、表型关联三路模型,单核苷酸分辨率输出可解释结论。

DiVoFold5

pLDDT 95.4

Protein Structure Prediction

蛋白质结构预测模型——在 AlphaFold3 / Protenix 架构上自研蒸馏,pLDDT 95.4,推理吞吐提升 3.2x。

DiVoCell

10k+ cells

Multi-cell 3D Simulation

多细胞 3D 模拟模型——从单细胞力学到组织级涌现行为,支持万级细胞实时耦合求解。

DiVoSignal

Graph NN

Signaling Pathway Solver

信号通路求解模型——将通路图编码为图神经网络,预测扰动下的级联响应与药物靶点。

RNALens

Fine-tuned

mRNA Structure Fine-tuning

mRNA 结构微调模型——在 RNA-FM 基座上做二级结构预测微调,用于 mRNA 疫苗序列优化。

Investigate Lens

RAG Core

Knowledge Base Retrieval Engine

知识库检索引擎——多模态文献嵌入 + 混合检索 + 引用级溯源,为 Agent 层提供事实底座。

TRAINING PIPELINE

训练流水线

六步递进——从原始数据到加密部署,全链路自主可控

01

数据准备

Data Preparation

多源数据清洗、标注、去重——基因序列、蛋白结构、文献语料统一进入训练数据湖。

02

预训练

Pre-training

在大规模无标注语料上做基座预训练——学习序列、结构、功能的通用表征。

03

微调

Fine-tuning

领域指令微调 + RLHF——把通用基座对齐到基因组、蛋白、细胞等垂直任务。

04

蒸馏

Distillation

教师-学生蒸馏——把大模型的能力压缩到可部署尺寸,损失可控、吞吐倍增。

05

量化

Quantization

INT8 / FP8 量化 + 稀疏化——在不掉点的前提下把显存占用压到 1/4。

06

部署

Deployment

加密推理容器部署到 RVDon 加速集群——模型不离开可信环境,推理即服务。

数据预训练微调蒸馏量化部署

OPEN SOURCE

模型开源策略

与芯片一样,自研模型全部开源——开源是我们的护城河,不是封闭

自研模型全开源

Fully Open Source

与 RVDon 芯片一样,我们自研的所有模型——DiVoGenome、DiVoFold5、DiVoCell、DiVoSignal、RNALens、Investigate Lens——权重与代码全部开源。开源是我们的护城河,不是封闭。

  • 权重公开可复现
  • 训练代码开放
  • Apache 2.0 协议

芯片与模型协同开源

Chip-Model Co-Open

RVDon RISC-V GPGPU 硬件 RTL 开源,模型推理代码同步开源——从硅片到权重,整条加速链路透明可审计,社区可贡献优化。

  • RTL 开源 + ISA 公开
  • 推理代码同步发布
  • 社区可提交 PR

定制模型按需发布

Custom Model Delivery

面向 B 端客户定制的领域适配模型(如特定组织 mRNA 优化、特定癌种新抗原),按客户需求做源码级交付——客户拿到的是完整源码和权重,不是黑盒 API。

  • 源码级交付非 API
  • 客户完全持有定制版
  • 可自行部署与二次开发

模型主权原则

自研模型是 Gen²AI 的核心资产。我们不依赖第三方 API 的黑箱能力——每一个权重都在自有算力上训练,每一次推理都在可信环境内完成。模型主权意味着:能力可审计、行为可解释、资产可保护。

CROSS-LAYER

与其他层的关系

模型层是 Gen²AI 四层架构的承上启下——硬件在下面托着,Agent 在上面封装

L1 EnginesL2 Models

RVDon PF 扩展指令在硅片层面加速三角矩阵乘与 Flash Attention,模型训练与推理直接跑在自研加速器上。

查看 L1 引擎层
L2 ModelsL3 Agents

模型层能力被 Agent 层封装为可调用的工具——DiVoFold5、Investigate Lens 都作为 Agent 的后端能力。

查看 L3 Agent 层
L3 AgentsL4 Computing

Agent 编排的结果通过计算服务层交付给最终用户——从推理到报告,端到端在自有算力上完成。

查看 L4 计算服务
L1 EnginesL2 ModelsL3 AgentsL4 Computing

L1 引擎层提供 RVDon 加速硬件 → L2 模型层在其上训练与推理 → L3 Agent 层封装模型为可调用工具 → L4 计算服务层将结果交付给用户。模型层是能力的中枢——硬件为它加速,Agent 为它封装,计算为它分发。

USER SCENE

这些模型最终服务谁

B2B2C:每个模型通过干计算管线,最终落到这些 C 端用户场景

用自研模型构建你的能力

不再依赖第三方黑箱 API——从训练到部署,模型主权掌握在自己手里。