L2 · 模型层

Model Training · Fine-tuning · Deployment

模型训练与微调及部署

自研模型核心 · 蒸馏 · 微调 · 防逆向——不是调用第三方 API，是自主训练、自主部署、自主保护。

自研训练+蒸馏微调+防逆向部署=自主模型主权

咨询合作计算服务

SELF-DEVELOPED MODELS

自研模型矩阵

六个核心模型——覆盖基因组、蛋白质、细胞、通路、RNA、知识检索

DiVoGenome

pLDDT 92+

Genome Triple-Model Cross-Interpretation

基因组三模型交叉解读——融合变异预测、功能注释、表型关联三路模型，单核苷酸分辨率输出可解释结论。

DiVoFold5

pLDDT 95.4

Protein Structure Prediction

蛋白质结构预测模型——在 AlphaFold3 / Protenix 架构上自研蒸馏，pLDDT 95.4，推理吞吐提升 3.2x。

DiVoCell

10k+ cells

Multi-cell 3D Simulation

多细胞 3D 模拟模型——从单细胞力学到组织级涌现行为，支持万级细胞实时耦合求解。

DiVoSignal

Graph NN

Signaling Pathway Solver

信号通路求解模型——将通路图编码为图神经网络，预测扰动下的级联响应与药物靶点。

RNALens

Fine-tuned

mRNA Structure Fine-tuning

mRNA 结构微调模型——在 RNA-FM 基座上做二级结构预测微调，用于 mRNA 疫苗序列优化。

Investigate Lens

RAG Core

Knowledge Base Retrieval Engine

知识库检索引擎——多模态文献嵌入 + 混合检索 + 引用级溯源，为 Agent 层提供事实底座。

TRAINING PIPELINE

训练流水线

六步递进——从原始数据到加密部署，全链路自主可控

数据准备

Data Preparation

多源数据清洗、标注、去重——基因序列、蛋白结构、文献语料统一进入训练数据湖。

预训练

Pre-training

在大规模无标注语料上做基座预训练——学习序列、结构、功能的通用表征。

微调

Fine-tuning

领域指令微调 + RLHF——把通用基座对齐到基因组、蛋白、细胞等垂直任务。

蒸馏

Distillation

教师-学生蒸馏——把大模型的能力压缩到可部署尺寸，损失可控、吞吐倍增。

量化

Quantization

INT8 / FP8 量化 + 稀疏化——在不掉点的前提下把显存占用压到 1/4。

部署

Deployment

加密推理容器部署到 RVDon 加速集群——模型不离开可信环境，推理即服务。

数据→预训练→微调→蒸馏→量化→部署

OPEN SOURCE

模型开源策略

与芯片一样，自研模型全部开源——开源是我们的护城河，不是封闭

自研模型全开源

Fully Open Source

与 RVDon 芯片一样，我们自研的所有模型——DiVoGenome、DiVoFold5、DiVoCell、DiVoSignal、RNALens、Investigate Lens——权重与代码全部开源。开源是我们的护城河，不是封闭。

权重公开可复现
训练代码开放
Apache 2.0 协议

芯片与模型协同开源

Chip-Model Co-Open

RVDon RISC-V GPGPU 硬件 RTL 开源，模型推理代码同步开源——从硅片到权重，整条加速链路透明可审计，社区可贡献优化。

RTL 开源 + ISA 公开
推理代码同步发布
社区可提交 PR

定制模型按需发布

Custom Model Delivery

面向 B 端客户定制的领域适配模型（如特定组织 mRNA 优化、特定癌种新抗原），按客户需求做源码级交付——客户拿到的是完整源码和权重，不是黑盒 API。

源码级交付非 API
客户完全持有定制版
可自行部署与二次开发

模型主权原则

自研模型是 Gen²AI 的核心资产。我们不依赖第三方 API 的黑箱能力——每一个权重都在自有算力上训练，每一次推理都在可信环境内完成。模型主权意味着：能力可审计、行为可解释、资产可保护。

CROSS-LAYER

与其他层的关系

模型层是 Gen²AI 四层架构的承上启下——硬件在下面托着，Agent 在上面封装

L1 Engines→L2 Models

RVDon PF 扩展指令在硅片层面加速三角矩阵乘与 Flash Attention，模型训练与推理直接跑在自研加速器上。

查看 L1 引擎层

L2 Models→L3 Agents

模型层能力被 Agent 层封装为可调用的工具——DiVoFold5、Investigate Lens 都作为 Agent 的后端能力。

查看 L3 Agent 层

L3 Agents→L4 Computing

Agent 编排的结果通过计算服务层交付给最终用户——从推理到报告，端到端在自有算力上完成。

查看 L4 计算服务

L1 Engines→L2 Models→L3 Agents→L4 Computing

L1 引擎层提供 RVDon 加速硬件 → L2 模型层在其上训练与推理 → L3 Agent 层封装模型为可调用工具 → L4 计算服务层将结果交付给用户。模型层是能力的中枢——硬件为它加速，Agent 为它封装，计算为它分发。

USER SCENE

这些模型最终服务谁

B2B2C：每个模型通过干计算管线，最终落到这些 C 端用户场景

DiVoGenome→ 服务场景

基因组解读报告 HLA 分型 L1 源代码 mysourcecode L5 跨代视角 mylineage 数字血脉 digital-bloodline

DiVoFold5→ 服务场景

pMHC 结构预测 CAR-T 细胞治疗新生抗原 mRNA 疫苗 L2 分子自画像 myportrait

DiVoCell→ 服务场景

L3 虚拟细胞 mycellverse

DiVoSignal→ 服务场景

肠脑轴 gut-brain L4 时间维度 mytimecurve L3 虚拟细胞 mycellverse

RNALens→ 服务场景

mRNA 序列优化新生抗原 mRNA 疫苗

Investigate Lens→ 服务场景

基因组解读报告数字心灵 digital-mind

用自研模型构建你的能力

不再依赖第三方黑箱 API——从训练到部署，模型主权掌握在自己手里。

咨询合作查看计算服务查看底层引擎