SELF-DEVELOPED MODELS
自研模型矩阵
六个核心模型——覆盖基因组、蛋白质、细胞、通路、RNA、知识检索
DiVoGenome
pLDDT 92+Genome Triple-Model Cross-Interpretation
基因组三模型交叉解读——融合变异预测、功能注释、表型关联三路模型,单核苷酸分辨率输出可解释结论。
DiVoFold5
pLDDT 95.4Protein Structure Prediction
蛋白质结构预测模型——在 AlphaFold3 / Protenix 架构上自研蒸馏,pLDDT 95.4,推理吞吐提升 3.2x。
DiVoCell
10k+ cellsMulti-cell 3D Simulation
多细胞 3D 模拟模型——从单细胞力学到组织级涌现行为,支持万级细胞实时耦合求解。
DiVoSignal
Graph NNSignaling Pathway Solver
信号通路求解模型——将通路图编码为图神经网络,预测扰动下的级联响应与药物靶点。
RNALens
Fine-tunedmRNA Structure Fine-tuning
mRNA 结构微调模型——在 RNA-FM 基座上做二级结构预测微调,用于 mRNA 疫苗序列优化。
Investigate Lens
RAG CoreKnowledge Base Retrieval Engine
知识库检索引擎——多模态文献嵌入 + 混合检索 + 引用级溯源,为 Agent 层提供事实底座。
TRAINING PIPELINE
训练流水线
六步递进——从原始数据到加密部署,全链路自主可控
数据准备
Data Preparation多源数据清洗、标注、去重——基因序列、蛋白结构、文献语料统一进入训练数据湖。
预训练
Pre-training在大规模无标注语料上做基座预训练——学习序列、结构、功能的通用表征。
微调
Fine-tuning领域指令微调 + RLHF——把通用基座对齐到基因组、蛋白、细胞等垂直任务。
蒸馏
Distillation教师-学生蒸馏——把大模型的能力压缩到可部署尺寸,损失可控、吞吐倍增。
量化
QuantizationINT8 / FP8 量化 + 稀疏化——在不掉点的前提下把显存占用压到 1/4。
部署
Deployment加密推理容器部署到 RVDon 加速集群——模型不离开可信环境,推理即服务。
OPEN SOURCE
模型开源策略
与芯片一样,自研模型全部开源——开源是我们的护城河,不是封闭
自研模型全开源
Fully Open Source
与 RVDon 芯片一样,我们自研的所有模型——DiVoGenome、DiVoFold5、DiVoCell、DiVoSignal、RNALens、Investigate Lens——权重与代码全部开源。开源是我们的护城河,不是封闭。
- 权重公开可复现
- 训练代码开放
- Apache 2.0 协议
芯片与模型协同开源
Chip-Model Co-Open
RVDon RISC-V GPGPU 硬件 RTL 开源,模型推理代码同步开源——从硅片到权重,整条加速链路透明可审计,社区可贡献优化。
- RTL 开源 + ISA 公开
- 推理代码同步发布
- 社区可提交 PR
定制模型按需发布
Custom Model Delivery
面向 B 端客户定制的领域适配模型(如特定组织 mRNA 优化、特定癌种新抗原),按客户需求做源码级交付——客户拿到的是完整源码和权重,不是黑盒 API。
- 源码级交付非 API
- 客户完全持有定制版
- 可自行部署与二次开发
模型主权原则
自研模型是 Gen²AI 的核心资产。我们不依赖第三方 API 的黑箱能力——每一个权重都在自有算力上训练,每一次推理都在可信环境内完成。模型主权意味着:能力可审计、行为可解释、资产可保护。
CROSS-LAYER
与其他层的关系
模型层是 Gen²AI 四层架构的承上启下——硬件在下面托着,Agent 在上面封装
模型层能力被 Agent 层封装为可调用的工具——DiVoFold5、Investigate Lens 都作为 Agent 的后端能力。
查看 L3 Agent 层L1 引擎层提供 RVDon 加速硬件 → L2 模型层在其上训练与推理 → L3 Agent 层封装模型为可调用工具 → L4 计算服务层将结果交付给用户。模型层是能力的中枢——硬件为它加速,Agent 为它封装,计算为它分发。
USER SCENE
这些模型最终服务谁
B2B2C:每个模型通过干计算管线,最终落到这些 C 端用户场景