自研微调

mRNA 序列优化

已验证

RNALens · Spearman 0.92 · CAI 0.7→0.95 · 自研微调模型

mRNA 疫苗序列设计不只是"把氨基酸翻译成碱基"。密码子使用频率影响翻译效率,UTR 结构影响稳定性和装载效率。DiVo Gen²AI 用自研 RNALens 微调模型预测核糖体装载效率——不是调用第三方 API,是 56 万行自研代码的一部分。本页面向三类读者:想了解 mRNA 优化的患者与公众、寻找序列优化合作方的疫苗/CAR-T 团队、评估技术实力的投资人与同行。

患者与公众

向下阅读「什么是 mRNA 序列优化」——了解为什么疫苗设计不只是翻译碱基。

合作方 / 医院

重点看「DiVo 的角色」「4 步管线」「验证指标」——自研微调不是套壳 API。

投资人 / 同行

关注「差异化优势」「验证指标」「术语速查」——评估自研微调模型的技术壁垒。

mRNA 序列优化是以下旗舰服务的关键步骤

什么是 mRNA 序列优化

mRNA 疫苗的核心是一段信使 RNA 序列——它被送入人体细胞后,指导细胞合成目标蛋白(如肿瘤抗原),触发免疫应答。但同一种氨基酸可以由多个不同的密码子编码,不同密码子的使用频率差异巨大。

mRNA 序列优化不是简单地把氨基酸序列翻译成碱基——而是在所有能编码同一蛋白的候选序列中,选出翻译效率最高、稳定性最好的那一条。密码子选择影响翻译速度(CAI),UTR 结构影响 mRNA 半衰期和核糖体装载(MRL),不同目标组织还有不同的密码子偏好。

DiVo 用自研 RNALens 微调模型预测核糖体装载效率(Spearman=0.92),不是调用第三方 API——微调数据、训练流程、推理服务全部自主部署。

为什么密码子选择重要

同一种氨基酸有 2-6 个密码子。人体细胞对某些密码子的翻译速度远高于其他——选对密码子,翻译效率可从 0.7 提升到 0.95(CAI 指数)。

为什么自研微调重要

通用预训练模型对 mRNA 序列的预测精度有限。三阶段微调让 RNALens 专门适配 mRNA MRL 任务——Spearman=0.92 不是通用模型的零样本表现,是域适配后的专精结果。

DiVo Gen²AI 的角色

mRNA 序列优化是 DiVo 新生抗原 8 步管线的Step 7,也是 CAR-T 5 步管线中 CAR 构建体 mRNA 优化的核心能力。我们提供从密码子优化到核糖体装载预测到 UTR 优化的全链路——不是只做 CAI 优化就交结果,而是同时优化编码区和调控区,用自研模型预测功能验证。

我们不做 mRNA 递送系统设计(LNP 配方等),不做体内表达效率实验验证。我们交付的是经过计算优化的 mRNA 序列设计方案。

核心能力 · 4 步管线

从氨基酸序列到组织适配的最优 mRNA 序列

MO1

密码子优化 (CAI)

已验证

自研密码子优化算法

CAI 0.7 → 0.95 优化序列

MO2

核糖体装载效率预测

已验证

RNALens (DNABERT-Z 117M 微调)

MRL 预测 + Spearman=0.92

MO3

UTR 优化 + 稳定性评估

已验证

GEMORNA + ViennaRNA

5'/3' UTR 优化序列 + 二级结构评分

MO4

组织适配模型选择

已验证

HEK293T / Muscle / PC3

目标组织适配的最优序列

差异化优势

与"只做 CAI 优化"和"调用第三方 API"的核心区别

AI

自研微调,非调用第三方 API

RNALens 基于 DNABERT-Z 117M 参数三阶段微调。微调数据、训练流程、推理服务全部自主部署。不是套壳第三方模型 API,是 56 万行自研代码的一部分。

UTR

不只优化编码区,还优化调控区

多数 mRNA 优化服务只做 CDS 密码子优化。DiVo 用 GEMORNA 生成 UTR + ViennaRNA 评估稳定性,同时优化编码区和调控区——翻译效率和稳定性都要兼顾。

核心能力

CAI 密码子适应指数优化

已验证

从 0.7 提升到 0.95——密码子使用频率向宿主细胞偏好靠拢,翻译效率大幅提升。

MRL 核糖体装载效率预测

已验证

基于 DNABERT-Z 117M 参数三阶段微调的 RNALens 模型。Spearman=0.92, R²=0.87——预测 mRNA 序列在核糖体上的装载效率。

5'/3' UTR 优化

已验证

GEMORNA 生成 + ViennaRNA 稳定性评估。不只优化编码区,还优化调控区。

3 组织适配模型

已验证

HEK293T / Muscle / PC3 三种目标组织/细胞系的适配模型——不同组织偏好不同密码子。

为什么强调"自研微调"

不是调用第三方 API

RNALens 是基于 DNABERT-Z 117M 参数三阶段微调的自研模型。微调数据、训练流程、推理服务全部自主部署。

不是通用预训练权重

三阶段微调:(1) DNABERT-Z 117M 预训练 → (2) mRNA MRL 下游任务微调 → (3) DiVo 自研数据域适配微调。

有实战验证

门冬酰胺酶项目:6194 突变 × 11 版迭代。CAI 0.7→0.95。不是玩具项目。

验证指标

指标说明
MRL Spearman0.92核糖体装载效率预测相关性
0.87决定系数
CAI 优化后0.95从 0.7 提升
DNABERT-Z 参数117M三阶段微调
组织适配模型3 种HEK293T / Muscle / PC3
实战验证门冬酰胺酶 6194 突变11 版迭代
0.92
MRL Spearman
0.87
0.95
CAI 优化后
117M
DNABERT-Z 参数

诚实边界

能做的和不能做的,都写清楚

我们能做的

CAI 密码子适应指数优化(0.7 → 0.95)
MRL 核糖体装载效率预测(Spearman=0.92)
5'/3' UTR 序列优化 + 稳定性评估
3 组织适配模型(HEK293T / Muscle / PC3)
自研 RNALens 微调模型全链路

我们明确不做的

不做 mRNA 递送系统设计(LNP 配方等)
不做体内表达效率实验验证
不做 mRNA 稳定性体内测定
不做临床级 GMP 生产工艺优化
不直接面向患者提供 mRNA 治疗方案

术语速查

mRNA 序列优化领域最核心的 5 个术语

缩写全称中文通俗解释
CAICodon Adaptation Index密码子适应指数衡量密码子使用频率与宿主细胞偏好的匹配程度,越高翻译效率越好
MRLMean Ribosome Loading平均核糖体装载mRNA 上核糖体的平均数量,反映翻译起始效率
UTRUntranslated Region非翻译区mRNA 两端不编码蛋白的调控序列,5' UTR 影响翻译起始,3' UTR 影响稳定性
RNALensDiVo RNALensDiVo RNA 预测模型基于 DNABERT-Z 117M 三阶段微调的自研 mRNA 性质预测模型
GEMORNAGenerative mRNAmRNA 生成模型用于生成和优化 mRNA UTR 序列的生成式模型

CAPACITY TRACE

能力回溯

这项服务由哪些能力支撑——从硅片到你的场景

硅片(L1) → 模型(L2) → Agent(L3) → 管线(L4) → 你的场景