mRNA 序列优化
✓ 已验证RNALens · Spearman 0.92 · CAI 0.7→0.95 · 自研微调模型
mRNA 疫苗序列设计不只是"把氨基酸翻译成碱基"。密码子使用频率影响翻译效率,UTR 结构影响稳定性和装载效率。DiVo Gen²AI 用自研 RNALens 微调模型预测核糖体装载效率——不是调用第三方 API,是 56 万行自研代码的一部分。本页面向三类读者:想了解 mRNA 优化的患者与公众、寻找序列优化合作方的疫苗/CAR-T 团队、评估技术实力的投资人与同行。
向下阅读「什么是 mRNA 序列优化」——了解为什么疫苗设计不只是翻译碱基。
重点看「DiVo 的角色」「4 步管线」「验证指标」——自研微调不是套壳 API。
关注「差异化优势」「验证指标」「术语速查」——评估自研微调模型的技术壁垒。
mRNA 序列优化是以下旗舰服务的关键步骤
什么是 mRNA 序列优化
mRNA 疫苗的核心是一段信使 RNA 序列——它被送入人体细胞后,指导细胞合成目标蛋白(如肿瘤抗原),触发免疫应答。但同一种氨基酸可以由多个不同的密码子编码,不同密码子的使用频率差异巨大。
mRNA 序列优化不是简单地把氨基酸序列翻译成碱基——而是在所有能编码同一蛋白的候选序列中,选出翻译效率最高、稳定性最好的那一条。密码子选择影响翻译速度(CAI),UTR 结构影响 mRNA 半衰期和核糖体装载(MRL),不同目标组织还有不同的密码子偏好。
DiVo 用自研 RNALens 微调模型预测核糖体装载效率(Spearman=0.92),不是调用第三方 API——微调数据、训练流程、推理服务全部自主部署。
同一种氨基酸有 2-6 个密码子。人体细胞对某些密码子的翻译速度远高于其他——选对密码子,翻译效率可从 0.7 提升到 0.95(CAI 指数)。
通用预训练模型对 mRNA 序列的预测精度有限。三阶段微调让 RNALens 专门适配 mRNA MRL 任务——Spearman=0.92 不是通用模型的零样本表现,是域适配后的专精结果。
DiVo Gen²AI 的角色
mRNA 序列优化是 DiVo 新生抗原 8 步管线的Step 7,也是 CAR-T 5 步管线中 CAR 构建体 mRNA 优化的核心能力。我们提供从密码子优化到核糖体装载预测到 UTR 优化的全链路——不是只做 CAI 优化就交结果,而是同时优化编码区和调控区,用自研模型预测功能验证。
我们不做 mRNA 递送系统设计(LNP 配方等),不做体内表达效率实验验证。我们交付的是经过计算优化的 mRNA 序列设计方案。
核心能力 · 4 步管线
从氨基酸序列到组织适配的最优 mRNA 序列
密码子优化 (CAI)
✓ 已验证自研密码子优化算法
CAI 0.7 → 0.95 优化序列
核糖体装载效率预测
✓ 已验证RNALens (DNABERT-Z 117M 微调)
MRL 预测 + Spearman=0.92
UTR 优化 + 稳定性评估
✓ 已验证GEMORNA + ViennaRNA
5'/3' UTR 优化序列 + 二级结构评分
组织适配模型选择
✓ 已验证HEK293T / Muscle / PC3
目标组织适配的最优序列
差异化优势
与"只做 CAI 优化"和"调用第三方 API"的核心区别
自研微调,非调用第三方 API
RNALens 基于 DNABERT-Z 117M 参数三阶段微调。微调数据、训练流程、推理服务全部自主部署。不是套壳第三方模型 API,是 56 万行自研代码的一部分。
不只优化编码区,还优化调控区
多数 mRNA 优化服务只做 CDS 密码子优化。DiVo 用 GEMORNA 生成 UTR + ViennaRNA 评估稳定性,同时优化编码区和调控区——翻译效率和稳定性都要兼顾。
核心能力
CAI 密码子适应指数优化
✓ 已验证从 0.7 提升到 0.95——密码子使用频率向宿主细胞偏好靠拢,翻译效率大幅提升。
MRL 核糖体装载效率预测
✓ 已验证基于 DNABERT-Z 117M 参数三阶段微调的 RNALens 模型。Spearman=0.92, R²=0.87——预测 mRNA 序列在核糖体上的装载效率。
5'/3' UTR 优化
✓ 已验证GEMORNA 生成 + ViennaRNA 稳定性评估。不只优化编码区,还优化调控区。
3 组织适配模型
✓ 已验证HEK293T / Muscle / PC3 三种目标组织/细胞系的适配模型——不同组织偏好不同密码子。
为什么强调"自研微调"
不是调用第三方 API
RNALens 是基于 DNABERT-Z 117M 参数三阶段微调的自研模型。微调数据、训练流程、推理服务全部自主部署。
不是通用预训练权重
三阶段微调:(1) DNABERT-Z 117M 预训练 → (2) mRNA MRL 下游任务微调 → (3) DiVo 自研数据域适配微调。
有实战验证
门冬酰胺酶项目:6194 突变 × 11 版迭代。CAI 0.7→0.95。不是玩具项目。
验证指标
| 指标 | 值 | 说明 |
|---|---|---|
| MRL Spearman | 0.92 | 核糖体装载效率预测相关性 |
| R² | 0.87 | 决定系数 |
| CAI 优化后 | 0.95 | 从 0.7 提升 |
| DNABERT-Z 参数 | 117M | 三阶段微调 |
| 组织适配模型 | 3 种 | HEK293T / Muscle / PC3 |
| 实战验证 | 门冬酰胺酶 6194 突变 | 11 版迭代 |
诚实边界
能做的和不能做的,都写清楚
我们能做的
我们明确不做的
术语速查
mRNA 序列优化领域最核心的 5 个术语
| 缩写 | 全称 | 中文 | 通俗解释 |
|---|---|---|---|
| CAI | Codon Adaptation Index | 密码子适应指数 | 衡量密码子使用频率与宿主细胞偏好的匹配程度,越高翻译效率越好 |
| MRL | Mean Ribosome Loading | 平均核糖体装载 | mRNA 上核糖体的平均数量,反映翻译起始效率 |
| UTR | Untranslated Region | 非翻译区 | mRNA 两端不编码蛋白的调控序列,5' UTR 影响翻译起始,3' UTR 影响稳定性 |
| RNALens | DiVo RNALens | DiVo RNA 预测模型 | 基于 DNABERT-Z 117M 三阶段微调的自研 mRNA 性质预测模型 |
| GEMORNA | Generative mRNA | mRNA 生成模型 | 用于生成和优化 mRNA UTR 序列的生成式模型 |
CAPACITY TRACE
能力回溯
这项服务由哪些能力支撑——从硅片到你的场景
硅片(L1) → 模型(L2) → Agent(L3) → 管线(L4) → 你的场景