自研微调

mRNA 序列优化

✓ 已验证

RNALens · Spearman 0.92 · CAI 0.7→0.95 · 自研微调模型

mRNA 疫苗序列设计不只是"把氨基酸翻译成碱基"。密码子使用频率影响翻译效率，UTR 结构影响稳定性和装载效率。DiVo Gen²AI 用自研 RNALens 微调模型预测核糖体装载效率——不是调用第三方 API，是 56 万行自研代码的一部分。本页面向三类读者：想了解 mRNA 优化的患者与公众、寻找序列优化合作方的疫苗/CAR-T 团队、评估技术实力的投资人与同行。

患者与公众

向下阅读「什么是 mRNA 序列优化」——了解为什么疫苗设计不只是翻译碱基。

合作方 / 医院

重点看「DiVo 的角色」「4 步管线」「验证指标」——自研微调不是套壳 API。

投资人 / 同行

关注「差异化优势」「验证指标」「术语速查」——评估自研微调模型的技术壁垒。

mRNA 序列优化是以下旗舰服务的关键步骤

旗舰 · 新生抗原 mRNA 疫苗新增 · CAR-T 细胞治疗

什么是 mRNA 序列优化

mRNA 疫苗的核心是一段信使 RNA 序列——它被送入人体细胞后，指导细胞合成目标蛋白（如肿瘤抗原），触发免疫应答。但同一种氨基酸可以由多个不同的密码子编码，不同密码子的使用频率差异巨大。

mRNA 序列优化不是简单地把氨基酸序列翻译成碱基——而是在所有能编码同一蛋白的候选序列中，选出翻译效率最高、稳定性最好的那一条。密码子选择影响翻译速度（CAI），UTR 结构影响 mRNA 半衰期和核糖体装载（MRL），不同目标组织还有不同的密码子偏好。

DiVo 用自研 RNALens 微调模型预测核糖体装载效率（Spearman=0.92），不是调用第三方 API——微调数据、训练流程、推理服务全部自主部署。

为什么密码子选择重要

同一种氨基酸有 2-6 个密码子。人体细胞对某些密码子的翻译速度远高于其他——选对密码子，翻译效率可从 0.7 提升到 0.95（CAI 指数）。

为什么自研微调重要

通用预训练模型对 mRNA 序列的预测精度有限。三阶段微调让 RNALens 专门适配 mRNA MRL 任务——Spearman=0.92 不是通用模型的零样本表现，是域适配后的专精结果。

DiVo Gen²AI 的角色

mRNA 序列优化是 DiVo 新生抗原 8 步管线的Step 7，也是 CAR-T 5 步管线中 CAR 构建体 mRNA 优化的核心能力。我们提供从密码子优化到核糖体装载预测到 UTR 优化的全链路——不是只做 CAI 优化就交结果，而是同时优化编码区和调控区，用自研模型预测功能验证。

我们不做 mRNA 递送系统设计（LNP 配方等），不做体内表达效率实验验证。我们交付的是经过计算优化的 mRNA 序列设计方案。

核心能力 · 4 步管线

从氨基酸序列到组织适配的最优 mRNA 序列

MO1

密码子优化 (CAI)

✓ 已验证

自研密码子优化算法

CAI 0.7 → 0.95 优化序列

MO2

核糖体装载效率预测

✓ 已验证

RNALens (DNABERT-Z 117M 微调)

MRL 预测 + Spearman=0.92

MO3

UTR 优化 + 稳定性评估

✓ 已验证

GEMORNA + ViennaRNA

5'/3' UTR 优化序列 + 二级结构评分

MO4

组织适配模型选择

✓ 已验证

HEK293T / Muscle / PC3

目标组织适配的最优序列

差异化优势

与"只做 CAI 优化"和"调用第三方 API"的核心区别

自研微调，非调用第三方 API

RNALens 基于 DNABERT-Z 117M 参数三阶段微调。微调数据、训练流程、推理服务全部自主部署。不是套壳第三方模型 API，是 56 万行自研代码的一部分。

UTR

不只优化编码区，还优化调控区

多数 mRNA 优化服务只做 CDS 密码子优化。DiVo 用 GEMORNA 生成 UTR + ViennaRNA 评估稳定性，同时优化编码区和调控区——翻译效率和稳定性都要兼顾。

核心能力

CAI 密码子适应指数优化

✓ 已验证

从 0.7 提升到 0.95——密码子使用频率向宿主细胞偏好靠拢，翻译效率大幅提升。

MRL 核糖体装载效率预测

✓ 已验证

基于 DNABERT-Z 117M 参数三阶段微调的 RNALens 模型。Spearman=0.92, R²=0.87——预测 mRNA 序列在核糖体上的装载效率。

5'/3' UTR 优化

✓ 已验证

GEMORNA 生成 + ViennaRNA 稳定性评估。不只优化编码区，还优化调控区。

3 组织适配模型

✓ 已验证

HEK293T / Muscle / PC3 三种目标组织/细胞系的适配模型——不同组织偏好不同密码子。

为什么强调"自研微调"

→

不是调用第三方 API

RNALens 是基于 DNABERT-Z 117M 参数三阶段微调的自研模型。微调数据、训练流程、推理服务全部自主部署。

→

不是通用预训练权重

三阶段微调：(1) DNABERT-Z 117M 预训练 → (2) mRNA MRL 下游任务微调 → (3) DiVo 自研数据域适配微调。

→

有实战验证

门冬酰胺酶项目：6194 突变 × 11 版迭代。CAI 0.7→0.95。不是玩具项目。

验证指标

指标	值	说明
MRL Spearman	0.92	核糖体装载效率预测相关性
R²	0.87	决定系数
CAI 优化后	0.95	从 0.7 提升
DNABERT-Z 参数	117M	三阶段微调
组织适配模型	3 种	HEK293T / Muscle / PC3
实战验证	门冬酰胺酶 6194 突变	11 版迭代

0.92

MRL Spearman

0.87

R²

0.95

CAI 优化后

117M

DNABERT-Z 参数

诚实边界

能做的和不能做的，都写清楚

我们能做的

✓CAI 密码子适应指数优化（0.7 → 0.95）

✓MRL 核糖体装载效率预测（Spearman=0.92）

✓5'/3' UTR 序列优化 + 稳定性评估

✓3 组织适配模型（HEK293T / Muscle / PC3）

✓自研 RNALens 微调模型全链路

我们明确不做的

✗不做 mRNA 递送系统设计（LNP 配方等）

✗不做体内表达效率实验验证

✗不做 mRNA 稳定性体内测定

✗不做临床级 GMP 生产工艺优化

✗不直接面向患者提供 mRNA 治疗方案

术语速查

mRNA 序列优化领域最核心的 5 个术语

缩写	全称	中文	通俗解释
CAI	Codon Adaptation Index	密码子适应指数	衡量密码子使用频率与宿主细胞偏好的匹配程度，越高翻译效率越好
MRL	Mean Ribosome Loading	平均核糖体装载	mRNA 上核糖体的平均数量，反映翻译起始效率
UTR	Untranslated Region	非翻译区	mRNA 两端不编码蛋白的调控序列，5' UTR 影响翻译起始，3' UTR 影响稳定性
RNALens	DiVo RNALens	DiVo RNA 预测模型	基于 DNABERT-Z 117M 三阶段微调的自研 mRNA 性质预测模型
GEMORNA	Generative mRNA	mRNA 生成模型	用于生成和优化 mRNA UTR 序列的生成式模型

CAPACITY TRACE

能力回溯

这项服务由哪些能力支撑——从硅片到你的场景

L2 · 模型

RNALens

mRNA MRL 预测，DNABERT-Z 117M 三阶段微调

L3 · Agent

mRNA 设计 Agent

从抗原序列到完整 mRNA 设计

L4 · 管线

mrna-design

mRNA 疫苗/药物设计管线

硅片(L1) → 模型(L2) → Agent(L3) → 管线(L4) → 你的场景

旗舰 · 新生抗原管线新增 · CAR-T 治疗 Step 1 · HLA 分型 Step 5 · pMHC 结构四维一体总览