# 肿瘤新生抗原预测报告

**生成时间**: 2026-06-14 03:08  
**Pipeline版本**: DiVoNeoantigen v0.1.0 (演练版)  
**数据类型**: 已知肿瘤抗原肽段 + MHC-I结合预测

---

## 1. 概述

本报告基于肿瘤新生抗原预测Pipeline的演练结果，使用已知文献报道的肿瘤抗原肽段，
通过MHCflurry 2.2.1 (Tier-2交叉验证工具) 预测MHC-I结合亲和力，
并结合抗原来源、加工呈递评分等指标进行综合免疫原性评估。

### Pipeline步骤

| Step | 模块 | 工具 | 状态 |
|------|------|------|------|
| 1 | HLA分型 | OptiType | 待演练 |
| 2 | 体细胞变异检测 | Mutect2 | 待演练 |
| 3 | 变异注释 | VEP | 待演练 |
| 4 | MHC-I结合预测 | MHCflurry 2.2.1 (Tier-2) | **已完成** |
| 5 | pMHC结构预测 | Protenix-v2 (Tier-0) | JSON已生成，待AutoDL运行 |
| 6 | 免疫原性综合评分 | 自研评分系统 | **已完成** |
| 7 | 报告生成 | - | **已完成** |

### 工具分层策略

| Tier | 角色 | 工具 | 说明 |
|------|------|------|------|
| Tier-0 | 主力引擎 | Protenix-v2 | pMHC结构预测，核心差异化能力 |
| Tier-1 | 金标准 | NetMHCpan 4.2 | MHC结合预测金标准，待安装 |
| Tier-2 | 交叉验证 | MHCflurry 2.2.1 | 开源MHC结合预测，本次使用 |
| Tier-3 | 研究 | NeoGuider等 | 前沿研究工具 |

---

## 2. 预测参数

- **HLA等位基因**: HLA-A*02:01, HLA-A*02:06, HLA-B*07:02
- **MHC类别**: Class I
- **肽段长度**: 8-11 mer
- **结合阈值**: IC50 < 500 nM (高亲和力)
- **预测工具**: MHCflurry 2.2.1 (Class1PresentationPredictor)

---

## 3. 结果摘要

| 指标 | 数值 |
|------|------|
| 总预测数 | 45 |
| 高亲和力候选 (IC50<500) | 22 |
| Tier-1 (高置信度) | 17 |
| Tier-2 (中置信度) | 4 |
| Tier-3 (低置信度) | 7 |
| Tier-4 (待验证) | 17 |

---

## 4. Tier-1 高置信度候选新抗原

以下候选推荐优先进行实验验证：

| # | 肽段 | 抗原来源 | HLA等位基因 | IC50 (nM) | 综合评分 | 肿瘤类型 |
|---|------|---------|------------|-----------|---------|---------|
| 1 | KVAELVHFL | MAGE-A1 | HLA-A*02:01 | 14.4 | 100 | 多种肿瘤 |
| 2 | RMFPNAPYL | WT1 | HLA-A*02:01 | 14.3 | 100 | 白血病 |
| 3 | LLFGYPVYV | HTLV-1 Tax | HLA-A*02:01 | 10.1 | 100 | 成人T细胞白血病 |
| 4 | LLFGYPVYV | HTLV-1 Tax | HLA-A*02:06 | 10.3 | 100 | 成人T细胞白血病 |
| 5 | KVAELVHFL | MAGE-A1 | HLA-A*02:06 | 12.2 | 100 | 多种肿瘤 |
| 6 | RMFPNAPYL | WT1 | HLA-A*02:06 | 19.4 | 100 | 白血病 |
| 7 | IMDQVPFSV | NY-ESO-1 | HLA-A*02:06 | 16.8 | 93 | 多种肿瘤 |
| 8 | IMDQVPFSV | NY-ESO-1 | HLA-A*02:01 | 15.9 | 93 | 多种肿瘤 |
| 9 | FLWGPRALV | WT1 | HLA-A*02:06 | 14.9 | 93 | 白血病/实体瘤 |
| 10 | FLWGPRALV | WT1 | HLA-A*02:01 | 13.6 | 93 | 白血病/实体瘤 |
| 11 | YLEPGPVTA | MAGE-A3 | HLA-A*02:01 | 48.6 | 89 | 黑色素瘤/肺癌 |
| 12 | GILGFVFTL | Influenza M1 | HLA-A*02:06 | 18.8 | 89 | 病毒对照 |
| 13 | GILGFVFTL | Influenza M1 | HLA-A*02:01 | 20.0 | 89 | 病毒对照 |
| 14 | ELAGIGILTV | Melan-A/MART-1 | HLA-A*02:06 | 66.1 | 83 | 黑色素瘤 |
| 15 | ELAGIGILTV | Melan-A/MART-1 | HLA-A*02:01 | 83.6 | 83 | 黑色素瘤 |
| 16 | YLEPGPVTA | MAGE-A3 | HLA-A*02:06 | 64.8 | 79 | 黑色素瘤/肺癌 |
| 17 | ITDQVPFSV | NY-ESO-1变异体 | HLA-A*02:06 | 37.8 | 74 | 多种肿瘤 |


### Tier-1 候选详细说明

#### KVAELVHFL (MAGE-A1)

- **HLA限制性**: HLA-A*02:01
- **结合亲和力**: IC50 = 14.4 nM (极强结合)
- **综合评分**: 100/100
- **相关肿瘤**: 多种肿瘤
- **Protenix-v2结构预测**: 待运行 (JSON已生成)
- **实验验证建议**: 多聚体染色 + ELISPOT + T细胞杀伤实验

#### RMFPNAPYL (WT1)

- **HLA限制性**: HLA-A*02:01
- **结合亲和力**: IC50 = 14.3 nM (极强结合)
- **综合评分**: 100/100
- **相关肿瘤**: 白血病
- **Protenix-v2结构预测**: 待运行 (JSON已生成)
- **实验验证建议**: 多聚体染色 + ELISPOT + T细胞杀伤实验

#### LLFGYPVYV (HTLV-1 Tax)

- **HLA限制性**: HLA-A*02:01
- **结合亲和力**: IC50 = 10.1 nM (极强结合)
- **综合评分**: 100/100
- **相关肿瘤**: 成人T细胞白血病
- **Protenix-v2结构预测**: 待运行 (JSON已生成)
- **实验验证建议**: 多聚体染色 + ELISPOT + T细胞杀伤实验

#### LLFGYPVYV (HTLV-1 Tax)

- **HLA限制性**: HLA-A*02:06
- **结合亲和力**: IC50 = 10.3 nM (极强结合)
- **综合评分**: 100/100
- **相关肿瘤**: 成人T细胞白血病
- **Protenix-v2结构预测**: 待运行 (JSON已生成)
- **实验验证建议**: 多聚体染色 + ELISPOT + T细胞杀伤实验

#### KVAELVHFL (MAGE-A1)

- **HLA限制性**: HLA-A*02:06
- **结合亲和力**: IC50 = 12.2 nM (极强结合)
- **综合评分**: 100/100
- **相关肿瘤**: 多种肿瘤
- **Protenix-v2结构预测**: 待运行 (JSON已生成)
- **实验验证建议**: 多聚体染色 + ELISPOT + T细胞杀伤实验

---

## 5. Tier-2 中置信度候选

| # | 肽段 | 抗原来源 | HLA等位基因 | IC50 (nM) | 综合评分 |
|---|------|---------|------------|-----------|---------|
| 1 | MLAIGGLLV | MAGE-A2 | HLA-A*02:01 | 20.4 | 65 |
| 2 | MLAIGGLLV | MAGE-A2 | HLA-A*02:06 | 21.8 | 65 |
| 3 | ITDQVPFSV | NY-ESO-1变异体 | HLA-A*02:01 | 66.4 | 54 |
| 4 | RMFPNAPYL | WT1 | HLA-B*07:02 | 1276.7 | 50 |


---

## 6. 方法论

### 6.1 MHC-I结合预测

使用MHCflurry 2.2.1的Class1PresentationPredictor，该模型整合了：
- **结合亲和力预测**: 基于神经网络预测肽段-MHC结合IC50
- **抗原加工预测**: 预测蛋白酶体切割和TAP转运效率
- **呈递评分**: 综合结合和加工的联合概率

### 6.2 免疫原性综合评分

评分体系（满分100分）：

| 维度 | 权重 | 说明 |
|------|------|------|
| MHC结合亲和力 | 40% | IC50 < 50nM=40分, <150nM=30分, <500nM=15分 |
| 呈递评分 | 25% | presentation_score > 0.8=25分, >0.5=15分 |
| 抗原加工评分 | 15% | processing_score > 0.8=15分, >0.5=8分 |
| 已知免疫原性 | 20% | 文献报道的免疫原性表位=20分 |

### 6.3 Tier分级

| Tier | 评分范围 | 含义 | 后续行动 |
|------|---------|------|---------|
| Tier-1 | ≥70 | 高置信度 | 优先实验验证 |
| Tier-2 | 50-69 | 中置信度 | 补充Protenix-v2结构验证 |
| Tier-3 | 30-49 | 低置信度 | 需多工具交叉验证 |
| Tier-4 | <30 | 待验证 | 暂不推荐 |

---

## 7. 局限性

1. **本次演练使用已知抗原肽段**，非真实肿瘤测序数据，实际Pipeline需从VCF开始
2. **仅使用MHCflurry (Tier-2)**，未与NetMHCpan (Tier-1) 交叉验证
3. **Protenix-v2结构预测结果待补充**，pLDDT/ipSAE评分将显著提升Tier分级准确性
4. **HLA-B*07:02预测效果较差**，可能因MHCflurry对该等位基因训练数据不足
5. **未包含MHC-II类预测**，完整Pipeline需增加MHC-II (如pVACfuse)

---

## 8. 下一步计划

1. **上传Protenix-v2 JSON到AutoDL**，运行pMHC结构预测
2. **安装NetMHCpan 4.2**，进行Tier-1金标准交叉验证
3. **使用真实肿瘤WES数据**，从VCF开始完整Pipeline演练
4. **增加MHC-II类预测**，使用pVACfuse
5. **增加TCR识别预测**，使用ProTCR等工具

---

*报告由DiVoNeoantigen Pipeline自动生成*
*DiVo Gen²AI — 前沿 + 全能*
