2026-06-03|AI 医疗mRNA 疫苗蛋白质工程

给狗子治疗癌症？有了 ChatGPT 就真的谁都可以？

一个程序员用 ChatGPT + AlphaFold + Grok 给自家患癌的狗设计定制 mRNA 疫苗，肿瘤缩小约 75%。他走过的每一步，我们都有现成的计算管线——而且每一步，他的流程都有明显的不足。

Paul Conyngham 和他的狗 Rosie — Paul Conyngham 和 Rosie —— 一个程序员，一只混血狗，一支定制 mRNA 疫苗

一只名叫 Rosie 的混血狗，后腿长了个网球大小的肿瘤，兽医说：准备后事吧。

它的主人 Paul Conyngham，一个搞了 17 年机器学习的程序员，没认命。

他打开 ChatGPT 做头脑风暴，用 AlphaFold 预测突变蛋白结构，用 Grok 设计最终疫苗构型，从基因测序到 mRNA 疫苗设计，硬是给自家狗子造出了一支定制疫苗。联合免疫检查点抑制剂注射后，肿瘤缩小约 75%——Rosie 又能追兔子了。

这个故事刷爆了科技圈，OpenAI 总裁 Greg Brockman 和 DeepMind CEO 都转发了。

但你知道吗？Paul 走过的每一步，我们都有现成的计算管线——而且每一步，他的流程都有明显的不足。

第一步：基因测序与变异分析

肿瘤精准防控

Paul 花了 3000 美元做基因测序，把 Rosie 的健康 DNA 和肿瘤 DNA 做对比，找突变位点。UNSW Ramaciotti 基因组学中心返回了约 300GB 的原始测序数据——150 亿个碱基对的拼图。Paul 用 ChatGPT 辅助导航、Gemini 做数据分析的"重活"、自己的 ML 算法过滤突变，从中筛选出了 7 个强信号的新抗原。

Paul 流程的不足

AI 辅助 ≠ 生信分析。 Paul 用 ChatGPT 辅助导航、Gemini 做数据"重活"、自己的 ML 算法过滤突变——这比"手动解读"进了一步，但仍然没有经过标准的生信流程（BWA 比对 → GATK call 变异 → VEP 注释）。AI 能帮你理解概念和加速探索，但不能替代经过验证的分析管线，漏检和假阳性无法评估。
没有变异致病性评估。 找到突变 ≠ 知道哪个突变致癌。VUS（意义未明变异）在传统流程中只能标注"不确定"，Paul 没有能力判断哪些变异真正驱动了肿瘤。
不可复现。 ChatGPT 的输出每次不同，没有版本控制、没有 pipeline 记录，科学上不可复现。

我们的方案

肿瘤精准防控管线（S4b）——从遗传风险到变异解读，全闭环。VUS 三模型交叉评分，传统只能标注"意义未明"，我们能给出致病性判断。标准生信流程 + 自动化变异注释 + 致病性评分，每一步可追溯、可复现。

第二步：蛋白质结构预测

蛋白质工程干实验设计

Paul 用 AlphaFold 预测突变 c-KIT 蛋白的 3D 结构，试图从中找到靶点。

Paul 流程的不足

AlphaFold 预测置信度极低。 Paul 用 AlphaFold 预测突变 c-KIT 蛋白结构，但置信度评分（pLDDT）仅为 54.55——这意味着预测结果基本不可信（pLDDT < 70 通常被视为低置信度，< 50 被视为不可靠）。结构生物学家 Kate Michie 博士也指出"AlphaFold 也会犯错，需要实验室验证"。用一个低置信度的结构来选择疫苗靶点，风险极高。
结构预测 ≠ 靶点发现。 AlphaFold 预测的是蛋白质三维结构，但肿瘤疫苗的"靶点"是能被 MHC 呈递、被 T 细胞识别的突变肽段——这是分子识别与结合亲和力的问题，需要 MHC-肽段结合预测工具（如 NetMHCpan），不是结构预测工具。Paul 用错了工具。
没有功能验证。 预测了结构 ≠ 理解了功能。突变蛋白的活性变化、稳定性改变、结合口袋的构象变化——这些需要多模型交叉判断，Paul 的流程完全缺失。
靶点选择缺乏系统性。 Paul 最终用 Grok 设计疫苗构型、靠 AI 建议"锁定靶点"，没有经过系统的靶点可药性评估（druggability assessment），选错靶点的风险很高。

我们的方案

蛋白质工程干实验设计管线（S1）——从序列到突变体 7 步全流程，四模型酶活性交叉验证。Paul 的 AlphaFold 预测 c-KIT 置信度仅 54.55——单模型低置信度预测不可信，四个模型一致判断才可信。靶点可药性评估是流程内置环节，不是拍脑袋。

第三步：mRNA 疫苗设计

mRNA 疫苗 / 药物设计

Paul 把 AI 跑出来的参数浓缩成半页纸，交给 UNSW RNA 研究所的 Pall Thordarson 教授团队合成纳米颗粒。同时，Paul 还获取了一种免疫检查点抑制剂——另一种诺贝尔奖级别的免疫疗法。他的策略是：检查点抑制剂"松开"免疫系统的刹车，mRNA 疫苗"告诉"免疫系统该攻击谁。2025 年 12 月首次注射，2026 年 2 月加强针，肿瘤缩小约 75%。但 Paul 自己明确说：这不是治愈，Rosie 仍然有癌症，疾病仍然是不可治愈的。

Paul 流程的不足

联合用药，无法归因。 Rosie 同时接受了 mRNA 疫苗和免疫检查点抑制剂，Thordarson 教授自己也承认"很难区分哪种治疗起了最大作用"。媒体标题只提"AI 疫苗"，却忽略了检查点抑制剂——而后者本身就是一种已验证的抗癌疗法。
半页纸配方，没有 UTR 优化。 mRNA 疫苗的表达效率极大程度上取决于 5'UTR 和 3'UTR 的设计。Paul 的"配方"只有 CDS（编码区），UTR 大概率用了通用模板，没有针对犬类密码子偏好性优化，没有针对抗原表达需求选择不同强度的 UTR 规格。这意味着疫苗表达的蛋白量可能远低于最优值。
没有免疫原性预评估。 设计阶段不知道这个 mRNA 会不会触发足够的免疫反应，也不知道会不会触发不必要的先天免疫反应（导致 mRNA 被降解）。Paul 只能"打了再看"，这是试错，不是工程。
没有新抗原预测。 肿瘤疫苗的核心是找到肿瘤特异的新抗原（neoantigen）。Paul 靠 AI 辅助筛选出 7 个"强信号"，但没有经过 DLA（犬类 MHC）结合亲和力预测、T 细胞表位预测等标准新抗原筛选流程，选中的抗原是否真能激活 T 细胞，缺乏验证。

我们的方案

mRNA 疫苗/药物设计管线（S3）——CDS + 5'UTR + 3'UTR 全覆盖，GEMORNA 三模块设计，三规格 UTR 适配不同表达需求。设计阶段即评估免疫原性。新抗原预测与肿瘤精准防控管线（S4b）联动，从变异解读到抗原筛选到 mRNA 设计，一条线打通。

剥开迷雾：肿瘤新生抗原疫苗到底该怎么做？

Paul 的故事被媒体包装成了"AI 治癌"的神话。但如果你真正了解肿瘤新生抗原（neoantigen）疫苗的设计流程，就会发现——Paul 的流程几乎每一步都偏离了专业路径。

真正的肿瘤新生抗原疫苗流程

肿瘤组织 + 正常组织配对测序

WES（全外显子组）+ RNA-seq。不是"抽血 vs 肿瘤"那么简单——需要正常组织（如外周血白细胞）作为胚系变异的对照，才能准确识别体细胞突变。Paul 做了这一步，但后续分析走偏了。

体细胞突变检出与注释

Mutect2 / Strelka2 call 变异 → VEP / ANNOVAR 注释 → 筛选非同义突变、移码突变、剪接位点突变。Paul 用 ChatGPT "处理数据"，跳过了整个标准流程。

HLA/DLA 分型

这是 Paul 完全跳过的一步。犬类需要 DLA（Dog Leukocyte Antigen）分型，确定 MHC I 类和 II 类等位基因。没有这个信息，你根本不知道突变肽段会被哪个 MHC 分子呈递。没有 HLA 分型，新抗原预测就是空中楼阁。

新抗原预测（核心步骤）

将突变肽段（通常 8-11mer for MHC I, 15-20mer for MHC II）与患者的 HLA/DLA 型做结合亲和力预测。工具：NetMHCpan、MHCflurry 等。筛选标准：IC50 < 500nM（弱结合），< 50nM（强结合）。Paul 用 AlphaFold 做结构预测来"找靶点"，这是用错了工具——AlphaFold 预测的是蛋白质三维结构，不是肽段-MHC 结合亲和力。

免疫原性评估与抗原筛选

结合亲和力高 ≠ 一定能激活 T 细胞。还需要评估：RNA 表达水平（RNA-seq 证实突变确实表达）、T 细胞表位预测、自身免疫风险排除（排除与正常蛋白高度相似的肽段）。Paul 的流程完全没有这一步。

mRNA 疫苗设计

选定新抗原序列后，才进入 mRNA 设计：CDS 密码子优化 → 5'UTR / 3'UTR 选择 → 免疫原性调控 → 稳定性优化。Paul 的"半页纸配方"大概率只有 CDS，UTR 和免疫原性调控全靠 UNSW 的 RNA 专家补全。

Paul 的流程 vs 专业流程

步骤	Paul 的做法	专业做法
变异检出	ChatGPT + Gemini + 自定义 ML 过滤 300GB 数据	Mutect2 / Strelka2 + VEP 标准流程
HLA/DLA 分型	跳过	OptiType / HLA-HD 等工具分型
新抗原预测	AlphaFold 预测 c-KIT 结构（pLDDT 仅 54.55）	NetMHCpan / MHCflurry 预测肽段-MHC 结合亲和力
免疫原性评估	跳过	RNA 表达验证 + T 细胞表位预测 + 自身免疫排除
mRNA 设计	Grok 设计构型，半页纸配方（仅 CDS）	CDS 优化 + UTR 选择 + 免疫原性调控 + 稳定性优化
效果验证	N=1，联合检查点抑制剂，无法归因；Paul 自己说不是治愈	临床试验，对照组，统计显著性

关键问题：AlphaFold 能用来"找靶点"吗？

不能。 AlphaFold 预测的是蛋白质的静态三维结构。但肿瘤新抗原疫苗的"靶点"不是蛋白质结构——而是一个突变肽段能否被 MHC 分子结合并呈递到细胞表面、进而被 T 细胞识别。这完全是一个分子识别与结合亲和力的问题，需要的是 MHC-肽段结合预测工具（如 NetMHCpan），不是结构预测工具。

更进一步，AlphaFold 是在野生型蛋白结构上训练的，对突变蛋白的预测没有经过验证。它很可能只是输出一个"跟野生型差不多"的结构——把突变位点换个残基就完事，完全忽略了突变可能引起的局部构象变化。Paul 的案例就是最好的证据：AlphaFold 预测突变 c-KIT 蛋白的 pLDDT 仅为 54.55，远低于可信阈值（70），结构生物学家 Kate Michie 博士明确指出"AlphaFold 也会犯错，需要实验室验证"。用低置信度的预测结果来选择疫苗靶点，这不是工程，是赌博。

那肿瘤为什么缩小了？

肿瘤缩小 ≠ Paul 的 AI 疫苗有效。Thordarson 教授本人承认"很难区分哪种治疗起了最大作用"。更可能的解释：

• 免疫检查点抑制剂的作用。 Rosie 同时接受了检查点抑制剂——这本身就是一种已验证的抗癌疗法，且肥大细胞癌对免疫治疗天然敏感。肿瘤缩小可能主要归功于检查点抑制剂，而非 mRNA 疫苗
• 肥大细胞癌的特殊性。 这类肿瘤属于"热肿瘤"（高突变率），对免疫治疗响应率高，任何免疫刺激都可能有效
• UNSW RNA 研究所的专业补全。 真正的 mRNA 合成、纳米颗粒配方、脂质包裹是 RNA 专家做的，不是 Paul 的 AI 流程
• 之前化疗/手术的延迟效应。 Rosie 经历了多次减瘤手术、化疗和免疫治疗，肿瘤缩小的功劳可能属于之前的综合治疗
• N=1，无对照。 没有对照组，无法判断因果关系。Paul 自己也明确说"这不是治愈，Rosie 仍然有癌症"

简单说：Paul 的故事证明了个体化肿瘤疫苗在犬类身上的可行性，但无法证明他的 AI 流程本身有效。肿瘤缩小可能是多种因素共同作用的结果，而媒体只选择了"AI 疫苗"这个最吸引眼球的角度。真正的肿瘤新生抗原疫苗，需要的是系统化的计算管线，不是个人英雄主义。

第四步：靶点匹配与药物筛选

AI 药物虚拟筛选

Paul 锁定靶点后匹配药物，最初找药企被拒。

Paul 流程的不足

依赖外部药企，没有自主筛选能力。 Paul 只能拿着靶点去找现成药物，一旦药企拒绝，就卡住了。他没有能力从分子层面做虚拟筛选，找到新的候选分子。
没有结合口袋分析。 知道靶点 ≠ 知道药物怎么结合。没有做结合口袋的识别和特征分析，药物设计就是盲人摸象。
没有 ADMET 预测。 即使找到候选分子，没有预测其吸收、分布、代谢、排泄和毒性（ADMET），进入实验阶段后失败率极高。

我们的方案

AI 药物虚拟筛选管线（S5）——靶点 → 结合口袋 → 分子对接 → 候选分子，端到端。TorchANI 神经网络势精度接近 DFT。不用等药企点头，自己跑出候选分子，ADMET 预测内置。

如果 Paul 找到我们

Paul 的路径	Paul 的不足	DiVo Gen²AI 管线
花 3000 美元测序 + ChatGPT/Gemini/自定义 ML 辅助分析	无标准生信流程，不可复现，VUS 无法判断，无 DLA 分型	肿瘤精准防控 S4b
AlphaFold 预测 c-KIT（pLDDT 54.55）	低置信度预测，用结构预测工具做靶点发现（用错工具），无交叉验证	蛋白质工程 S1（四模型交叉验证）
Grok 设计构型，半页纸配方，联合检查点抑制剂	表达效率未优化，免疫原性未知，新抗原筛选缺 DLA 分型，联合用药无法归因	mRNA 疫苗设计 S3（全模块设计 + 免疫原性预评估）
找药企被拒，无自主筛选能力	无虚拟筛选，无结合口袋分析，无 ADMET 预测	AI 药物虚拟筛选 S5

Paul 前后花了好几万美元，用了好几个月，每一步都在"试错"。如果用我们的管线，从测序到疫苗设计方案，最快 4-6 周全部走完——而且每一步都有模型交叉验证，不是碰运气，是工程。

不只是狗，也不只是癌症

Paul 的故事最让人兴奋的地方在于：一个没有生物学背景的工程师，仅凭 AI 工具就完成了从基因分析到疫苗设计的全流程。

但这个故事也暴露了一个残酷的现实：个人英雄主义式的"AI + 生物学"，每一步都充满了不确定性。 ChatGPT 不是生信工具，AlphaFold 单模型不可靠，半页纸配方没有 UTR 优化，找药企被拒就卡住。

当 AI 遇上生物学，奇迹不应该是偶然——它应该是工程。而工程，正是我们的专业。

从独立科研人员到高校课题组，从 Biotech 到医院，只要有基因组与蛋白质的计算需求——

Compute · Design · Analysis · Insights

我们不只是工具，我们是你的计算后端。每一步都有交叉验证，每一步都可追溯、可复现。

Paul 和 Rosie 的故事很动人。但下一个 Paul 不应该再花几万美元和几个月时间，在每一步都冒着"试错"的风险。

了解我们的研发计算服务

DiVo Gen²AI —— 工程智能，改善生命！