给狗子治疗癌症?有了 ChatGPT 就真的谁都可以?
一个程序员用 ChatGPT + AlphaFold + Grok 给自家患癌的狗设计定制 mRNA 疫苗,肿瘤缩小约 75%。 他走过的每一步,我们都有现成的计算管线——而且每一步,他的流程都有明显的不足。

一只名叫 Rosie 的混血狗,后腿长了个网球大小的肿瘤,兽医说:准备后事吧。
它的主人 Paul Conyngham,一个搞了 17 年机器学习的程序员,没认命。
他打开 ChatGPT 做头脑风暴,用 AlphaFold 预测突变蛋白结构,用 Grok 设计最终疫苗构型,从基因测序到 mRNA 疫苗设计,硬是给自家狗子造出了一支定制疫苗。联合免疫检查点抑制剂注射后,肿瘤缩小约 75%——Rosie 又能追兔子了。
这个故事刷爆了科技圈,OpenAI 总裁 Greg Brockman 和 DeepMind CEO 都转发了。
但你知道吗?Paul 走过的每一步,我们都有现成的计算管线——而且每一步,他的流程都有明显的不足。
第一步:基因测序与变异分析
Paul 花了 3000 美元做基因测序,把 Rosie 的健康 DNA 和肿瘤 DNA 做对比,找突变位点。UNSW Ramaciotti 基因组学中心返回了约 300GB 的原始测序数据——150 亿个碱基对的拼图。Paul 用 ChatGPT 辅助导航、Gemini 做数据分析的"重活"、自己的 ML 算法过滤突变,从中筛选出了 7 个强信号的新抗原。
Paul 流程的不足
- AI 辅助 ≠ 生信分析。 Paul 用 ChatGPT 辅助导航、Gemini 做数据"重活"、自己的 ML 算法过滤突变——这比"手动解读"进了一步,但仍然没有经过标准的生信流程(
BWA比对 →GATKcall 变异 →VEP注释)。AI 能帮你理解概念和加速探索,但不能替代经过验证的分析管线,漏检和假阳性无法评估。 - 没有变异致病性评估。 找到突变 ≠ 知道哪个突变致癌。
VUS(意义未明变异)在传统流程中只能标注"不确定",Paul 没有能力判断哪些变异真正驱动了肿瘤。 - 不可复现。 ChatGPT 的输出每次不同,没有版本控制、没有 pipeline 记录,科学上不可复现。
我们的方案
肿瘤精准防控管线(S4b)——从遗传风险到变异解读,全闭环。VUS 三模型交叉评分,传统只能标注"意义未明",我们能给出致病性判断。标准生信流程 + 自动化变异注释 + 致病性评分,每一步可追溯、可复现。
第二步:蛋白质结构预测
Paul 用 AlphaFold 预测突变 c-KIT 蛋白的 3D 结构,试图从中找到靶点。
Paul 流程的不足
- AlphaFold 预测置信度极低。 Paul 用 AlphaFold 预测突变 c-KIT 蛋白结构,但置信度评分(
pLDDT)仅为 54.55——这意味着预测结果基本不可信(pLDDT < 70通常被视为低置信度,< 50被视为不可靠)。结构生物学家 Kate Michie 博士也指出"AlphaFold 也会犯错,需要实验室验证"。用一个低置信度的结构来选择疫苗靶点,风险极高。 - 结构预测 ≠ 靶点发现。 AlphaFold 预测的是蛋白质三维结构,但肿瘤疫苗的"靶点"是能被 MHC 呈递、被 T 细胞识别的突变肽段——这是分子识别与结合亲和力的问题,需要 MHC-肽段结合预测工具(如
NetMHCpan),不是结构预测工具。Paul 用错了工具。 - 没有功能验证。 预测了结构 ≠ 理解了功能。突变蛋白的活性变化、稳定性改变、结合口袋的构象变化——这些需要多模型交叉判断,Paul 的流程完全缺失。
- 靶点选择缺乏系统性。 Paul 最终用 Grok 设计疫苗构型、靠 AI 建议"锁定靶点",没有经过系统的靶点可药性评估(druggability assessment),选错靶点的风险很高。
我们的方案
蛋白质工程干实验设计管线(S1)——从序列到突变体 7 步全流程,四模型酶活性交叉验证。Paul 的 AlphaFold 预测 c-KIT 置信度仅 54.55——单模型低置信度预测不可信,四个模型一致判断才可信。靶点可药性评估是流程内置环节,不是拍脑袋。
第三步:mRNA 疫苗设计
Paul 把 AI 跑出来的参数浓缩成半页纸,交给 UNSW RNA 研究所的 Pall Thordarson 教授团队合成纳米颗粒。同时,Paul 还获取了一种免疫检查点抑制剂——另一种诺贝尔奖级别的免疫疗法。他的策略是:检查点抑制剂"松开"免疫系统的刹车,mRNA 疫苗"告诉"免疫系统该攻击谁。2025 年 12 月首次注射,2026 年 2 月加强针,肿瘤缩小约 75%。但 Paul 自己明确说:这不是治愈,Rosie 仍然有癌症,疾病仍然是不可治愈的。
Paul 流程的不足
- 联合用药,无法归因。 Rosie 同时接受了 mRNA 疫苗和免疫检查点抑制剂,Thordarson 教授自己也承认"很难区分哪种治疗起了最大作用"。媒体标题只提"AI 疫苗",却忽略了检查点抑制剂——而后者本身就是一种已验证的抗癌疗法。
- 半页纸配方,没有 UTR 优化。 mRNA 疫苗的表达效率极大程度上取决于
5'UTR和3'UTR的设计。Paul 的"配方"只有CDS(编码区),UTR 大概率用了通用模板,没有针对犬类密码子偏好性优化,没有针对抗原表达需求选择不同强度的 UTR 规格。这意味着疫苗表达的蛋白量可能远低于最优值。 - 没有免疫原性预评估。 设计阶段不知道这个 mRNA 会不会触发足够的免疫反应,也不知道会不会触发不必要的先天免疫反应(导致 mRNA 被降解)。Paul 只能"打了再看",这是试错,不是工程。
- 没有新抗原预测。 肿瘤疫苗的核心是找到肿瘤特异的新抗原(
neoantigen)。Paul 靠 AI 辅助筛选出 7 个"强信号",但没有经过DLA(犬类 MHC)结合亲和力预测、T 细胞表位预测等标准新抗原筛选流程,选中的抗原是否真能激活 T 细胞,缺乏验证。
我们的方案
mRNA 疫苗/药物设计管线(S3)——CDS + 5'UTR + 3'UTR 全覆盖,GEMORNA 三模块设计,三规格 UTR 适配不同表达需求。设计阶段即评估免疫原性。新抗原预测与肿瘤精准防控管线(S4b)联动,从变异解读到抗原筛选到 mRNA 设计,一条线打通。
剥开迷雾:肿瘤新生抗原疫苗到底该怎么做?
Paul 的故事被媒体包装成了"AI 治癌"的神话。但如果你真正了解肿瘤新生抗原(neoantigen)疫苗的设计流程,就会发现——Paul 的流程几乎每一步都偏离了专业路径。
真正的肿瘤新生抗原疫苗流程
肿瘤组织 + 正常组织配对测序
WES(全外显子组)+ RNA-seq。不是"抽血 vs 肿瘤"那么简单——需要正常组织(如外周血白细胞)作为胚系变异的对照,才能准确识别体细胞突变。Paul 做了这一步,但后续分析走偏了。
体细胞突变检出与注释
Mutect2 / Strelka2 call 变异 → VEP / ANNOVAR 注释 → 筛选非同义突变、移码突变、剪接位点突变。Paul 用 ChatGPT "处理数据",跳过了整个标准流程。
HLA/DLA 分型
这是 Paul 完全跳过的一步。犬类需要 DLA(Dog Leukocyte Antigen)分型,确定 MHC I 类和 II 类等位基因。没有这个信息,你根本不知道突变肽段会被哪个 MHC 分子呈递。没有 HLA 分型,新抗原预测就是空中楼阁。
新抗原预测(核心步骤)
将突变肽段(通常 8-11mer for MHC I, 15-20mer for MHC II)与患者的 HLA/DLA 型做结合亲和力预测。工具:NetMHCpan、MHCflurry 等。筛选标准:IC50 < 500nM(弱结合),< 50nM(强结合)。Paul 用 AlphaFold 做结构预测来"找靶点",这是用错了工具——AlphaFold 预测的是蛋白质三维结构,不是肽段-MHC 结合亲和力。
免疫原性评估与抗原筛选
结合亲和力高 ≠ 一定能激活 T 细胞。还需要评估:RNA 表达水平(RNA-seq 证实突变确实表达)、T 细胞表位预测、自身免疫风险排除(排除与正常蛋白高度相似的肽段)。Paul 的流程完全没有这一步。
mRNA 疫苗设计
选定新抗原序列后,才进入 mRNA 设计:CDS 密码子优化 → 5'UTR / 3'UTR 选择 → 免疫原性调控 → 稳定性优化。Paul 的"半页纸配方"大概率只有 CDS,UTR 和免疫原性调控全靠 UNSW 的 RNA 专家补全。
Paul 的流程 vs 专业流程
| 步骤 | Paul 的做法 | 专业做法 |
|---|---|---|
| 变异检出 | ChatGPT + Gemini + 自定义 ML 过滤 300GB 数据 | Mutect2 / Strelka2 + VEP 标准流程 |
| HLA/DLA 分型 | 跳过 | OptiType / HLA-HD 等工具分型 |
| 新抗原预测 | AlphaFold 预测 c-KIT 结构(pLDDT 仅 54.55) | NetMHCpan / MHCflurry 预测肽段-MHC 结合亲和力 |
| 免疫原性评估 | 跳过 | RNA 表达验证 + T 细胞表位预测 + 自身免疫排除 |
| mRNA 设计 | Grok 设计构型,半页纸配方(仅 CDS) | CDS 优化 + UTR 选择 + 免疫原性调控 + 稳定性优化 |
| 效果验证 | N=1,联合检查点抑制剂,无法归因;Paul 自己说不是治愈 | 临床试验,对照组,统计显著性 |
关键问题:AlphaFold 能用来"找靶点"吗?
不能。 AlphaFold 预测的是蛋白质的静态三维结构。但肿瘤新抗原疫苗的"靶点"不是蛋白质结构——而是一个突变肽段能否被 MHC 分子结合并呈递到细胞表面、进而被 T 细胞识别。这完全是一个分子识别与结合亲和力的问题,需要的是 MHC-肽段结合预测工具(如 NetMHCpan),不是结构预测工具。
更进一步,AlphaFold 是在野生型蛋白结构上训练的,对突变蛋白的预测没有经过验证。它很可能只是输出一个"跟野生型差不多"的结构——把突变位点换个残基就完事,完全忽略了突变可能引起的局部构象变化。Paul 的案例就是最好的证据:AlphaFold 预测突变 c-KIT 蛋白的 pLDDT 仅为 54.55,远低于可信阈值(70),结构生物学家 Kate Michie 博士明确指出"AlphaFold 也会犯错,需要实验室验证"。用低置信度的预测结果来选择疫苗靶点,这不是工程,是赌博。
那肿瘤为什么缩小了?
肿瘤缩小 ≠ Paul 的 AI 疫苗有效。Thordarson 教授本人承认"很难区分哪种治疗起了最大作用"。更可能的解释:
- • 免疫检查点抑制剂的作用。 Rosie 同时接受了检查点抑制剂——这本身就是一种已验证的抗癌疗法,且肥大细胞癌对免疫治疗天然敏感。肿瘤缩小可能主要归功于检查点抑制剂,而非 mRNA 疫苗
- • 肥大细胞癌的特殊性。 这类肿瘤属于"热肿瘤"(高突变率),对免疫治疗响应率高,任何免疫刺激都可能有效
- • UNSW RNA 研究所的专业补全。 真正的 mRNA 合成、纳米颗粒配方、脂质包裹是 RNA 专家做的,不是 Paul 的 AI 流程
- • 之前化疗/手术的延迟效应。 Rosie 经历了多次减瘤手术、化疗和免疫治疗,肿瘤缩小的功劳可能属于之前的综合治疗
- • N=1,无对照。 没有对照组,无法判断因果关系。Paul 自己也明确说"这不是治愈,Rosie 仍然有癌症"
简单说:Paul 的故事证明了个体化肿瘤疫苗在犬类身上的可行性,但无法证明他的 AI 流程本身有效。肿瘤缩小可能是多种因素共同作用的结果,而媒体只选择了"AI 疫苗"这个最吸引眼球的角度。真正的肿瘤新生抗原疫苗,需要的是系统化的计算管线,不是个人英雄主义。
第四步:靶点匹配与药物筛选
Paul 锁定靶点后匹配药物,最初找药企被拒。
Paul 流程的不足
- 依赖外部药企,没有自主筛选能力。 Paul 只能拿着靶点去找现成药物,一旦药企拒绝,就卡住了。他没有能力从分子层面做虚拟筛选,找到新的候选分子。
- 没有结合口袋分析。 知道靶点 ≠ 知道药物怎么结合。没有做结合口袋的识别和特征分析,药物设计就是盲人摸象。
- 没有 ADMET 预测。 即使找到候选分子,没有预测其吸收、分布、代谢、排泄和毒性(ADMET),进入实验阶段后失败率极高。
我们的方案
AI 药物虚拟筛选管线(S5)——靶点 → 结合口袋 → 分子对接 → 候选分子,端到端。TorchANI 神经网络势精度接近 DFT。不用等药企点头,自己跑出候选分子,ADMET 预测内置。
如果 Paul 找到我们
| Paul 的路径 | Paul 的不足 | DiVo Gen²AI 管线 |
|---|---|---|
| 花 3000 美元测序 + ChatGPT/Gemini/自定义 ML 辅助分析 | 无标准生信流程,不可复现,VUS 无法判断,无 DLA 分型 | 肿瘤精准防控 S4b |
| AlphaFold 预测 c-KIT(pLDDT 54.55) | 低置信度预测,用结构预测工具做靶点发现(用错工具),无交叉验证 | 蛋白质工程 S1(四模型交叉验证) |
| Grok 设计构型,半页纸配方,联合检查点抑制剂 | 表达效率未优化,免疫原性未知,新抗原筛选缺 DLA 分型,联合用药无法归因 | mRNA 疫苗设计 S3(全模块设计 + 免疫原性预评估) |
| 找药企被拒,无自主筛选能力 | 无虚拟筛选,无结合口袋分析,无 ADMET 预测 | AI 药物虚拟筛选 S5 |
Paul 前后花了好几万美元,用了好几个月,每一步都在"试错"。如果用我们的管线,从测序到疫苗设计方案,最快 4-6 周全部走完——而且每一步都有模型交叉验证,不是碰运气,是工程。
不只是狗,也不只是癌症
Paul 的故事最让人兴奋的地方在于:一个没有生物学背景的工程师,仅凭 AI 工具就完成了从基因分析到疫苗设计的全流程。
但这个故事也暴露了一个残酷的现实:个人英雄主义式的"AI + 生物学",每一步都充满了不确定性。 ChatGPT 不是生信工具,AlphaFold 单模型不可靠,半页纸配方没有 UTR 优化,找药企被拒就卡住。
当 AI 遇上生物学,奇迹不应该是偶然——它应该是工程。而工程,正是我们的专业。
从独立科研人员到高校课题组,从 Biotech 到医院,只要有基因组与蛋白质的计算需求——
Compute · Design · Analysis · Insights
我们不只是工具,我们是你的计算后端。每一步都有交叉验证,每一步都可追溯、可复现。