谷歌AI发布DeepSomatic用于癌症突变检测
谷歌AI推出突破性癌症检测模型
谷歌研究院与加州大学圣克鲁兹分校合作发布了DeepSomatic——一款用于识别癌细胞基因突变的前沿人工智能模型。该公告发布于成功检测出传统工具遗漏的儿童白血病突变试验之后。
DeepSomatic工作原理
这一创新模型采用:
- 专为癌症基因组优化的小变异调用器
- 兼容Illumina短读长、PacBio HiFi长读长和Oxford Nanopore长读长
- 谷歌DeepVariant技术的延伸
该系统将对齐的DNA读取转换为类图像张量,编码内容包含:
- 碱基堆叠信息
- 质量指标
- 比对上下文

通过卷积神经网络,DeepSomatic将候选位点分类为体细胞变异或非变异,最终生成标准化VCF或gVCF文件。
基准测试表现
研究团队使用CASTLE(癌症标准长读长评估)数据集训练和评估DeepSomatic,该数据集包含:
- 六对匹配的肿瘤与正常细胞系
- 覆盖三大主流平台的全基因组测序 结果显示出显著改进:
| 指标 | DeepSomatic | 其他方法 |
|---|
团队报告发现了329,011个体细胞变异,验证了DeepSomatic在插入缺失检测方面的卓越能力。

关键优势
该模型具有多项突破:
- 多平台支持:适用于不同测序技术
- 自适应张量设计:有效概括局部单倍型和错误模式
- 临床相关性:支持包括FFPE样本在内的肿瘤-正常组织工作流程
研究团队已公开基准数据集以加速癌症基因组学的进一步发展。
核心要点
- 🌟 可检测跨多测序平台的遗传变异
- 🔍 使用CNN驱动的图像张量转换实现高精度
- 📊 在关键基准测试中比现有方法领先10-20%


