人脑发育过程中,为什么有些基因的 mRNA 表达很高,但对应的蛋白水平却检测不到?这种转录与翻译的不一致性,常常让依赖转录组数据的研究者感到困惑。
2026年1月27日,加州大学旧金山分校 Arnold R. Kriegstein 团队、斯坦福大学 Michael Snyder 团队以及 Jingjing Li 团队在《Nature Biotechnology》上发表了研究成果,他们通过优化的单细胞质谱技术,绘制了发育中人脑的单细胞蛋白质组图谱。今天我们就来拆解一下这篇生信文章:Single-cell proteomic landscape of the developing human brain。
研究概述
本研究针对复杂组织在单细胞水平上蛋白质丰度难以定量的难题,开发了一套优化的无标记单细胞质谱分析流程。团队利用该技术对发育中人脑的个体细胞进行了深度蛋白质组分析,成功解决了直径仅 7-10 μm 的微小产前神经元在蛋白覆盖度上的挑战。研究发现,人脑发育中 mRNA 与蛋白水平存在显著的表达脱节,这种不一致性在神经发育障碍相关的基因中表现得尤为突出。通过多组学联合分析,研究重建了从放射状胶质细胞到兴奋性神经元的发育轨迹,并识别出一个在中间祖细胞转变阶段起关键作用、且与自闭症风险高度关联的蛋白模块。
实验设计
1. 样本采集自13、15、19孕周的人类胚胎大脑,15和19孕周样本分离出生发区(GZ)和皮质板(CP),13孕周样本则取用完整的额叶端脑组织。
2. 采用木瓜蛋白酶解离组织,通过流式细胞术(FACS)分选单细胞,将其接种到预置裂解液的低蛋白结合微孔板中。
3. 利用Orbitrap Eclipse Tribrid质谱仪进行无标记单细胞蛋白质组检测,每个细胞单独进行一次质谱分析,通过DIA-NN软件量化蛋白质丰度。
4. 对配对样本进行单细胞转录组测序,并整合已发表的单细胞核转录组参考数据集,开展多组学联合分析。
5. 采用免疫荧光染色和RNA原位杂交技术,验证关键基因在转录与蛋白水平的表达差异。
研究结果
图1:展示实验整体流程、不同发育阶段和脑区的单细胞蛋白质鉴定数量,以及本研究与以往单细胞蛋白质组研究在检测细胞数量上的对比。
图2:通过聚类分析区分红细胞和脑细胞群体,识别出红细胞的三个亚群,同时在脑细胞中鉴定出放射状胶质细胞、中间前体细胞、兴奋性神经元等主要细胞类型。
图5:分析不同细胞类型的转录组-蛋白质组相关性,筛选出低RNA-高蛋白(A组)和高RNA-低蛋白(B组)两类差异基因群,发现B组基因富集神经发育障碍相关通路,且蛋白质的细胞类型特异性高于mRNA。
图6:基于蛋白质组数据重构放射状胶质细胞向兴奋性神经元的发育轨迹,通过共表达网络分析识别出6个阶段特异性蛋白模块,其中模块4和5与自闭症高度相关,且中间前体细胞向神经元过渡阶段为自闭症易感期。
数据分析
生信分析
本研究涉及单细胞蛋白质组学、单细胞转录组学、单细胞核转录组学和批量组织蛋白质组学和批量转录组学技术。
1. 单细胞蛋白质组学
采用DIA-NN软件匹配人类参考蛋白质组数据库,控制肽段和蛋白的假发现率(FDR)低于1%;过滤低质量细胞和污染信号后,对蛋白强度进行中位数归一化和对数转换;利用Seurat软件进行主成分分析和UMAP降维,通过Louvain算法聚类,基于已知标记蛋白注释细胞类型。
2. 单细胞转录组学
使用Cell Ranger软件进行碱基识别、序列比对和细胞条形码分配;过滤低基因数、高线粒体基因比例的细胞及双细胞;通过SCTransform标准化数据,Harmony软件消除批次效应,UMAP降维后聚类并基于标记基因注释细胞类型。
3. 多组学联合分析
在相同细胞类型水平计算mRNA与蛋白表达的Spearman相关系数;通过回归分析筛选转录-蛋白差异显著基因;利用GO、MGI、DisGeNet等数据库进行功能富集分析;基于蛋白质组数据进行拟时序分析,重构细胞发育路径;通过WGCNA软件构建蛋白共表达网络,识别阶段特异性模块;结合gnomAD数据库和SFARI数据库,分析蛋白的功能缺失耐受性及与自闭症的关联性。
统计分析
1. 采用Spearman秩相关检验评估转录组与蛋白质组的表达相关性。
2. 通过线性回归模型筛选转录-蛋白差异基因,设定P≤0.05为显著差异阈值。
3. 功能富集分析采用Fisher精确检验,通过Benjamini-Hochberg法校正P值,控制假发现率(FDR)。
4. 采用Wilcoxon秩和检验比较不同蛋白模块的进化速率、pLI分数等指标的组间差异。
5. 对免疫荧光染色结果进行细胞计数统计,计算蛋白共表达的相关系数,验证实验结果可靠性。
总结
研究意义
本研究成功建立适用于微量细胞的单细胞蛋白质组学技术,突破传统技术对细胞大小和蛋白量的限制,首次绘制出人类胚胎大脑发育的单细胞蛋白质组图谱。研究明确了转录组与蛋白质组的广泛表达差异,证实蛋白质的细胞类型特异性显著高于mRNA,凸显蛋白质层面分析在解析神经发育机制中的必要性。
通过重构神经细胞发育轨迹,研究识别出中间前体细胞向神经元过渡的关键蛋白模块,该模块与自闭症发病密切相关,为神经发育障碍的病因研究和治疗靶点筛选提供了新方向,同时也为单细胞蛋白质组学在神经生物学研究中的应用奠定了基础。
文章复现
这篇文章的原始数据和生信分析代码都公开了,学习复现很方便。
原始数据编号及仓库地址如下:
• 单细胞蛋白质组原始数据:ProteomeXchange Consortium,编号PXD071075
• 单细胞转录组原始数据:Gene Expression Omnibus,编号GSE310125
• 处理后数据交互平台:https://cell.ucsf.edu/SCProteome/
• 参考单细胞核转录组数据平台:https://cell.ucsf.edu/snMultiome/
• 生信分析代码仓库:https://github.com/SingleCellProteomics/Brain
推荐阅读
中国银河生信云平台(UseGalaxy.cn)致力于零代码生信分析。平台拥有海量计算资源、3000 多个生信工具和数十条生信流程,并且为用户提供 200G 免费存储空间。进群交流请先加 usegalaxy 为好友。
最佳Galaxy生信云平台教程:从入门到精通(图文版)
转录组分析流程和工具大全(最强总结)
全网最佳WGCNA分析教程,一键完成
一文搞懂GSEA富集分析
一文详解细菌耐药性生信分析:从下机数据到耐药基因鉴定
一文学会从测序数据到构建系统发育树:超全面的详细步骤与软件指南
经典生信流程
推荐课程
我们还为进阶用户提供高质量培训课程,欢迎参加:
RNA-seq数据分析实战 | 2026年第2期,开启你的生信学习之旅