邮箱:mamobio@163.com

首页 > 学术前沿 > 基础医学研究 > 蛋白组学 > 优化dia PASEF和深度文库快速深入地覆盖磷酸化蛋白质组

学术前沿

推荐新闻

研究新闻

产业文章

优化dia PASEF和深度文库快速深入地覆盖磷酸化蛋白质组

发布:大分子生物 阅读量: 蛋白组学 2022-10-06

原文标题:通过深度文库和dia-PASEF的最优窗口设计快速深入地覆盖(磷酸化)蛋白质组

发表期刊:Molecular & Cellular Proteomics

发表时间:2022.09

研究领域:磷酸蛋白质组学

技术平台:液相质谱(Evosep One、Bruker timsTOF Pro)

样本:人体癌细胞HeLa S3

研究背景


布鲁克捕获离子迁移率(IM)分离的四极杆飞行时间质谱仪上将DIA与平行累积-串联碎裂(dia-PASEF)相结合,这要求IM分离与下游质量选择性四极杆对齐,从而导致与DIA相比,diaPASEF窗口放置方案更复杂。为了实现高数据完整性和深度蛋白质组覆盖,采用可变隔离窗口,根据m/z和IM平面中的前体密度最佳放置。结合深入的项目特异性蛋白质组学文库和Evosep液相色谱系统,在44 min内可重复鉴定人类癌细胞系中的7700多种蛋白质,并以高灵敏度进行四次单次注射。即使每天通过100个样品(11 min/样)的通量,我们也可以通过注射四次重复样品来持续定量哺乳动物细胞裂解物中的6000多种蛋白质。我们发现最佳的dia-PASEF窗口放置有助于以非常高的灵敏度深入磷酸化蛋白质组学,在21 min/样的三次重复运行中对用表皮生长因子刺激的人类癌细胞系中的35,000多个磷酸位点进行量化。这涵盖了高灵敏度调节磷酸化蛋白质组的大部分,为广泛的系统生物学研究开辟了道路。

图形摘要

图形摘要


实验方法

Evosep One:60和100 SPD(samples per day),搭配色谱柱8 cm×150 μm× 1.5 μm C18(PepSep),30SPD方法搭配色谱柱15 cm×150 μm× 1.9μm C18(PepSep)(40℃)。分析柱与纳米电喷雾离子源(Captive spray source;Bruker Daltonics)内的熔融二氧化硅ID发射器(10 μm ID;Bruker Daltonics)连接。流动相为0.1% FA溶液A和0.1% FA/99.9% ACN溶液B。

Bruker timsTOF Pro:文库样本以DDA-PASEF模式采集,其中4次PASEF/MS-MS扫描的通量为60和100 SPD,10次PASEF/MSMS扫描的吞吐量为30 SPD/topN。单电荷前体根据它们在m/z-IM平面中的位置被过滤掉,并且只有超过2500个任意单位的强度阈值的前体信号被挑选用于碎裂。当超过目标值20,000个任意单位的前体被动态排除0.4 min时,低于700 Da的前体被2 Th窗口隔离,高于700 Da的前体被3 Th窗口隔离。所有光谱的m/z范围为100~1700,IM范围为1.51~0.6 V cm−2。


实验结果

结果1:原始dia-PASEF窗口设计的原理和局限性

在PASEF MS-MS扫描中,四极杆传输部分离子束,其中m/z值落入预定义的隔离窗口(图1A)。由于软件的限制,原始的dia-PASEF方法包括每次DIA-PASEF扫描的顶部IM窗口的重复模式。这导致了具有等距离四极隔离宽度的配置(图1B)。因此,覆盖较宽的m/z范围是以较高的循环时间为代价的,并且由于洗脱峰覆盖率较低而降低了定量准确度。或者,m/z范围外的许多肽离子将不包括在采集方案中(图1,C和D)。此外,当使用等距离隔离窗口时,每个窗口的多肽离子的分布是不平衡的,导致在高密度区域的光谱复杂性高(图1E)。最后,该捕获窗口设置方案在IM维度上也是次优的(图1F)。

图1:等距二维隔离窗时间TOF的Didia-PASEF原理。

图1:等距二维隔离窗时间TOF的Didia-PASEF原理。

结果2:建立最优的dia-PASEF窗口设计

在优化DIA方法的周期时间时,必须优先考虑识别和定量准确性之间的权衡。Olsen和Reiter组分别实现了每个峰4个和8个数据点的平均值,而我们的目标是每个洗脱峰有6个点。在21 min梯度(60SPD)的情况下,发现平均峰宽为8.3 s(如DIA-NN所报告的那样,图S5D)。每个单独的dia-PASEF扫描花费大约100 ms,外加每个周期和开销时间的一个100 ms MS1扫描。因此,12次dia-PASEF扫描相当于1.4 s的周期时间,代表了LC洗脱峰的充分定量表示和蛋白质组学深度之间的最佳权衡(图S5E)。如果一项研究需要更多地关注定量准确性,那么较少的dia-PASEF扫描次数和较短的周期时间可能是有益的。

补充图S5:原始dia-PASEF方法的优化。

补充图S5:原始dia-PASEF方法的优化。

先在m/z维度上均匀地对前驱体离子群进行分类。梯形定义了扫描区域的范围和捕获方案在m/z-IM平面中的位置(图2a,左面板)。在此基础上,py_diAID计算每个隔离窗口(图2A,中间面板)的最佳尺寸,并将顶部和底部IM窗口扩展到测量的IM范围的限制,以最大化覆盖的多肽离子群(图2A,右面板和补充图S6)。对使用py_diAID设计的最优dia-PASEF方法与原始的dia-PASEF方法进行了基准比较,相比之下,由py_diAID计算的最优dia-PASEF方法分别达到了99%和94%。py_diAID的最佳获取方案也使单次注射(图2B)和整个RT(图2C)中识别的多肽数量增加了6%,而在重复注射中识别的多肽数量仅偏差1%。对数据的检查表明,额外的多肽既来自以前未被覆盖的区域,也来自最密集的洗脱时间。所有鉴定的多肽中有80%以上是用这两种方法共同鉴定的(图2D)。在其他应用中,如磷酸蛋白质组学,py_diAID的收益要大得多。

图2:Py_diAID算法及其评价。

图2:Py_diAID算法及其评价。

结果3:短LC梯度中的深度蛋白质组覆盖

为了生成这样一个深度文库,我们使用Spider分馏器的高pH反相色谱将15 μg的HeLa样品分离成48个串联的组分。这些组分在DDA-PASEF模式下测量,并再次使用FragPipe及其SpecLib工作流进行分析。我们将有限样本量(2.5 μg蛋白水解酶)和24个组分生成的“参考文库”与样本量充足(15 μg)和两倍多组分的新文库进行了比较。正如预期的那样,后者要大得多,含有45%以上的多肽(包括所有修饰)和13%以上的蛋白质。总体而言,这个由21 min运行构建的深层文库包含124,155个肽和8439个不同的蛋白质组(图3,A和B)。

图3:使用项目特定深度库的21 min梯度的工作流程优化。

图3:使用项目特定深度库的21 min梯度的工作流程优化。

接下来,我们研究了更短的梯度和稍长的梯度对蛋白质组深度和定量准确性的影响。将梯度延长至44 min(Evosep One系统上的30 SPD方法),平均鉴定出基于100,900±634个多肽(包括所有修饰)的7756±6个蛋白质。这意味着与21 min的梯度相比,蛋白质水平的识别增加了10%。对于这些技术重复,一式四份之间的中位数变异系数在蛋白质水平上为4%,7393个蛋白质组的变异系数低于20%(图4,A和C)。

100 SPD方法仍然鉴定出6285±18个蛋白质(59,811±368个多肽)。仅取CV值等于或低于20%的蛋白质,100 SPD方法仍然得到6121种蛋白质,覆盖了83%的蛋白质,可以用44 min的梯度准确地定量,同时大大减少了分析时间(图4A)。我们的数据表明,改进的工作流程构成了一个强大的技术平台,能够以高通量准确地定量大部分蛋白质组。

图4:基于单次运行分析的不同梯度长度/通量的比较。

图4:基于单次运行分析的不同梯度长度/通量的比较。

结果4:DIA-NN与SPECTERATER蛋白质组结果的比较

确定总蛋白质数量相似后,我们接下来研究了发现的蛋白质之间的重叠。由于DIA-NN与Spectronaut有不同的蛋白质分组算法,对基因和肽前体的水平进行了分析。在基因水平上采用类似的分组方案显示出高水平的一致性,在总共7668个鉴定的基因中,Spectronaut独有的548个基因和DIA-NN独有的208个基因(补充图S11B)。对于总共128002个鉴定的肽前体,差异稍大,Spectronaut有28%的独特鉴定,DIA-NN有5%(补充图S11C)。总体而言,基于这些蛋白质组结果,我们得出结论,py_diAID获得的增益与所使用的DIA分析软件无关。

补充图S11:使用DIA-NN 1.8与Spectronaut 16进行蛋白质组学分析。

补充图S11:使用DIA-NN 1.8与Spectronaut 16进行蛋白质组学分析。

结果5:优化分离窗设计的快速磷酸化蛋白质组学

当我们模拟原始dia-PASEF方法对21 min梯度的覆盖时,发现它只覆盖们深层磷库中34%的磷肽离子,而未经修饰的多肽的覆盖率为81%(图5C)。因此,我们使用磷脂库作为py_diAID的输入,获得了一种适合于磷酸蛋白质组学的dia-PASEF方法。这导致理论上覆盖了所有双电荷离子的93%和所有三电荷磷肽离子的92%(图5D)。

图5:针对磷酸蛋白质组学的方法优化。

图5:针对磷酸蛋白质组学的方法优化。

首先用DIA-NN对照我们的深层磷库分析了得到的文件。与模拟一致,原始的dia-PASEF方法识别出8199个亚磷酸盐和13,485个磷酸肽,而优化的方法检测到多28%的磷酸盐(10,510)和43%的磷酸化肽(19,258)(图5E)。两种方法鉴定的磷酸肽的STY比率相似,最优的方法量化了15,817个丝氨酸修饰的多肽,3552个苏氨酸修饰的多肽和553个酪氨酸修饰的多肽(补充图S12A)。为了进一步说明这一点,我们使用AlphaMap将实验获得的磷酸肽映射到对于传递EGF信号至关重要的EGFR序列。这表明,最佳的dia-PASEF磷酸盐方法使检测到的亚磷酸盐总数翻了一番,达到14个(图5F)。

补充图S12:用STY比率进行磷酸蛋白质组学分析。

补充图S12:用STY比率进行磷酸蛋白质组学分析。

接下来,我们使用Spectronaut分析了相同的单次运行phospho数据集。惊讶的是——特别是考虑到蛋白质组水平的可比结果——Spectronaut将已识别的磷酸位点的数量大幅增加至28,980个(补充图S14B)。对于已鉴定的磷酸肽,这一点更为明显(72,216,补充图S14D)。因此,在不考虑位点定位的情况下,磷酸位点的常见重叠仅为26%(补充图S14B)和磷酸肽序列的38%(补充图S14C)。

补充图S14:磷酸蛋白质组学分析。

补充图S14:磷酸蛋白质组学分析。

结果6:EGF信号通路的深层磷酸蛋白质组学分析

通过我们的工作流程,我们量化了4300个蛋白质上的46,136个磷酸化位点。其中,35,537个位点被鉴定为具有高位点定位概率(75%,I类位点),20,001个位点在至少一个实验条件的所有重复中被量化(图6A)。光谱报道了62,057个磷酸肽对丝氨酸、19,513个苏氨酸和2788个酪氨酸进行了修饰,证明了磷酸蛋白质组的深度(补充图S12B)。dia-PASEF工作流程允许高重复性量化,条件内重复的皮尔逊系数中值高于0.92(图6B)。值得注意的是,在EGF处理下,整整26%(5200,5%FDR)和10.5%(2117,1%FDR)的磷酸化位点被显著调节(图6C)。

图6:dia-PASEF工作流程允许对特征EGF信号事件进行稳健检测。

图6:dia-PASEF工作流程允许对特征EGF信号事件进行稳健检测。

正如预期的那样,基因本体富集分析显示,EGFR信号通路(基因本体生物过程[GOBP])中涉及的蛋白质以及显著EGF预调节的磷酸蛋白中的相关通路表现出强烈的过度表达(图6D)。大多数已知对完整的EGF信号至关重要。这项EGF研究展示了基于dia-PASEF的磷酸蛋白质组学工作流程的定量能力。对分离在IM和m/z空间中的离子进行有效的分析,可以高通量地研究高灵敏度的信号通路。

补充图S15:EGF刺激后磷酸化事件的z评分强度的热图显着上调。

补充图S15:EGF刺激后磷酸化事件的z评分强度的热图显着上调。


讨论

基于MS的蛋白质组学是一门发展迅速的技术。10年前,为了覆盖1万个蛋白质,我们必须用4 h的梯度测量12天的样本。在这里,将一个强大的高通量Evosep One系统与TIMS-qTOF仪器相结合,使用TOF分析仪的快速采样速度。我们只用了之前测量时间的13%就生成了9461个蛋白质的深度项目特异性文库。此外,一旦文库准备就绪,随后使用py_diAID生成的方法进行蛋白质组鉴定只需44 min,即可获得7700个蛋白质的深度(不到10年前所需测量时间的1%)。我们的工作流程也比目前采用的癌症蛋白质组学高通量筛选策略快一倍,同时在细胞裂解物上实现更大的蛋白质组深度。

在21 min/样内从100 μg EGF刺激的HeLa细胞消化中鉴定了35,000个亚磷酸盐。我们的工作流程开启了在短时间内测量多条路径的可能性。定量分析调节的磷酸蛋白质组涵盖了研究得很好的EGF信号通路和辅助通路。有趣的是,我们的工作流程甚至比选定的反应监测更快,作为评估信号通路激活的有针对性的筛选方法。然而,我们的方法对任何途径都是通用的,原则上适用于整个磷酸蛋白质组。


参考文献

Skowronek P, Thielert M, Voytik E, et al. Rapid and in-depth coverage of the (phospho-) proteome with deep libraries and optimal window design for dia-PASEF[J]. bioRxiv, 2022.https://doi.org/10.1016/j.mcpro.2022.100279


(声明:本网所转载的文章内容仅作为信息资源提供与分享,并不意味着代表本站观点或证实其内容的真实性,不用于或依赖于任何诊断或治疗目的,此信息不应替代专业诊断或治疗,如有不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理!)

加载中~
加入收藏 ()
分享
加载中~