蛋白生物標志物發現是理解病理的非常重要的一步,也是在藥物研發過程中,鑒定潛在藥物和診斷目標物的重要一步。血漿和血清是關于一個人健康與否信息的重要來源,盡管投入了大量資金,但很少有新的生物標志物能真正進入臨床。因此需要使用一個相對定量的差別分析方法,發現這些假定的、跟疾病有關的標志物,并要求嚴格的實驗放方法來減少樣本與樣本之間的差異性。基于質譜的蛋白質組學是一種潛在的強大和有前途的技術,它可以定量和特異性地分析血漿蛋白質組。
通過對之前的研究回顧,不難發現紅細胞溶解、血小板污染和部分凝血引起的質量問題會影響所有生物標志物研究中占比的50%,同時如何尋找一些有效方法降低候選生物標記的錯配,必然會對生物標記的發現存在重要指導意義。
2019年9月30日,德國馬普生化研究所所長、世界著名蛋白質組學專家 Matthias Mann 教授將其最新的研究成果發表在了國際學術期刊EMBO Molecular Medicine(IF=10.624)上。他們利用血漿蛋白質組分析,發現了三個質量標記面板,這些質量標記面板報告了血漿樣品在紅細胞裂解、血小板污染和部分凝血方面的狀態。這些面板可以識別到個別樣本質量好壞與否,并糾正在生物標志物研究中的系統性偏差。同樣,它們也可以用來評估一種新的生物標志物候選是否與污染源之一有關。最后,作者還進一步提供了樣本制備指南和在線資源,以評估臨床研究中個別樣本的總體樣本相關偏差。

研究速讀
1、血漿蛋白質組中的紅細胞和血小板蛋白
在之前研究中,作者通過手工和生物信息學檢查發現樣品質量問題的三類起源:紅細胞,血小板和凝血系統。因此,設計實驗來系統地表征血漿蛋白質組學的這些主要質量問題。他們先獲得了紅細胞和血小板的參考蛋白質組,收集的細胞成分來源于10位健康的女性和10位男性中(樣本策略),每個個體又分五個血液級分:紅細胞、血小板和純血漿(無血小板),并進一步收集了富含血小板的血漿和全血(圖1A)。使用自動化蛋白質組學樣品制備流水線,然后進行液相色譜聯用高分辨率質譜(LC-MS / MS)。此前還通過分析廣泛的預分離肽段,也已從合并樣本中生成了一個非常深的文庫,使用該文庫進行分析。
最終,他們從61654個序列獨特的肽中鑒定出總共6130種不同的蛋白質(圖1B和C)。血小板蛋白質組最廣泛(5793種蛋白質),在紅細胞中檢測到2069種蛋白質,在富含血小板的血漿中檢測到1682種蛋白質,在無血小板血漿中檢測到912種蛋白質。富含血小板的血漿與無血小板的血漿的比較表明,血小板可以引入的更多蛋白質。作者選擇30種含量最豐富且CV低于30%的蛋白質,發現在污染性細胞類型中的表達水平至少比血漿高10倍(圖1D和E)。肌動蛋白和甘油醛-3-磷酸脫氫酶,這兩種蛋白被認為是血漿質量起源的特定且獨立的指標。
紅細胞蛋白的明顯污染似乎是血漿蛋白質組的一部分,紅細胞組通常在參考人群紅細胞水平與血漿樣品之間具有相對較高的相關性。相反,在許多血漿樣品中,參考隊列血小板水平與研究中的血漿樣品之間沒有可檢測到的相關性。所以,明顯的污染蛋白仍可以用作生物標記,但是,在這種情況下其豐度值應與參考質量面板中的模式不同。

圖1血細胞標志物的鑒定
2. 連續稀釋實驗驗證了紅細胞和血小板質量標記物面板
為了進一步確定之前兩個蛋白質組是否正確地量化了血漿中的污染,作者再一次從五個研究參與者中生成了四個紅細胞和血小板池。將這些池分9步稀釋成無血小板血漿,然后進行細胞計數和蛋白質組學分析(圖2A),得到了與預期相同的細胞蛋白質組與血漿比例下降(圖2B和C)。由于每個組中的蛋白質具有相同的來源,因此作者通過對每種細胞類型的強度求和并除以所有定量血漿蛋白的總強度來定義單個變量。這產生了兩個非常強大的“污染指數”,相對于通過細胞流式細胞儀測定的細胞數而言,它們呈線性關系(圖2D和E)。當然,摻入的1:100污染物很容易被檢測到,相當于每升血漿中70000紅細胞或30000血小板的濃度。

圖2 將紅細胞和血小板組分摻入純血漿中,稀釋和分析方案
3. 凝血相關質量標記面板
除了由細胞成分引起的污染外,凝血也可能導致生物標志物研究中的系統偏倚。在臨床實踐中,通常將抗凝劑預先添加到容器中,快速倒置會使抗凝劑與血液混合,離心后產生純血漿(圖3A)。添加或混合的任何延遲都可能導致部分凝結,在缺少抗凝劑并等待30分鐘的極端情況下,將獲得血清而不是血漿。
為了生成評估血液凝固的面板,作者系統地比較了72個血漿樣本與72個血清樣本(4個人,共18等份)。在總共2099種定量蛋白質中,有299種發生了顯著變化(圖3B)。凝結后最顯著去富化的蛋白質是凝血級聯反應的典型成分,更有趣的是,血清中升高最強的蛋白是高豐度的血小板蛋白。總共有208種蛋白質由于凝結而增加,而91種減少。
為了定義一個可靠的凝血標記物,選擇了血清和血漿之間變化最劇烈的30種蛋白質。與紅細胞和血小板標記面板相反,由于血液凝結,凝血標記面板相關的蛋白質或增加或減少,并且它們之間的倍數變化很大。因為對于減少的蛋白質而言,倍數變化最大,所以可根據它們計算出凝血標志物的比率(所有血漿蛋白質的總和除以血漿升高的凝血蛋白質的總和)。比較血清和血漿時,該比率非常可靠,對于這些不同的樣品類型,它們的中位數比率分別為9和120,被明顯分開(圖3C)。在凝血標記物組中,只有F13A1,PPBP和THBS1與血小板組相同,而與紅細胞組則沒有相同(圖3D)。觀察到的三個質量標記物組的低重疊可使其成為高度特定的工具,以闡明樣品相關偏差的存在和起源。

圖3 凝血質量標記面板
4.在具體研究中的應用
上面定義的標記物可以在三個層面上評估與樣品相關的問題:臨床隊列中每個樣品的質量、整個研究中的潛在系統偏倚以及單個生物標記物候選物屬于污染物蛋白質組的可能性。作者研究了減肥后血漿蛋白質組的變化,對52個人進行2個月的熱量限制,然后維持體重1年。血漿蛋白質組學分析的七個縱向樣品揭示了載脂蛋白譜的顯著變化、炎癥蛋白和與胰島素敏感性相關的標志物的減少。通過計算三個污染指數,分別評估了每個樣品的質量。通過這種方式,標記了12個樣品,其中6個樣品被血小板污染,一個樣品的紅細胞水平升高,另外五個樣品則有部分凝結的跡象(圖4)。
作者在www.plasmaproteomeprofiling.org上創建了一個在線平臺。它提供了用于交互式評估血漿蛋白質組數據質量的工具箱。可通過簡單的拖放系統上載MaxQuant搜索結果表或模板中的蛋白質豐度列表,系統自動生成三個污染指數值,如圖4A所示。如果用戶指示病例和對照,則將對數據集進行系統性偏差分析(如火山圖所示)(圖4B),全局相關圖也與質量標記面板的群集一起顯示(圖4C)。

圖4 減肥研究和文獻研究中的質量標記面板
總結以及對未來蛋白質組學研究的建議
基于作者對上述三個質量標志物面板的經驗以及對數千種血漿蛋白質組的分析,設計了一個通用指南,以最小化和檢測與樣品采集和處理有關的偏差(表1)。為了進一步記錄公共變量在采血過程中的影響,還邀請了10名健康個體,并在10個不同的采血管中采集了血液。在該實驗中,系統地改變了血漿/血清的類型,血液樣本管(有或沒有凝膠)以及血液在采樣管中的沉積(真空與拉動系統)。最顯著的差異再次出現在血清和血漿之間(圖3B)。作者還發現,從試管中采樣血漿的過程對血小板污染有顯著影響。因此,作者建議離心后不要收集血小板床上方的最低血漿層。從離心到血漿收集的任何延遲都可能引起血小板蛋白污染。這些因素主要影響血小板而不是紅細胞污染指數,這表明來自血小板蛋白質組的蛋白質是生物標志物候選物錯誤分配的最可能原因。

總之,三個質量標記面板能很好地報告血漿樣品在紅細胞裂解、血小板污染和部分凝血方面的狀態。同時,也發現了與樣品質量相關的蛋白質很多已被綜合文獻調查顯示為候選生物標志物。作者提供了樣品制備指南和在線資源(www.plasmaproteomeprofiling.org),以評估生物標志物臨床研究中與樣品相關性偏差,并防止重要生物標志物候選物的錯配。
參考文獻Geyer, P. E., et al., 2019, Plasma Proteome Profiling to detect and avoid sample-related biases in biomarker studies. EMBO Molecular Medicine.
原創: Dr.Proteomics 精準醫學與蛋白組學
浙公網安備33010802007965號