Cell2location是桑格研究院(Sanger Institute)的Omer Ali Bayraktar團隊于2022年所開發的單細胞-空間轉錄組整合工具。與其他的整合工具一樣,Cell2location著眼于以單細胞數據的細胞分類信息對空間轉錄組中的spot進行細胞組成預測,以彌補空間轉錄組非單細胞分辨率的缺點。
該方法首先估計用戶所提供的參考單細胞(或單細胞核)數據中細胞類型的基因表達特征譜,并且在該步驟中使用負二項分布回歸以消除不同技術或批次影響。然后在第二步中,使用這些參考特征和空間轉錄組數據在每個空間位置上將轉錄組表達信息去卷積為參考細胞類型(圖1)。
圖1
相較于現有的去卷積方法,Cell2location具有以下優點:1. 在細胞組成類似的空間位置間借用統計強度;2. 將空間數據的技術與批次差異納入考慮。另外,得益于變分近似推理和GPU加速計算,Cell2location的計算速度可以很高。
在不同分布類型的(均勻分布與特異分布,高豐度與低豐度)模擬數據測試中,Cell2location的預測細胞類型豐度與實際豐度之間具有很好的一致性。與現有多種去卷積分析工具進行比較,Cell2location也展現了更好的預測能力(圖2)。
圖2
在真實的小鼠大腦樣本測試中,Cell2location所預測的細胞類型空間位置與實際的解剖位置也很好的匹配起來。不論是廣泛分布的細胞類型、較為罕見的細胞亞型還是規律分布在特定空間區域內的細胞類型,均有很好的預測結果(圖3c,d,e,f)。在相鄰組織切片的重復實驗中,Cell2location的預測結果也高度吻合(圖3g)。在其他類型的空間數據(如slide-seq)中,預測結果也具有良好的重復性(圖3h)。
圖3
更值得一提的是,對于那些在某些空間區域內不該存在,但在單細胞數據中大量存在的細胞類型(圖4i),Cell2location也展現了良好的預測特異性,例如只存在于海馬體中的細胞類型在皮層中顯示“陰性”,而其他細胞類型則不受影響。而與其他現有工具的比較中,Cell2location的預測特異性也顯示了極大的優勢(圖4j)
圖4
另外,由于已有文獻指出,星形膠質細胞在不同空間區域具有差異性,Cell2location也被用來研究這些差異程度上尚不明確的星形膠質細胞亞型。首先在單細胞數據上對星形膠質細胞基于基因表達信息進行分類(圖5a),將區分后的細胞亞型通過Cell2location解卷積到空間上(圖5b),去除那些在空間上和基因表達上都不夠特異性的亞型,就得到了既有空間差異又有表達差異的星形膠質細胞亞型(圖5c)。最后,單分子熒光原位雜交證實了這些通過生物信息手段分析得到的亞型(圖5d),而其他解卷積工具對亞型的空間定位也證明了Cell2location的可靠(圖5e)。
圖5
總之,Cell2location相較于其他解卷積工具有著更加良好性能和準確性,其預測結果在生物學意義上也得到了證實,對于探索細胞表達與空間信息具有重要的意義。SBC服務平臺生信團隊深耕單細胞空間數據組學分析,可提供多種單細胞空間組學聯合分析方法,如有需要,可聯系當地銷售。