雜志:參數優化和結果分析 ——METHODS 25, 402–408 (2001)
翻譯自:
Analysis of Relative Gene Expression Data Using Real-Time Quantitative PCR and the 22DDCT Method
Kenneth J. Livak* and Thomas D. Schmittgen
Applied Biosystems, Foster City, California 94404; and †Department of Pharmaceutical Sciences, College of Pharmacy
Washington State University, Pullman, Washington 99164-6534
現在最常用的兩種分析實時定量 PCR 實驗數據的方法是絕對定量和相對定量。絕對定量通過標準曲線計算起始模板的拷貝數;相對定量方法則是比較經過處理的樣品和未經處理的樣品目標轉錄本之間的 表達差異。 2 - △△ CT 方法是實時定量 PCR 實驗中分析基因表達相對變化的一種簡便方法,即相對定量的一種簡便方法。本文介紹了該方法的推導,假設及其應用。另外,在本文中我們還介紹了兩種 2 - △△ CT 衍生方法的推導和應用,它們在實時定量 PCR 數據分析中可能會被用到。
反轉錄 PCR ( RT-PCR )是基因表達定量非常有用的一種方法( 1 - 3 )。實時 PCR 技術和 RT-PCR 的結合產生了反轉錄定量 PCR 技術( 4 , 5 )。實時定量 PCR 的數據分析方法有兩種:絕對定量和相對定量。絕對定量一般通過定量標準曲線來確定我們所感興趣的轉錄本的拷貝數;相對定量方法則是用來確定經過不同處理的 樣品目標轉錄本之間的表達差異或是目標轉錄本在不同時相的表達差異。
絕對定量通常在需要確定轉錄本絕對拷貝數的條件下使用。通過實時 PCR 進行絕對定量已有多篇報道( 6 - 9 ),包括已發表的兩篇研究論文( 10 , 11 )。在有些情況下,并不需要對轉錄本進行絕對定量,只需要給出相對基因表達差異即可。顯然,我們說 X 基因在經過某種處理後表達量增加 2.5 倍比說該基因的表達從 1000 拷貝 / 細胞增加到 2500 拷貝 / 細胞更加直觀。
用實時 PCR 對基因表達進行相對定量分析需要特殊的公式、假設以及對這些假設的驗證。 2 - △△ CT 方法可用于定量 PCR 實驗來計算基因表達的相對變化: 2 - △△ CT 公式的推導 , 以及實驗設計,有效性評估在 Applied Biosystems User Bulletin No.2(P/N4303859) 中有介紹。用 2 - △△ CT 方法分析基因表達數據在文獻中也有報道 (5, 6) 。本文介紹了該方法的推導、假設以及應用。另外,本文還介紹了 2 - △△ CT 兩種衍生方法的推導和應用,它們在實時定量 PCR 數據分析中都可能被用到。
PCR 指數擴增的公式是:
·Xn 是第 n 個循環後目標分子數。
·X0 是初始目標分子數。
·Ex 是目標分子擴增效率。
·n 是循環數
·C T 代表目標擴增產物達到設定閾值所經歷的循環數
因此:
·X T 是目標分子達到設定的閾值時的分子數。
·C T,X 是目標分子擴增達到閾值時的循環數。
·Kx 是一個常數
對于內參反應而言,也有同樣的公式:
用 X T 除以 R T 得到:
對于使用 Taqman 探針的實時擴增而言, X T 和 R T 的值由一系列因素決定:包括探針所帶的熒光報導基團、探針序列對探針熒光特性的影響、探針的水解效率和純度以及熒光閾值的設定。因此常數 K 并不一定等于 1 。
假設目標序列與內參序列擴增效率相同:
或:
X N 代表經過均一化處理過的初始目標分子量; △ C T 表示目標基因和內標基因 C T 值的差異( C T,X -C T,R ) 整理上式得:
最後用任一樣本 q 的 X N 除以參照因子( calibrator , cb )的 X N 得到:
在這里
對于一個少于 150bp 的擴增片斷而言,如果 Mg 2+ 濃度、引物都進行了適當的優化,擴增效率接近于 1 。因此目標序列的量通過內均一化處理之後相對于參照因子而言就是
2-△△ CT 方法的假設和應用
要使△△ C T 計算方法有效,目標序列和內參序列的擴增效率必須相等。看兩個反應是否具有相同的擴增效率的方法是看他們模板濃度梯度稀釋後擴增產物△ C T 如何變化。
圖 1 顯示的是 cDNA 樣品在 100 倍稀釋范圍內的實驗結果。對于每一個稀釋樣本,都用 GAPDH 和 c-myc 特異的熒光探針及引物進行擴增。計算出 c-myc 和 GAPDH 的平均 C T 值以及△ C T 值,通過 cDNA 濃度梯度的 log 值對△ C T 值作圖,如果所得直線斜率絕對值接近于 0 ,說明目標基因和內標基因的擴增效率相同,就可以通過△△ C T 方法進行相對定量。在圖 1 中,直線斜率是 0.047 ,因而假設成立,△△ C T 方法可以用來分析數據。如果兩個擴增反應效率不同,則需要通過定量標準曲線和絕對定量的方法來進行相對定量;或者也可以重新設計引物,優化反應條件使得目 標序列和內參序列具有相同的擴增效率。
使用內標基因的目的是為了對加入到反轉錄反應中的 RNA 進行均一化處理。標準的看家基因一般都可被用作內標基因。適合于實時 PCR 反應內標基因包括 GAPDH ,β -actin, β 2 -microglobulin 以及 rRNA 。當然,其它的看家基因也同樣能被用作內標。我們推薦在應用某一基因作為內標之前首先確證該基因的表達不會受實驗處理的影響。驗證實驗處理是否對內標基因 表達產生影響的方法在 2.2 部分有描述。
2-△△ CT 方法中參照因子的選擇決定于基因表達定量實驗的類型。最簡單的設計就是把未經處理的樣品作為參照因子(calibrator )。經內標基因均一化處理后,通過2-△△ CT 方法計算,目標基因表達差異通過經過處理的樣本相對于未經處理的樣本的倍數來表示。對于未經處理的參照樣,△△ C T = 0 ,而 2 0 = 1 。 所以根據定義,未處理樣本的倍數變化為 1 。而對于那些經過處理的樣本, 相對于參考因子基因表達的倍數為2-△△ CT 。同樣的分析也可用于不同時相的基因表達差異,在這種情況下,一般選 0 時刻的樣本作為參照因子。
有些情況下,并不是比較不同處理樣本基因表達差異。例如,有的是想看某一器官中特定 mRNA 的表達。在這種情況下,參照因子可能是另一器官中該 mRNA 的表達。表 1 顯示了大腦和腎臟總 RNA 中 c-myc 和 GAPDH 轉錄本的 CT 值。在這一個例子中,大腦被人為的選擇為參照因子,通過計算得到腎臟 c-myc 表達量經 GAPDH 校正後相對于大腦的表達量的結果。盡管相對定量方法可用于這種組織之間的比較,但結果的生物學解釋是相當復雜的。不同種類細胞中目標和參照轉錄本單一的相 對量變化可能在任何特定的組織中都存在。
實時定量 PCR 所得到 C T 值可以很容易的輸出到表格程序如 Microsoft Excel 中去。為了顯示數據分析過程,我們在這里給出了一個基因表達定量的實驗數據和樣本列表。通過 β -actin 均一化處理,我們對目標基因 fos-glo-myc 的表達變化進行了監測。在 8h 的時間范圍內,在每一時間點都取 3 個重復樣本,每一樣本在 cDNA 合成之後都做定量 PCR ,數據分析用到了公式 9 ,即:
Time x 表示任意時間點, Time 0 表示經 β -actin 校正後 1 倍量的目標基因表達。
0 時刻目標基因和內標基因的平均 C T (見圖 2 第 8 欄)被用于公式 9 中。通過公式 9 計算出每一個樣本目標基因表達通過 β -actin 均一化處理後相對于 0 時刻的倍數(見圖 2 第 9 欄)。平均 SD , CV 由每一個時間點所取的三個重復樣求得。用這種分析方法,在 0 時刻的平均倍數變化接近于 1 。我們發現通過檢測在 0 時刻平均倍數變化是否為 1 可以很方便的驗證三個重復樣品之間是否有錯誤或者誤差。如果得到的結果與 1 偏差很大 , 則表明存在計算錯誤或者是很高的實驗誤差。
在前面的例子中,在每一時間點上分別取了三個獨立的 RNA 樣本進行了分析。因此對每一個樣本分別處理,通過2-△△ CT 計算後取結果的平均值就非常重要。如果是同一樣本進行 PCR 擴增的重復,這就需要首先求出平均 C T, 然後再進行2-△△ CT 計算。怎么樣計算平均值就要看目標基因和內參基因是在同一個管子中擴增還是在不同的管子中擴增。表 1 給出了目標基因( c- myc )和內參基因( GAPDH )在不同管中擴增的實驗數據。在這里不應該把任一單個的 c-myc 管子和 GAPDH 管子作比較,而應該分別計算出 c-myc 和 GAPDH 的平均 C T 來計算△ C T 。 重復實驗中 C T 值的估計偏差通過標準的指數計算轉化成最後結果中相對量的變化。但其中的一個難點是 C T 值與相應的拷貝數成指數關系(見第 4 部分) , 因此,在最後的計算中,2-△△ CT 的誤差通過△△ C T 加上標準偏差和△△ C T 減去標準偏差來評估,這就使得求得的數值相對于平均值呈不對稱分布。不對稱分布是因為結果經指數處理後轉化成量的線性比較造成的。
通過不同熒光染料標記的探針,我們可以在同一管中同時擴增目標序列和內標序列。表 2 給出了目標基因( c- myc )和內標基因( GAPDH )在同一管中擴增的實驗數據。對于任意一個管子,目標基因( c- myc )和內參基因( GAPDH )擴增時加入的 cDNA 量都是一樣多的,所以可以分別對每個管子計算△ C T 值,這些值取平均後再進行 2-△△ CT 計算。 在這里估計誤差值也是一個不對稱的范圍,反映了誤差經指數處理轉化為線性差異。
在表 1 和表 2 中,估計誤差在從△ C T 到△△ C T 的計算中未見有增加,這是因為我們把參照基因和檢測基因的誤差都顯示出來了。我們把△ C T,cb 當作一個人為設定的常數來減去,得到△△ C T 。這樣得到的結果就與圖 2 所顯示的在求平均之前對不同重復樣本分別通過各自的 C T 值求2-△△ CT 所得結果 相當。另一種方法是將參照基因當作沒有任何誤差的1倍的量,在這種情況下,平均△ C T,cb 的誤差值被引入到每一樣本的△△ C T 中。在表1中,腎臟中△△ C T 變成- 2.50±0.20 而經過校正的 c-myc 量是 5.6 倍,范圍從 4.9 到 5.6 。而在大腦中的結果是沒有誤差的1倍.
通過內標 RNA 可以對加入 RNA 的量的差異進行校正。2-△△ CT方法的數據分析的一個特點就是能夠利用實時 PCR 實驗的一部分數據來完成這種校正。在其它的方法不能定量初始 RNA 量的時候:例如,在能得到的 RNA 量非常有限的時候或者需要處理高通量的樣品的時候,這一方法的優勢就格外明顯。當然我們也可以利用 PCR 實驗以外的方法來完成這種校正。最常用的一種方法就是用紫外吸收來確定用于 cDNA 合成的 RNA 量,然後將相同的 RNA 反轉錄產生的 cDNA 用于 PCR 定量反應。這種外標法校正的一個應用例子就是研究某種實驗處理是否影響內標基因的表達。在這里,目標基因和內標合二為一。在這個例子中,公式 [2] 不被公式 [3] 除,公式[ 5 ]變成:
<整理得:
任一樣品X 0,q 除以參照品 X 0,cb 得:
在這里△ CT’=C T ,q-C T ,cb 。△ C T’ 與前面計算中用的△ C T (用目標基因 C T 值減去參照基因 C T 值)相互區別。
就象在 1.1 部分所描述的,如果條件優化較好,效率接近于 1 ,內標相對于參照因子為:
2-△CT ’方法的應用
2 - △ CT , 方法的一個應用就是確定實驗處理對某一候選內標基因的影響。為了顯示這一過程,我們做了血清饑餓 / 誘導實驗 (7) 。血清饑餓 / 誘導是研究某些 mRNA 降解的常用方法 (8) 。然而,血清可能影響一些基因的表達包括標準的看家基因的表達。
在 24-h 血清饑餓培養之後,在 NIH 3T3 細胞中加入 15% 血清誘導基因表達。從細胞中提取 Poly(A) + RNA ,并將之反轉錄成 cDNA 。利用 SYBR Green 通過實時定量 PCR 檢測 GAPDH ,β 2 -microglobulin cDNA 的量。 GAPDH 和β 2 -microglobulin 各自的相對量通過 2 - △ CT ‘ 公式
求得。細胞處理對于 GAPDH 的基因表達有明顯影響,但對
β 2 -microglobulin 沒有什么影響。因此β 2 -microglobulin 很適合做血清刺激定量實驗的內標,而 GAPDH 并不適合。這一例子向大家展示了在只研究一個基因的時候怎么用 2 - △ CT ‘ 的方法分析基因相對表達數據。
實時 PCR 最終分析的是閾值循環或 C 。
C T 值通過 PCR 信號的對數值和循環數來確定。 因此 C T 值是一個指數而非線性概念 。因此,在任何統計分析中都不要用原始的 C T 值來表示結果。正如我們在前文中所描述的一樣, PCR 相對量通常和內標和參照樣本一起計算而很少直接用 C T 值來表示,除非我們想檢驗重復樣本之間的差別。為了向大家顯示這一點,我們用 SYBR Green 通過 real-time PCR 來檢測相同 cDNA 的 96 個重復反應。所有反應組分在同一管中混好後分裝到 96 個管中,做實時 PCR 分析,得到了每一個樣本的 C T 值。為了比較樣品間變化,計算了 96 個樣本的平均 ±SD ,如果通過原始 C T 值計算,平均 ±SD 是 20.00±0.193 , CV 為 0.971% 。但是如果把原始 Ct 值用 2 -CT 轉化成線性形式,平均 ±SD 是 9.08 × 10 -7 ±1.33 × 10 -7 , CV 為 13.5 %。從這個簡單的例子我們可以看出,通過原始 CT 值來反映變化是錯誤的,應該避免。用 2 -CT 將單個數據轉化成線性形式來說明重復樣本之間的變化和差異更準確可靠。
實時定量 PCR 實驗設計和數據分析可以采用相對定量和絕對定量兩種方法,研究人員在設計實時定量 PCR 實驗分析基因表達的時候首先要問的一個問題就是:數據最後會以一個什么樣的形式得到。如果需要知道絕對的拷貝數,就必須用絕對定量的方法,否則只需要給出 基因表達相對量就足夠了。相對定量可能比絕對定量要更容易一些,因為它不需要作標準曲線。
本文所給出的公式對于每個用相對定量的方法分析基因表達差異的研究人員都足夠了。下面,我們總結一下實驗設計和評估中的一些重要步驟:
1. 選擇一個內標基因。
2. 確定內標的有效性,確保它不會受到實驗處理的影響。
3. 通過 PCR 擴增目標基因和內標基因 RNA 或 cDNA 的一系列梯度稀釋模板確保它們的擴增效率相同。
4. 最後通過 2 - △ CT 計算將統計數據轉化成線性形式而不是原始 C T 值。
1• Murphy, L. D., Herzog, C. E., Rudick, J. B., Fojo, A. T., and Bates, S. E. (1990) Biochemistry 29, 10351–10356.
2• Noonan, K. E., Beck, C., Holzmayer, T. A., Chin, J. E., Wunder,J. S., Andrulis, I. L., Gazdar, A. F., Willman, C. L., Griffith, B.,Von-Hoff, D. D., and Robinson, I. B. (1990) Proc. Natl. Acad. Sci. to a linear form using 2 2 C T more accurately depicts the USA 87, 7160–7164.
3• Horikoshi, T., et al. (1992) Cancer Res. 52, 108–116.
4• Heid, C. A., Stevens, J., Livak, K. J., and Williams, P. M. (1996) Genome Res. 6, 986–994.
5• Winer, J., Jung, C. K., Shackel, I., and Williams, P. M. (1999) Anal. Biochem. 270, 41–9.
6• Schmittgen, T. D., Zakrajsek, B. A., Mills, A. G., Gorn, V., Singer, M. J., and Reed, M. W. (2000) Anal. Biochem. 285, 194–204.
7• Schmittgen, T. D., and Zakrajsek, B. A. (2000) J. Biochem. Biophys.Methods 46, 69–81.
8• Chen, C. Y., and Shyu, A. B. (1994) Mol. Cell. Biol. 14, 8471–8482.
9• Iyer, V. R., et al. (1999) Science 283, 83–87.
10• Giulietti, A., Overbergh, L., Valckx, D., Decallone, B., Bouillon, R., and Mathieu, C. (2001) Methods 25, 386–401.
11• Niesters, H. G. M. (2001) Methods 25, 419–429.