CAGE-seqについて
-
CAGE-seqとは何ですか?
- CAGEはCap Analysis of Gene Expressionの略であり、次世代シークエンサーを用いた遺伝子発現解析法です。RNA-seqやマイクロアレイに比べ定量性が高い解析法です。
- RNA 5’末端のキャップ構造を利用して転写産物の5’末端(転写開始点)の塩基配列を決定、ゲノム配列にマッピングすることで、遺伝子発現解析や、転写開始点のゲノムワイドな同定が可能です。
- CAGEは理研が独自に開発した解析手法で、RNAのキャップ構造を捕捉する技術などを組み合わせて転写産物の5’末端の塩基配列を決定する実験手法です(特許第3441899号、特許第4340779号など)。
-
CAGE-seqはどのような原理ですか?
- RNAポリメラーゼII産物(mRNAやlong non-coding RNAの一部)が5ʼ末端に持つ5’キャップ構造をビオチン化し、ビオチン化された5ʼ末端を含むRNAのみをストレプトアビジンビーズで回収します。これを「キャップトラップ法」と呼び、特許登録(特許第3441899号)しております。
- 5ʼ末端の75bpをイルミナ社のNextSeqでシークエンスし、得られたシークエンスデータ(リード)を既知のゲノム配列にマッピングすることで、5’末端(=転写開始点)のゲノム上の位置を特定します。さらに同一箇所にリードが何個ヒットするか(重複度)を基に、転写産物の発現量を定量します。
- 2種類のサンプルについてCAGE-seqデータを⽐較すれば、サンプル間で発現量が異なる遺伝子/転写開始点、すなわち、サンプル間の違いをもたらす原因遺伝⼦候補の情報を得ることができます。
- 転写開始点ごとの発現量が定量できるため、組織や臓器、疾患特異的な転写開始点を検出することが可能であり、特定の遺伝⼦に関与している転写因⼦が切り替わった場合、的確に検出することが可能になります。
-
CAGE-seqの特徴は何ですか?
- 発現定量性がRNA-seqやマイクロアレイより高い手法です。CAGE-seqはRNAを断片化せず、5‘末端の75塩基だけをシーケンスするため、RNA1分子から1リードだけが得られます。一方で、RNA-seqはRNAを断片化してしまうため、RNA1分子が複数リードとなり得ます。そのため、CAGE-seqはRNA-seqを定量性で上回ります。
- ライブラリー作製工程に原則PCRを含まないため、増幅バイアスがありません。
- 遺伝子単位だけでなく、より細かな転写開始点単位での遺伝子発現解析が可能です。RNAの種類は、合計5万種弱(Coding RNA:2万種強、Non-coding RNA:2万種強)と言われています。それに対して転写開始点は18万~100万か所あることが分かっており、1つの遺伝子に対し、3~20カ所の転写開始点があるといえます。5万種弱の遺伝子に対して、18万カ所以上の転写開始点について定量することで、違いをより細かく見ることが可能です。
- 転写開始点が異なるということは、関与している転写因子が異なる可能性を示唆しており、発現量の違いだけでなく制御機構の変化も検出できます。
- 欠点は、RNAの全長を読まず、5’末端のみをシーケンスするため、Splicing-variant や、ORF内のSNPの情報が得られない点となります。