Splice difference解析とLeafcutter
2023-06-06
はじめに
RNA-seqを用いたスプライシングバリアント解析は、さまざまな疾患の病態解明や治療法開発に役立つ可能性があります。異なる条件下で発現するRNAの配列を比較することで、スプライシングパターンの変化を検出することができます。これは例えば疾患の発症や進行に関する理解を深める上で重要な情報となります。
つくば遺伝子研究所では、このような解析をSTAR・Cufflink・cummeRbundといったソフトウェアを用いて実現するシステム を構築し、これまでに多数のご依頼に対応してきました。
最近これとは別にLeafcutterというソフトを使ったパイプラインを構築し、テスト運用を進めています。本記事ではその概要をご紹介します。
Leafcutter
Leafcutterは、短いリードRNA-seqデータを使用してRNAスプライシングの変動を定量化するソフトウェアです。このソフトウェアで採用されている主なアイデアは、イントロンを横断するリード(スプライスリード)を利用して、新規および既知の代替スプライシングイベントを特定し、サンプル間で差異のあるイントロンを定量化することです。
以下は開発者らによる論文 の記述の一部を抜粋・翻訳したものです。LeafCutterは、サンプルグループ間のスプライシングの差の検出と、スプライシング量的形質座位(sQTL)のマッピングの両方に使用することができます。従来の方法と比較して、1.4~2.1倍のsQTLが見つかり、その多くが疾患関連バリアントに分子効果を付与するのに役立っています。驚くべきことに、イントロンの定量化と40の複合形質とのトランスクリプトーム全体の関連は、遺伝子発現レベルのみを用いた場合と比較して、5%FDRにおける関連疾患遺伝子の数を平均2.1倍に増加させました。
解析手順
LeafCutterによる解析は、次世代シーケンサーによる解析から生み出されたリードデータ(fastqファイル)から始まります。
- まずSTARなどのアライメントソフトを用いてリードのマッピングを行ないます。bam形式のファイルを得ます。
- 次にregtoolsというソフトを用いて「junction file」を得ます。
- ここから、leafcutterソフトウェアによる解析です。
- イントロンクラスタリング (Intron clustering)
- イントロン除去の差異分析 (Differential intron excision analysis)
- スプライスジャンクション図示 (Plotting splice junctions)
- 最終的に、たとえば以下のような図が得られます。
これは、有意差が認められたエクソンの集合(クラスター)のひとつを示したものです。
グラフ中に赤・ピンクで描かれている線は、各イントロンの開始座標と終了座標を結んでいます。スプライスジャンクションの平均数を両条件で計算して総カウントの割合として正規化した数値が図中に示されています。これらが実験区と対照区との間でどう異なるのかも見ることが出来ます。