Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 新しいテーマで話を始める場合、質問をする場合は「新しいトピックを作る」から書き込みをしてください。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

新しいトピックを作る | トピック一覧 | 研究留学ネットに戻る

ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

RNAseqでリードが遺伝子外に張り付くことはありますでしょうか? トピック削除
No.7988-TOPIC - 2019/06/15 (土) 10:34:18 - 徒弟
初めて投稿させていただきます。よろしくお願いいたします。

RNAseqを初めて行いました。

fastqをTrommomaticでトリミングしてから、
(今となっては古いソフトウェアだと聞いてますが)tophat2でマッピングしてます。
マッピングの際、アノテーションファイルとして、iGenomesのgene.gtfを指定してます。
リファレンス配列はNCBI37.2のヒトの配列です。


マッピングの終わったbamファイルをIGVで見ていたところ、
遺伝子内のエクソンにリードが貼りついていたのは良いのですが、
それ以外にも遺伝子のすぐ外側(下流側5kb以内)にも遺伝子内と同程度のリードが
貼りついていることがありました。

tophat2の原理を良く存じませんが、
アノテーションファイルに基づいてマッピングを行う以上、
遺伝子のexonやその近隣にしかリードは貼りつかないと思っていましたが、
このように遺伝子外数kbにリードが貼りつくことはありえるのでしょうか?

ご教示いただければ幸いです。
 
- このトピックにメッセージを投稿する -



9件 ( 1 〜 9 )  前 | 次  1/ 1. /1


(無題) 削除/引用
No.7988-10 - 2019/06/15 (土) 19:44:15 - 徒弟
更なるご意見ありがとうございます

TopHatのmanualでアノテーション指定オプションの箇所を見ていたところ、以下の記載を見つけました。

If this option is provided, TopHat will first extract the transcript sequences and use Bowtie to align reads to this virtual transcriptome first. Only the reads that do not fully map to the transcriptome will then be mapped on the genome. The reads that did map on the transcriptome will be converted to genomic mappings (spliced as needed) and merged with the novel mappings and junctions in the final tophat output.

最初にアノテーションの範囲でマッピングし、
その後アノテーションにマップできなかったリードは、ゲノム上にマッピングするようですね

おかげ様で勉強になりました。ありがとうございます

(無題) 削除/引用
No.7988-9 - 2019/06/15 (土) 17:36:24 - おお
リードにアノテーションをあてて、アノテーションがつかないリードはリードだけが表示されるようにしないと、起こっている事が把握できないし、データーとしてあまりクオリティーが高くないものになりそうだが。

また、いろんなことが実際に起きててTranscriptionが従来発現遺伝子に対して反対側に走ったりする事があってリ、たまたま解析した材料がスプライシングサイトやポリAサイトに変異があったりしてmRNAに普通ないゲノムの配列が加わったりとか、

(無題) 削除/引用
No.7988-8 - 2019/06/15 (土) 14:48:56 - AP
わたしの理解では、話が逆で、
リードデータをゲノム配列上にマップするのが第一。
アノテーションデータの指定はゲノム配列上にアノテーションをスーパーインポーズするためのもの。だからアノテーションがあろうとなかろうと、リードがあればマップされるものだと思っていますが。

(無題) 削除/引用
No.7988-6 - 2019/06/15 (土) 14:34:37 - 徒弟
色々ご意見ありがとうございます。
Tophat2では、アノテーションファイルを指定していたとしても、アノテーションに含まれる領域外にもマッピングを行いうるというご回答と認識しましたが、それでよろしいでしょうか?

(無題) 削除/引用
No.7988-5 - 2019/06/15 (土) 14:33:04 - AP
間違えていないかどうかはわかりません。
でも間違えていなくてもあり得るというだけ。

(無題) 削除/引用
No.7988-4 - 2019/06/15 (土) 12:40:05 - AA
リファレンスデータ次第ではありうるんじゃないでしょうか?

(無題) 削除/引用
No.7988-3 - 2019/06/15 (土) 12:32:39 - 徒弟
コメントありがとうございます。

今回相談させていただいたのは、当方がRNAseqのデータを初めて処理するため、
RNAseqの処理の仕方(tophat2の使い方)を間違えていないか不安が生じたため、
相談させていただきました。

なので、今回当方がお尋ねしたいのは、「Tophat2で、アノテーションファイルを指定してマッピングを実施した場合、アノテーションで定義されていない領域にリードが貼りつくことはあり得るか?」という点でございます。
その観点でご意見給われれば幸いです。

(無題) 削除/引用
No.7988-2 - 2019/06/15 (土) 12:27:30 - AP
その遺伝子のゲノムアノーテーションがどういうエヴィデンスでついているかということによるんじゃないでしょうか。
実験的データがなく、ゲノムシークエンスのみから遺伝子を予測するのは基本的にはCDSの予測とスプライスの予測、それとポリA付加シグナルの予測だと思います。だからそもそも真の転写領域全体を正しくアノテーションしているとは限らない。むしろ、実験的データで補っていくべきものなんじゃないかな。

それに、真核生物ではきっちりとした転写終結は決まっていないので、リードスルーは普通にあります。遺伝子によって、あるいはcDNAの調製方法などによてはリードスルーを引っ掛けた可能性も考えられます。

RNAseqでリードが遺伝子外に張り付くことはありますでしょうか? 削除/引用
No.7988-1 - 2019/06/15 (土) 10:34:18 - 徒弟
初めて投稿させていただきます。よろしくお願いいたします。

RNAseqを初めて行いました。

fastqをTrommomaticでトリミングしてから、
(今となっては古いソフトウェアだと聞いてますが)tophat2でマッピングしてます。
マッピングの際、アノテーションファイルとして、iGenomesのgene.gtfを指定してます。
リファレンス配列はNCBI37.2のヒトの配列です。


マッピングの終わったbamファイルをIGVで見ていたところ、
遺伝子内のエクソンにリードが貼りついていたのは良いのですが、
それ以外にも遺伝子のすぐ外側(下流側5kb以内)にも遺伝子内と同程度のリードが
貼りついていることがありました。

tophat2の原理を良く存じませんが、
アノテーションファイルに基づいてマッピングを行う以上、
遺伝子のexonやその近隣にしかリードは貼りつかないと思っていましたが、
このように遺伝子外数kbにリードが貼りつくことはありえるのでしょうか?

ご教示いただければ幸いです。

9件 ( 1 〜 9 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を

このトピックにメッセージを投稿する
名前 
メール   アドレス非公開
   タイトル 
本文      
設定  クッキーを保存(次回の入力の手間を省けます)
上に上げない(トピックの一覧で一番上に移動させません)
解決(問題が解決した際にチェックしてください)
暗証  半角英数字8-12文字の暗証番号を入れると、あとで削除、修正ができます。
送信 

〔使い方〕
  • 「アドレス非公開」をチェックすれば、自分のメールアドレスを公開しないで他の方からメールを受け取れます。
  • 問題が解決した際には、解決ボタンをチェックして解決した旨のコメントをつけてください。これは、初めにトピックを作った人と管理人のみが可能です。
  • 半角カタカナ、機種依存文字(全角ローマ数字、○の中の数字等)は文字化けの原因となりますので使わないでください。