Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 新しいテーマで話を始める場合、質問をする場合は「新しいトピックを作る」から書き込みをしてください。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

新しいトピックを作る | トピック一覧 | 研究留学ネットに戻る

ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

RNA-Seqのリファレンスゲノムについて トピック削除
No.7225-TOPIC - 2018/09/12 (水) 12:44:58 - 猫鮫
現在ナノポアシークエンサーの導入を検討しており、その解析の練習として公開されているデータを使用してゲノムのマッピングなどを行っております。

ゲノムマッピングの際に使用するリファレンスゲノムのFASTAファイルをGeneCodeやNCBIなどからダウンロードしました。しかし、どのサイトでダウンロードしたものでもLinux上でlessコマンドで閲覧すると、配列が全てNになっており、マッピングが出来ない状態です。
どのようにしたら正常なリファレンスゲノムが得られるのでしょうか?

Linuxを使うのも、こういった遺伝子解析においても初心者ですので、詳しい方がいらっしゃるようでしたら、ご教授願います。
 
- このトピックにメッセージを投稿する -



7件 ( 1 〜 7 )  前 | 次  1/ 1. /1


(無題) 解決済み 削除/引用
No.7225-7 - 2018/09/14 (金) 21:40:27 - 猫鮫
UCSCからダウンロードしたもので行ってみたところ、上手くいきました。

また、mm10を確認したところ、皆さまが仰られる通り染色体末端ではNが連続していましたが、その領域以外にACGTの配列が確認できました。

ご回答くださった皆様、ありがとうございました。

(無題) 削除/引用
No.7225-6 - 2018/09/14 (金) 12:02:58 - MTP
「マッピングをした結果できなかった」のではなく、「全てNに見えたため、マッピングを行っていない」ということでしょうか。
seventhさんの仰る通り、どのサイトのリファレンスゲノムでも染色体末端はNが連続していると思います。
これはかなりの長さになります(mm10のChr1ならば頭からちょうど3mb)ので、目視で確認されたことで勘違いされたのではないでしょうか。

(無題) 削除/引用
No.7225-5 - 2018/09/13 (木) 17:14:45 - qq
どうせリファレンスなのだから、どこのFTPのどのファイルか明示しましょうよ。

(無題) 削除/引用
No.7225-4 - 2018/09/12 (水) 17:49:47 - 猫鮫
解答ありがとうございます。

FASTAファイルは挙げて頂いたサイトでダウンロードしたものです。アノテーションファイルなども同じサイトからダウンロードしています。

先程もう一度lessコマンドで開いて配列を見てみたのですが、ほぼNの繰り返しの中に稀にACGTの配列が現れるのですが、リファレンスゲノムの配列はそのようなものが一般的なのでしょうか?

(無題) 削除/引用
No.7225-3 - 2018/09/12 (水) 15:43:27 - seventh
テスト用ということでしたらIlluminaのiGenomeでモデル生物リファレンスが1式ダウンロードできます。
http://jp.support.illumina.com/sequencing/sequencing_software/igenome.html

Nしかないとのことですが、単に未確定であるかリピートがマスクされているだけではないでしょうか。染色体両端についてはよくそういうことがあります。

(無題) 削除/引用
No.7225-2 - 2018/09/12 (水) 14:31:49 - MTP
そのfastaファイルはどのようにダウンロードされましたか?

ちなみに私はGENCODEやNCBIを用いたことはないですが、いつもはEnsembl(https://asia.ensembl.org/info/data/ftp/index.html)やUCSC(mm10ならhttp://hgdownload.cse.ucsc.edu/goldenPath/mm10/bigZips/)からダウンロードしています。
Chromosomeの書き方にも違いがあるため、アノテーションファイルも同じところから持ってきた方が良いです。

RNA-Seqのリファレンスゲノムについて 削除/引用
No.7225-1 - 2018/09/12 (水) 12:44:58 - 猫鮫
現在ナノポアシークエンサーの導入を検討しており、その解析の練習として公開されているデータを使用してゲノムのマッピングなどを行っております。

ゲノムマッピングの際に使用するリファレンスゲノムのFASTAファイルをGeneCodeやNCBIなどからダウンロードしました。しかし、どのサイトでダウンロードしたものでもLinux上でlessコマンドで閲覧すると、配列が全てNになっており、マッピングが出来ない状態です。
どのようにしたら正常なリファレンスゲノムが得られるのでしょうか?

Linuxを使うのも、こういった遺伝子解析においても初心者ですので、詳しい方がいらっしゃるようでしたら、ご教授願います。

7件 ( 1 〜 7 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を

このトピックにメッセージを投稿する
名前 
メール   アドレス非公開
   タイトル 
本文      
設定  クッキーを保存(次回の入力の手間を省けます)
上に上げない(トピックの一覧で一番上に移動させません)
解決(問題が解決した際にチェックしてください)
暗証  半角英数字8-12文字の暗証番号を入れると、あとで削除、修正ができます。
送信 

〔使い方〕
  • 「アドレス非公開」をチェックすれば、自分のメールアドレスを公開しないで他の方からメールを受け取れます。
  • 問題が解決した際には、解決ボタンをチェックして解決した旨のコメントをつけてください。これは、初めにトピックを作った人と管理人のみが可能です。
  • 半角カタカナ、機種依存文字(全角ローマ数字、○の中の数字等)は文字化けの原因となりますので使わないでください。