Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 新しいテーマで話を始める場合、質問をする場合は「新しいトピックを作る」から書き込みをしてください。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

新しいトピックを作る | トピック一覧 | 研究留学ネットに戻る

ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

RNA-seqのTopHatによるマッピングについて トピック削除
No.5665-TOPIC - 2017/01/10 (火) 13:23:11 - SK
実験医学のRNA-Seq実験ハンドブックで勉強を始めた初心者です。44ページ目の
tophat -G genes.gtf -o A549_thout --no-novel-juncs genome DRR016695_1_fil.fastq DRR016695_2_fil.fastq
を実行したところ


[2017-01-10 13:15:48] Beginning TopHat run (v2.1.1)
-----------------------------------------------
[2017-01-10 13:15:48] Checking for Bowtie
Bowtie version: 2.2.9.0
[2017-01-10 13:15:48] Checking for Bowtie index files (genome)..
Error: Could not find Bowtie 2 index files (genome.*.bt2l)

というエラーが出ます。Bowtie2Indexというフォルダは確かに存在するようですが、その中に入っているファイルは
genome.fa.fai, genome.fa, genome.2.bt2, genome.4.bt2, genome.rev.1.bt2, genome.rev.2.bt2, genome.1.bt2, genome.3.bt2
でありそもそも"bt2l"で終わるファイルは存在しないようです。(念のためファイル名をbt2からbt2lに書き替えてみるという強引なこともやってみましたが、エラーメッセージは変わりませんでした。どなたかアドバイスを頂ければ幸いです。
 
- このトピックにメッセージを投稿する -



13件 ( 1 〜 13 )  前 | 次  1/ 1. /1


ありがとうございました。 削除/引用
No.5665-14 - 2017/01/14 (土) 10:22:19 - SK
>コマンドラインでの作業を始めたばかりであればコンソールの内容をすべて保存しておくことをおすすめします。

CDさん、アドバイス有り難うございました。やってみます。

(無題) 削除/引用
No.5665-12 - 2017/01/12 (木) 03:17:08 - CD
コマンドラインでの作業を始めたばかりであればコンソールの内容をすべて保存しておくことをおすすめします。そしてコマンドの横にどこを変えたら上手く動いたかを注釈をつけておくと後々便利です。

次のステップに進めそうです。 解決済み 削除/引用
No.5665-11 - 2017/01/11 (水) 11:05:39 - SK
CDさん ありがとうございました。

次のステップに進んでいるようで、今なにやら計算しているようです。

macで動かしており、Linux系のファイルの扱いに慣れておりませんでした。
絶対パス・相対パスとリンクの作り方を勉強してみます。
このフォーラムはよく参考にしてきましたが、書き込んだのは初めてです。
こんなに早くアドバイスを受けることができ、大変感謝しております。

習うより慣れろと言いますが、習うことも重要ですね。

(無題) 削除/引用
No.5665-10 - 2017/01/11 (水) 10:17:18 - CD
~/my_rna_seq/my_rna_seq/Homo_sapiens/UCSC/hg19/Sequence/Bowtie2Index/genome

なんか重複してますね。正しくは

~/my_rna_seq/Homo_sapiens/UCSC/hg19/Sequence/Bowtie2Index/genome

(無題) 削除/引用
No.5665-9 - 2017/01/11 (水) 10:14:28 - CD
本当に/SK/my_rna_seq/Homo_sapiens/UCSC/hg19/Sequence/Bowtie2Index/genome は絶対パスになっていますか?

どのような端末を使っているかはわかりませんがLinux系だったら/Users/UserNameとか/Home/UserNameとかから始まることがほとんどではないでしょうか。

SKがSKさんのUsernameだとして、 
~/my_rna_seq/my_rna_seq/Homo_sapiens/UCSC/hg19/Sequence/Bowtie2Index/genome
と打ってみてはいかがでしょうか。


~(チルダ)はホームディレクトリの略となります。

絶対パス 削除/引用
No.5665-8 - 2017/01/11 (水) 08:50:38 - SK
試してみました。

$ tophat -G genes.gtf -o A549_thout --no-novel-juncs /SK/my_rna_seq/Homo_sapiens/UCSC/hg19/Sequence/Bowtie2Index/genome DRR016695_1_fil.fastq DRR016695_2_fil.fastq

(昨日の書き込みでは誤って/Sequence/Bowtie2Index/が/Sequence_Bowtie2Index/
になっていたので修正しました)

[2017-01-11 08:43:57] Beginning TopHat run (v2.1.1)
-----------------------------------------------
[2017-01-11 08:43:57] Checking for Bowtie
Bowtie version: 2.2.9.0
[2017-01-11 08:43:57] Checking for Bowtie index files (genome)..
Error: Could not find Bowtie 2 index files (/SK/my_rna_seq/Homo_sapiens/UCSC/hg19/Sequence/Bowtie2Index/genome.*.bt2l)

・・・同じエラーメッセージのように見えます。なかなか手強いです。

(無題) 削除/引用
No.5665-7 - 2017/01/11 (水) 01:11:35 - CD
TopHatがどうだったか、については記憶が定かではないけれども幾つかのNGS用ソフトでは相対パスを受け付けず、絶対パスが必要だった物が幾つかありました。エラーを出されるのを嫌って今では絶対パスをどのソフトでも使う癖がつきました。

相対パスではなくて、絶対パスを入れて試してみてください。

>違う形式のファイルなのでしょうか?

中身を見るにIndexファイルはあっていそうです。

gaさんありがとうございます。 削除/引用
No.5665-6 - 2017/01/10 (火) 19:29:02 - SK
./Homo_sapiens/UCSC/hg19/Sequence_Bowtie2Index/genome
に変えてみました。残念ながら結果は同じでした。

(無題) 削除/引用
No.5665-5 - 2017/01/10 (火) 19:20:29 - ga
作業ディレクトリがmy_rna_seqなら、
./Homo_sapiens/UCSC/hg19/Sequence_Bowtie2Index/genome
とすべきでは?

ありがとうございます。 削除/引用
No.5665-4 - 2017/01/10 (火) 18:07:42 - SK
CDさん、早速のご助言有り難うございました。本当に助かります。"genome" の部分は本では「マッピングインデックスのある場所と名前の指定」となっています。ここは個別に入力する必要があるわけですね(他の部分は本と全く同じ入力をすればエラーは出なかったので・・・)。さて、

$ tophat -G genes.gtf -o A549_thout --no-novel-juncs my_rna_seq/Homo_sapiens/UCSC/hg19/Sequence_Bowtie2Index/genome DRR016695_1_fil.fastq DRR016695_2_fil.fastq

と入力したところ

[2017-01-10 17:57:27] Beginning TopHat run (v2.1.1)
-----------------------------------------------
[2017-01-10 17:57:27] Checking for Bowtie
Bowtie version: 2.2.9.0
[2017-01-10 17:57:27] Checking for Bowtie index files (genome)..
Error: Could not find Bowtie 2 index files (my_rna_seq/Homo_sapiens/UCSC/hg19/Sequence_Bowtie2Index/genome.*.bt2l)

と帰ってきました。作業ディレクトリがmy_rna_seq(のはず)です。まだファイルを見つけられていないようです。やはり気になるのは、実際に存在するファイルの拡張子はbt2なのに(例えばgenome.1.bt2)、TopHatはbt2lという拡張子のファイルを探しに行っているように見えることです。違う形式のファイルなのでしょうか?versionの違いでしょうか?

(無題) 削除/引用
No.5665-3 - 2017/01/10 (火) 14:13:57 - CD
あ、もちろん自分の端末のパスを見せたくないから消した、ってなら別ですが。何れにせよエラーとしてはIndexファイルを見つけ損なったときの文言だと思います。

(無題) 削除/引用
No.5665-2 - 2017/01/10 (火) 14:12:12 - CD
その本がどういう解説をしているかはわからないのでアレですがIndex filesのディレクトリの指定に失敗していると思う。

解決策としてはIndexをワーキングディレクトリに移すか、Indexが入っているディレクトリを指定してあげる必要があるような。

genome

だけではディレクトリの指定にはなってないですよ。ローカルからのパスを付け足せばエラーは消える気がする。

RNA-seqのTopHatによるマッピングについて 削除/引用
No.5665-1 - 2017/01/10 (火) 13:23:11 - SK
実験医学のRNA-Seq実験ハンドブックで勉強を始めた初心者です。44ページ目の
tophat -G genes.gtf -o A549_thout --no-novel-juncs genome DRR016695_1_fil.fastq DRR016695_2_fil.fastq
を実行したところ


[2017-01-10 13:15:48] Beginning TopHat run (v2.1.1)
-----------------------------------------------
[2017-01-10 13:15:48] Checking for Bowtie
Bowtie version: 2.2.9.0
[2017-01-10 13:15:48] Checking for Bowtie index files (genome)..
Error: Could not find Bowtie 2 index files (genome.*.bt2l)

というエラーが出ます。Bowtie2Indexというフォルダは確かに存在するようですが、その中に入っているファイルは
genome.fa.fai, genome.fa, genome.2.bt2, genome.4.bt2, genome.rev.1.bt2, genome.rev.2.bt2, genome.1.bt2, genome.3.bt2
でありそもそも"bt2l"で終わるファイルは存在しないようです。(念のためファイル名をbt2からbt2lに書き替えてみるという強引なこともやってみましたが、エラーメッセージは変わりませんでした。どなたかアドバイスを頂ければ幸いです。

13件 ( 1 〜 13 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を

このトピックにメッセージを投稿する
名前 
メール   アドレス非公開
   タイトル 
本文      
設定  クッキーを保存(次回の入力の手間を省けます)
上に上げない(トピックの一覧で一番上に移動させません)
解決(問題が解決した際にチェックしてください)
暗証  半角英数字8-12文字の暗証番号を入れると、あとで削除、修正ができます。
送信 

〔使い方〕
  • 「アドレス非公開」をチェックすれば、自分のメールアドレスを公開しないで他の方からメールを受け取れます。
  • 問題が解決した際には、解決ボタンをチェックして解決した旨のコメントをつけてください。これは、初めにトピックを作った人と管理人のみが可能です。
  • 半角カタカナ、機種依存文字(全角ローマ数字、○の中の数字等)は文字化けの原因となりますので使わないでください。