Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 新しいテーマで話を始める場合、質問をする場合は「新しいトピックを作る」から書き込みをしてください。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

新しいトピックを作る | トピック一覧 | 研究留学ネットに戻る

ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

スプライシングのデータベース トピック削除
No.8907-TOPIC - 2020/06/10 (水) 12:08:49 - BSSP
この分野にそれほど精通しているわけではない者なのですが、スプライシングにおけるエクソンーエクソンジャンクションの位置や5', 3'スプライス部位がどこに当たるかを一覧で表示してくれるような便利なデータベースというのはどこかに存在しますでしょうか?

また、上記の情報はNCBIのGenBankで(一覧性はないものの)バシッと表示してくれる類の情報ですが、ブランチポイントがどの塩基かというのは表示されないように思います。ブランチサイトがどこに当たるかを網羅的にリストアップしてくれるようなデータベースも、もしご存知でしたらご教示いただけますと大変ありがたく存じます。

よろしくお願いいたします。
 
- このトピックにメッセージを投稿する -



4件 ( 1 〜 4 )  前 | 次  1/ 1. /1


(無題) 削除/引用
No.8907-4 - 2020/06/12 (金) 04:00:32 - BSSP
おおさん、どうもありがとうございます。理研のデータベースを調べてみましたが、イマイチ見つかりませんでした・・・。

代わりにIntronDBというデータベースを見つけましたが、結構よくまとまっていたものの、ドナー/アクセプターサイトの末端2塩基ずつしか配列情報が載っていない(つまり大多数がGT/AG)のがとても残念なポイントでした。

http://www.nextgenbioinformatics.org/IntronDB/download.php

もう少し上流・下流の配列もリスト化されていたら良かったのですが・・・。



話は戻ってgtf・gff3ファイルなんですが、前述の通り、ensemblからダウンロードしたこれらのファイルは遺伝子座のみが表示されていて、配列が載っていません。

ちょうど、以下のような行が数十万行存在するわけですが、「表示されている遺伝子座から、対応する塩基配列を行末あるいは次の行なんかに貼り付ける」なんてことは可能だったりしますでしょうか・・・?

1Ensemblchromosome1248956422...ID=chromosome:1;Alias=CM000663.2,chr1,NC_000001.11
###
1ensemblmRNA1219014149.+.ID=transcript:17672;Name=GENSCAN00000017672;version=1
1ensemblexon1219012227.+.Parent=transcript:17672;Name=127823;exon_id=127823;version=1
1ensemblexon1261312721.+.Parent=transcript:17672;Name=127824;exon_id=127824;version=1
1ensemblexon1405114149.+.Parent=transcript:17672;Name=127825;exon_id=127825;version=1

バイオインフォマティクスにも強くないので凝ったことはできないのですが、いい案がありましたら勉強してやってみようと思うので、アイディアをお持ちの方がいらっしゃいましたらご助力いただけると幸いです。

(無題) 削除/引用
No.8907-3 - 2020/06/11 (木) 20:03:49 - おお
理研がゲノムワイドでスプライシング部位予測などやっていたのでそういうデーターベースを公開してないだろうか。

(無題) 削除/引用
No.8907-2 - 2020/06/11 (木) 09:20:42 - BSSP
調べた限りで思いついたこととしては、ensemblからexonの位置がannotateされたgtfファイルをダウンロードする(ftp://ftp.ensembl.org/pub/release-100/gtf/homo_sapiens/Homo_sapiens.GRCh38.100.abinitio.gtf.gz)→このファイルからは遺伝子名も配列も分からないので、Genomeブラウザに染色体番号と遺伝子座を入力して、実際の配列を逐一チェック

…という感じなのですが、配列の一覧性が全くなく、あまりにもスマートではないやり方です。

gtfファイルについても詳しくないのですが、これは、特定のビューアで見たら遺伝子座に対応した配列が表示されたりしないものなのでしょうか・・・?

gtfファイルのビューアで検索したら出てきたIGV(https://igv.org/app/)で試したところ、イマイチ上手くいきませんでした。やり方が良くないのかもしれません。


一方ブランチポイントについてですが、完全に全てを網羅しているわけではなさそうではあるものの、多くのブランチ部位の配列がまとめられている論文を見つけました。

http://fairbrother.biomed.brown.edu/data/Lariat2016/

上記著者のラボのサイトにExcelファイルとしてアップされていて便利ですが、こちらも遺伝子名が併記されていないのがやや残念なポイントかもしれません。遺伝子座の一覧から、そこに存在する遺伝子名を取得する上手い方法は何かありますでしょうか・・・?


上記に限らず、どなたかもっとスマートなやり方を思いつく方がいらっしゃいましたら、知見を共有いただけると大変助かります。

改めてよろしくお願いいたします。

スプライシングのデータベース 削除/引用
No.8907-1 - 2020/06/10 (水) 12:08:49 - BSSP
この分野にそれほど精通しているわけではない者なのですが、スプライシングにおけるエクソンーエクソンジャンクションの位置や5', 3'スプライス部位がどこに当たるかを一覧で表示してくれるような便利なデータベースというのはどこかに存在しますでしょうか?

また、上記の情報はNCBIのGenBankで(一覧性はないものの)バシッと表示してくれる類の情報ですが、ブランチポイントがどの塩基かというのは表示されないように思います。ブランチサイトがどこに当たるかを網羅的にリストアップしてくれるようなデータベースも、もしご存知でしたらご教示いただけますと大変ありがたく存じます。

よろしくお願いいたします。

4件 ( 1 〜 4 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を

このトピックにメッセージを投稿する
名前 
メール   アドレス非公開
   タイトル 
本文      
設定  クッキーを保存(次回の入力の手間を省けます)
上に上げない(トピックの一覧で一番上に移動させません)
解決(問題が解決した際にチェックしてください)
暗証  半角英数字8-12文字の暗証番号を入れると、あとで削除、修正ができます。
送信 

〔使い方〕
  • 「アドレス非公開」をチェックすれば、自分のメールアドレスを公開しないで他の方からメールを受け取れます。
  • 問題が解決した際には、解決ボタンをチェックして解決した旨のコメントをつけてください。これは、初めにトピックを作った人と管理人のみが可能です。
  • 半角カタカナ、機種依存文字(全角ローマ数字、○の中の数字等)は文字化けの原因となりますので使わないでください。