Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 新しいテーマで話を始める場合、質問をする場合は「新しいトピックを作る」から書き込みをしてください。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

新しいトピックを作る | トピック一覧 | 研究留学ネットに戻る

ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

遺伝子名の意味(CTG7とは?) トピック削除
No.2030-TOPIC - 2013/05/25 (土) 17:14:31 - 遺伝子
いつも参考にさせていただいております。

とても基本的なことですが、
調べてもわからなかったので質問させていただきました。
NCBIのNucleotide BLAST検索をして、
遺伝子名として、
Mus musculus strain C57BL/6J chromosome 12 genomic contig, GRCm38.p1 C57BL/6J MMCHR12_CTG7
と表記されていたとします。

Mus musculus :マウス
GRCm38.p1 :検索したデータベース名
MMCHR12 :マウスクロモソーム12
と判断したのですが、「CTG7」が何を意味しているのかが分かりません。
ものによっては「CTG1_2」とさらに数字が続くものもあります。

是非ご教授いただけませんでしょうか。
よろしくお願いいたします。
 
- このトピックにメッセージを投稿する -



10件 ( 1 〜 10 )  前 | 次  1/ 1. /1


(無題) 削除/引用
No.2030-12 - 2013/05/28 (火) 00:07:54 - 遺伝子
直輝さん

ありがとうございます。
確かに普通に計算すればいいですね。
どこかにThis sequence is about 80% of chromosome 19.の様なことが書かれているのかと一瞬思いました。
chromosome 19の全長の長さがわからないと思ったのですが、
検索をかければすぐに出てきました。
参考になりました、ありがとうございました。


cDNAさん

今後の参考にさせていただきます。
大変丁寧にご説明いただき、ありがとうございました。

(無題) 削除/引用
No.2030-11 - 2013/05/26 (日) 18:28:04 - cDNA
恐らく、最初に疑問に思ったであろうことについては、出てきたデータの配列の長さとblastの結果として並べてある配列の左端と右端の塩基番号を見る習慣があると勘違いがなくなると思います。

(無題) 削除/引用
No.2030-10 - 2013/05/26 (日) 17:50:42 - 直輝
http://www.ncbi.nlm.nih.gov/nuccore/372098970
を開くと一番上のLocusのところに「54517951 bp」と書いてあるので、そこから判断しました。

図で示すと、
http://asia.ensembl.org/Mus_musculus/Location/View?r=19:6813616-61331566
一番上にある染色体の赤枠で囲った部分になります。

昨日は計算せずに答えたのですが、ちゃんと計算すると、
54517951÷61431566=89%でした。

(無題) 削除/引用
No.2030-9 - 2013/05/26 (日) 17:12:45 - 遺伝子
直輝さん、cDNAさん、おおさん

ありがとうございます。
大変勉強になります。
実はこの掲示板に質問する前にblast検索をしていた時に、
既に当初の目的は達成されていました。
とある遺伝子のKOマウスを保有しておりまして、
そのgenotypeに用いるプライマーがゲノムDNAの何処に結合しているのかが気になったもので、
blast検索(blastn)をかけました。
その結果とある目的の遺伝子上にちゃんと配列が一致したので、問題なしとなっていたわけです。
(見方があっていればですが、とある遺伝子のエクソンとイントロン上にプライマーの配列が一致しました。)
そのついでに遺伝子やblast等について勉強しておこうかと思いまして、
質問させていただきました。

当配列がとある遺伝子以外にも遺伝子の配列が含まれていることは気づいてはいたのですが、
(単一遺伝子としては配列も長すぎますし、ただ知識不足で知っている遺伝子名は近傍にはみあたらなかったです)
当方の経験不足でprimer blast位しか使ったことがなかったので、
全ゲノム配列の一部という結果をだしてくるという認識がありませんでした。

実際、大変勉強になりました。
この内容を聞くのは恥ずかしいなと思っていましたが、
恥を忍んで聞いておいてよかったです。
大変ありがたいアドバイスでした。
お付き合いいただきまして、誠にありがとうございます。

さて、そのうえでさらに質問なのですが、
直輝さんのご返信の
> 2.19番染色体の80%ぐらいを含むコンティグ(遺伝子の列挙は無理)
についてなのですが、
このcontigが第19染色体の80%位を含むことは、何処に記載されているのでしょうか。

おおさんの
http://www.ncbi.nlm.nih.gov/projects/genome/assembly/grc/overlap/tpf-view.cgi?org=mouse&chr=19&asm-unit=reference&view=tpf
については、初めて見るページで何が書かれていて、何がわかるページなのか、ひいては使い方もよくわからないので、
とりあえず自分で試して勉強したうえで、伺おうかと思います。

ありがとうございます。

(無題) 削除/引用
No.2030-8 - 2013/05/26 (日) 13:14:45 - おお
http://www.ncbi.nlm.nih.gov/projects/genome/assembly/grc/overlap/tpf-view.cgi?org=mouse&chr=19&asm-unit=reference&view=tpf

(無題) 削除/引用
No.2030-7 - 2013/05/26 (日) 10:54:19 - cDNA
APさんじゃなくて申し訳ないけれども、このレベルから質問されると答える方は大変ですよ。

1.いくつかあるMMCHR19_CTGどうしの区切り
これはAPさんは既にお答えになっています。contigを調べてください。

2.MMCHR19_CTG1_2の配列内の遺伝子
3.MMCHR12_CTG7はの配列内の遺伝子
サイトの上の方に FASTA   Graphics  色のついた文字がありませんか?
Graphicsをクリックして解決しないならちょっと大変です。

Blastされたということで、クエリの由来は何でしょうか?自分で何らかの方法で取ってきた遺伝子で、その機能が全く分からないものですか?

遺伝子、と表現されているので、もしタンパク質に興味があるのでしたらblastxを走らせてみたらどうでしょうか。恐らくblastnしかやってないと想像して書いています。

何かの課題で「この配列について調べてきなさい」だったら、まずは翻訳してみるのがいいかもしれないですね。上のblastxもdatabaseをNon-redundant protein sequences (nr)を使ってると思うので、そこを変えてみる。

そしてここまでの説明で何かしらやってみて、「もっとましなアドバイスが出来ないのか?」と思うとしたら、誰か教えてくれる近くの人を見つけた方がいいです。

(無題) 削除/引用
No.2030-6 - 2013/05/25 (土) 20:18:11 - 直輝
2.19番染色体の80%ぐらいを含むコンティグ(遺伝子の列挙は無理)
3.12番染色体の60%ぐらいを含むコンティグ(同上)

(無題) 削除/引用
No.2030-4 - 2013/05/25 (土) 18:46:19 - 遺伝子
APさん

ありがとうございます。

例えば(前と違うやつですみません。いろいろなものを見ていたもので。)
Mus musculus strain C57BL/6J chromosome 19 genomic contig, GRCm38.p1 C57BL/6J MMCHR19_CTG1_2
を開いて中を見ていたところ、
gene <1..>61584
/gene="Pten"
/gene_synonym="2310035O07Rik; A130070J02Rik; AI463227;
B430203M17Rik; MMAC1; TEP1"
/note="phosphatase and tensin homolog; Derived by
automated computational analysis using gene prediction
method: BestRefseq."
/db_xref="GeneID:19211"
/db_xref="MGI:109583"
などとあり、
事実上、PTENを指しているのかと思い、遺伝子名としてしまいました。
全ゲノムの配列の一部を指しているということですね。
間違いが分かってよかったです。ありがとうございます。
ちなみにその区切りはどのように決められているのでしょうか。

また、GRCm38.p1についても間違いを訂正していただきまして、ありがとうございます。
全ゲノムデータのバージョンを指しているのですね。

私の勉強不足であまり多くの遺伝子名を知らないために、
MMCHR19_CTG1_2内にPTEN以外の遺伝子名を見つけられませんでした。
この配列はPTEN以外にも何かの遺伝子も含んでいるのでしょうか。

先に質問した、http://www.ncbi.nlm.nih.gov/nuccore/NT_039551、についてですが、
これは中身を見ても、GENE=○○とは書かれていません。
一読してみますと、
REFERENCE 3 (sites)
AUTHORS Lowe,T.M. and Eddy,S.R.
TITLE tRNAscan-SE: a program for improved detection of transfer RNA genes
in genomic sequence
JOURNAL Nucleic Acids Res. 25 (5), 955-964 (1997)
PUBMED 9023104
REMARK This is the methods paper for tRNAscan-SE.
という部分を見つけました。
これはtRNAがコードされている配列なのでしょうか。

これもまたトンチンカンな質問なのでしょうが、もしよろしければご教授いただけませんでしょうか。
よろしくお願いいたします。

分かりにくい文章になってしまったのでまとめますと、
1.いくつかあるMMCHR19_CTGどうしの区切り
2.MMCHR19_CTG1_2の配列内の遺伝子
3.MMCHR12_CTG7はの配列内の遺伝子
についてご教授いただければと思います。
あまりに無知で大変申し訳ございませんが、よろしくお願いいたします。

(無題) 削除/引用
No.2030-3 - 2013/05/25 (土) 17:54:28 - AP
これのことかな?
http://www.ncbi.nlm.nih.gov/nuccore/NT_039551
いっちゃわるいけれど、かなりトンチンカン

それは「遺伝子名」だとは言っていなくて、definitionですね。
definitionは各配列データエントリーの見出しとなるべき、そのデータがなんであるかの端的な説明です。また、当該の配列データは特定の遺伝子の配列ではなく、全ゲノム配列の一部です。



>「CTG7」が何を意味しているのかが分かりません。

CTGはcontigから来た記号でしょうけれど、単なるID番号、整理番号です。

ちなみに、contigとは個々のシークエンスデータを、オーバーラップする配列を基により長い配列につなげたものです。個々のシークエンスデータはそれほど長くないので、より長い範囲をカバーする配列はつなぎあわせてつくらなければなりません。全ゲノム配列のデータは、そういうcontigの集合です。その一員にあてがわれたID記号がMMCHR12_CTG7というわけ。

>GRCm38.p1 :検索したデータベース名
ではなくて、全ゲノムデータのrelease(バージョン、改訂)番号です。
ゲノムデータは粗々の段階からリリースされながら、改訂を重ねてリファインされています。そのデータエントリーにある記載は、どのリリースのゲノムデータをもとにしているか、ということを示しているのでしょう。

http://www.ncbi.nlm.nih.gov/assembly/GCF_000001635.21/

遺伝子名の意味(CTG7とは?) 削除/引用
No.2030-1 - 2013/05/25 (土) 17:14:31 - 遺伝子
いつも参考にさせていただいております。

とても基本的なことですが、
調べてもわからなかったので質問させていただきました。
NCBIのNucleotide BLAST検索をして、
遺伝子名として、
Mus musculus strain C57BL/6J chromosome 12 genomic contig, GRCm38.p1 C57BL/6J MMCHR12_CTG7
と表記されていたとします。

Mus musculus :マウス
GRCm38.p1 :検索したデータベース名
MMCHR12 :マウスクロモソーム12
と判断したのですが、「CTG7」が何を意味しているのかが分かりません。
ものによっては「CTG1_2」とさらに数字が続くものもあります。

是非ご教授いただけませんでしょうか。
よろしくお願いいたします。

10件 ( 1 〜 10 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を

このトピックにメッセージを投稿する
名前 
メール   アドレス非公開
   タイトル 
本文      
設定  クッキーを保存(次回の入力の手間を省けます)
上に上げない(トピックの一覧で一番上に移動させません)
解決(問題が解決した際にチェックしてください)
暗証  半角英数字8-12文字の暗証番号を入れると、あとで削除、修正ができます。
送信 

〔使い方〕
  • 「アドレス非公開」をチェックすれば、自分のメールアドレスを公開しないで他の方からメールを受け取れます。
  • 問題が解決した際には、解決ボタンをチェックして解決した旨のコメントをつけてください。これは、初めにトピックを作った人と管理人のみが可能です。
  • 半角カタカナ、機種依存文字(全角ローマ数字、○の中の数字等)は文字化けの原因となりますので使わないでください。