BioTechnicalフォーラム [シーケンス結果の扱い方]

バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。

新しいテーマで話を始める場合、質問をする場合は「新しいトピックを作る」から書き込みをしてください。

質問に対して解答できる方は是非、書き込んで下さい。

このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

新しいトピックを作る　|　トピック一覧　|　研究留学ネットに戻る

ひとつ前のフォーラム（readのみ）

このスレッドをはてなブックマークに追加

シーケンス結果の扱い方

トピック削除

No.9427-TOPIC - 2021/01/12 (火) 23:36:40 - こんちゅう

生物学初心者です。

以前、ある昆虫の28SリボソームDNAを抽出・PCRし、シーケンスを外注しました。（プライマーは、28SniphF1・28SniphR1を使用しました。）

本日、結果が帰ってきたのですが、ファイルには「〇〇.F.fasta、〇〇.R.fasta、〇〇.F.ab1、〇〇.R.fasta」とありました。FとRそれぞれ2つのプライマーのfastaファイルをどうすれば、系統樹などを書く際に用いるfastaファイルにできるのでしょうか。無知ですみません。

またシーケンス結果のab1は、どのような解析に使えるのでしょうか。
　

- このトピックにメッセージを投稿する -

全15件 ( 1 ～ 15 )　前 | 次　1/ 1. /1

(無題)

No.9427-15 - 2022/10/05 (水) 01:40:11 - おお

リンク貼り忘れた
https://www.vanderbilt.edu/wolbachiaproject/wp-content/uploads/sites/267/2019/03/Lab5_Bioinformatics_I_ProjectGuide.pdf

昔の知識で最近は改善されたりしているならすいません

(無題)

No.9427-14 - 2022/10/05 (水) 01:39:05 - おお

>[Re:13] あさんは書きました :
> 横から質問で申し訳ないのですが、なぜFのプライマーではプライマーとその付近の配列は読めないのでしょうか？
> 遺伝子工学初心者なのでできるだけわかりやすく教えていただけると幸いです。

ここの５ページ目のクロマトグラムをみれば一目瞭然かとおもいます。
電気泳動で長さを計りながら、その位置の傾向を検出していますから、例えば１％のアガロースでDNAを検出したとき、９０bpsと９５bpsが分離できるかという問題と同様だと思います。Rについても同様です

(無題)

No.9427-13 - 2022/10/04 (火) 20:58:48 - あ

横から質問で申し訳ないのですが、なぜFのプライマーではプライマーとその付近の配列は読めないのでしょうか？
遺伝子工学初心者なのでできるだけわかりやすく教えていただけると幸いです。

(無題)

No.9427-12 - 2021/01/16 (土) 03:00:44 - おお

わたしの横からの質問に回答ありがとうございました。漠然とわかっていましたが具体的にかいとうしていただけて感謝します。この質問のもう一つの意図は

解析の段階でこのようなことを考慮しないといけないということだから、それに合うようなプライマーデザインがされていて然りです。実験計画の段階で関わった人に相談するか、参考にした論文があるならそういうのをしっかり見てください。

(無題)

No.9427-11 - 2021/01/15 (金) 10:23:29 - s

> 例えば読めている（解析に使う）配列の長さがまちまちだったりすると、全く同じ配列でも長さの違いで相同性などの評価（数値）が違ってくると思っています。ですから配列のどこからどこまでと決めてすべてその長さで見ないと結果がぶれないかなと思っているのですが実際どうしているのでしょう。

長さの異なる部分については特別な扱いをすることは可能だけど、一般的には全ての配列の長さをそろえると思います。したがって短い配列を含めて系統解析をすると、他の配列の情報が有効に利用されないという問題が起きます。統計の欠損値の扱いと同様だと理解しています。ギャップについても同様。

(無題)

No.9427-10 - 2021/01/14 (木) 10:40:54 - seventh

両端から読んでつながるようならアセンブルしてから比較解析にかけます。
サンガー用のアセンブラーとしては有料のATSQ、無料のape、genestudioなんかがあるので適当なものを使うのがよいと思います。

テキスト出力の配列を比較して繋げるのはベースコールのqualityがわからないのであまりよくありません。重なり部分で塩基の違いがあった場合、最終的には波形のしっかり読めている方を目で見て選択する必要があります。

系統樹を書く場合はアラインメント後に末端をトリミングするなどして相同な領域を比較しないと正しくない結果がでることがあります。

(無題)

No.9427-9 - 2021/01/14 (木) 09:11:24 - おお

ちょっと横からの質問になっちゃいますが、
例えば読めている（解析に使う）配列の長さがまちまちだったりすると、全く同じ配列でも長さの違いで相同性などの評価（数値）が違ってくると思っています。ですから配列のどこからどこまでと決めてすべてその長さで見ないと結果がぶれないかなと思っているのですが実際どうしているのでしょう。

片方のプライマーのデーターをつかって一つは７００bまで読めているけど、ほかは８００bまで読めているというのをそのまま解析にかけちゃうとどうかなということです。

極端な話２０bで１塩基違った物があるのと１００bで一個だと違いますよね。長さで補正をかける？それでもぶれそうですよね。

(無題)

No.9427-8 - 2021/01/14 (木) 08:53:51 - s

Large subunit rRNAのような膨大な過去のデータの蓄積があり、標準的なアラインメントや樹形が確定しているものについて、自分のデータをひとつ足して(MEGAなりなんなりで)系統解析を一からやり直すというのは非現実的だと思うけど。

そもそも新しい配列かどうかもわからないし、新しい配列だとしても、既知のどのOTUのそばに来るかを調べれば終わりでしょう。

(無題)

No.9427-7 - 2021/01/14 (木) 01:25:06 - がぁが

PCR産物のサイズはどのくらいなのでしょうか。
サンガー法では、750塩基くらいまでしか一つながりで配列を読めませんので、それよりもPCR産物が大きい場合、全長配列を知るためには、複数のプライマー（例えば、FおよびRプライマー）を使って読んだ配列を、その重なりを利用して接続して全長配列を完成させます。

手順は
(1)Sequence Scanner（シーケンサーのメーカが配布しているab1ファイルを読むソフト、ユーザー登録が必要ですが、無料です。）のようなソフトを使って、生データ（波形）を確認し、読み取った配列のうち信頼できる領域を抜き出す。
(2)Rプライマーで読んだ配列を相補配列に変換した上で逆から読むと（そのような処理はネット上にあるツールで行えます）Fプライマーで読んだ配列と一致する部分があるはずなので、そこでつないで全長配列を完成させる。おおさんがおっしゃるように、プライマーの部分と、そのすぐ下流数十塩基は読めませんので、例えばFプライマーとすぐ下流は、Rプライマーで読んだ配列から決定します。
(3)完成した配列とgenbankにある配列を一つのテキストファイル（fasta形式）にまとめる。

>配列名1
配列

>配列名2
配列
.
.
.

(4)MEGAなどのソフトで(3)のファイルを読み込んでマルティプルアライメントを行う。ついでお好みの方法で系統樹作成

完成した配列がgenbankにある配列と似ても似つかず、うまくいかないときは完成した配列を相補配列にして逆から読んだ配列に変換してやり直してみる。

図を描いて説明するとわかりやすいと思いますが、文章で説明するのは大変ですね...

(無題)

No.9427-6 - 2021/01/13 (水) 17:51:43 - s

rDNAの場合もsense鎖というのか知りませんが、常識的に考えてrRNAと同じ配列になるほうの鎖を使うのだと思います。

解析はSILVAなどに自分の配列だけ投げれば、やってくれるのでは。

https://www.arb-silva.de/aligner/

(無題)

No.9427-5 - 2021/01/13 (水) 17:49:25 - おお

まず、FとRで両方で同じ配列になっていてちゃんと読めているか確認してください。

念の為ab1ファイルを全部取り寄せて、波形データーを見てください。そのファイルが開けられないなら、波形データーをPDFとかJPEGとかに変換してもらって送ってもらうといいかもしれません。波形データーはちゃんと読めているか、同じものなのにFとRで違うところがあった場合どちらがもっともらしいか、追加で配列を確認したほうがいいかの指標になります。

Rからの配列揃えても分析はできます。でも普通は配列を提示するとき＋鎖の配列を表示します。なので多分データーベースはFからの配列です（あなたのFの定義次第だけど）。

たとえあなたの配列がデーターベースと逆の鎖を読んでいてもDNAレベルでは相同性は変わらない気がしますが、この手の仕事はしてないので詳しい人に聞いてください。

っとここまで書いて気がついたのですが、
もしFの配列を使ったときFのプライマーとその直近の配列は読めてないです。RのプライマーだとFプライマーで読めるところが読めてないことになります。そう考えますと、どこの配列が読みたくてどのようにプライマーを設定したのか確認する必要があります。Fプライマー近傍とRプライマー近傍のデーターが必要ならFとRのデーターを合わせて全体がカバーできている配列を作ってから解析する必要があるかもしれません。

(無題)

No.9427-4 - 2021/01/13 (水) 17:24:06 - ど素人

> 2つのプライマーでDNA配列を読んだ際、FかR、どちらか一方を使用すれば、
> 系統樹はかけるのでしょうか。

正しく配列が解析できているなら、どちらを使ってもよろしいでしょうが、どちらか一方 (典型的には R) は相補鎖の塩基配列と思われるので、順方向の配列への変換が必要です。

> どの方向から読んだ配列なのでしょうか。

お手元の塩基配列 (F、R) と比較してみれば分かると思います。
(比較できないほど違う配列なら系統樹はつくれないと思います)

たぶん現在のレベルからして、研究室の誰かに教わるべきですね。
誰も教えてくれる人がいないのでしょうか。

(無題)

No.9427-3 - 2021/01/13 (水) 14:46:28 - こんちゅう

お回答ありがとうございます。

私の質問の書き方が悪く申し訳ございません。

2つのプライマーでDNA配列を読んだ際、FかR、どちらか一方を使用すれば、系統樹はかけるのでしょうか。

またgenebankに掲載されているfastaファイルも混ぜて系統樹を書きたいのですが、genebankにはファイルが一つしかありません。どの方向から読んだ配列なのでしょうか。

分かる方がいらっしゃれば、回答していただけると幸いです。

(無題)

No.9427-2 - 2021/01/13 (水) 00:57:50 - おお

.ab1は生のシーケンスデーターですね。波形データーなど見れるようになっていると思います。必要なら問い合わせて他のファイルフォーマットを再度送ってもらったらどうでしょうか。
.fastaの拡張子がついているのはよくわからないですけど、FASTAはテキストベースなので一度テキストエディター系のソフトで開いてみてはどうでしょうか。そのファイルが系統樹作成ソフトで開かないならテキストとして保存して読み込むか、ソフトによってはそのまま中身をコピーしてペイストするかすればいいと思います。
＞配列名（改行）
配列
という風になっていればFASTAとして認識されます。テキストベースなどでぶっちゃけテキストファイルで上記のようにかけばFASTAフォーマットとして成り立ちます。

シーケンス結果の扱い方

No.9427-1 - 2021/01/12 (火) 23:36:40 - こんちゅう

生物学初心者です。

以前、ある昆虫の28SリボソームDNAを抽出・PCRし、シーケンスを外注しました。（プライマーは、28SniphF1・28SniphR1を使用しました。）

本日、結果が帰ってきたのですが、ファイルには「〇〇.F.fasta、〇〇.R.fasta、〇〇.F.ab1、〇〇.R.fasta」とありました。FとRそれぞれ2つのプライマーのfastaファイルをどうすれば、系統樹などを書く際に用いるfastaファイルにできるのでしょうか。無知ですみません。

またシーケンス結果のab1は、どのような解析に使えるのでしょうか。

全15件 ( 1 ～ 15 )　前 | 次　1/ 1. /1

パスワードを入力してチェックした記事を

チェックした記事を

〔使い方〕

「アドレス非公開」をチェックすれば、自分のメールアドレスを公開しないで他の方からメールを受け取れます。
問題が解決した際には、解決ボタンをチェックして解決した旨のコメントをつけてください。これは、初めにトピックを作った人と管理人のみが可能です。
半角カタカナ、機種依存文字(全角ローマ数字、○の中の数字等)は文字化けの原因となりますので使わないでください。