Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 新しいテーマで話を始める場合、質問をする場合は「新しいトピックを作る」から書き込みをしてください。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

新しいトピックを作る | トピック一覧 | 研究留学ネットに戻る

ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

サンガーシーケンスでヘテロか微妙な時の判断 トピック削除
No.12139-TOPIC - 2024/02/06 (火) 13:17:47 - りすざる
初めまして。
うまくまとめられず、長い文章になってしまいましたので2つに分割させていただきます。
ある哺乳類の口内細胞から抽出したDNAを用いて、とある遺伝子のSNPの探索を行っています。100 個体以上からDNAを得られていて、各個体における目的遺伝子の塩基配列をサンガーシークエンスで読んでおります。
得られた波形データにおいて、二つの塩基(AとG)のピークが重なっているところがあり(個体によっては目視で見逃してしまうくらいピッタリ重なっている)、これをA/Gのヘテロ接合と判定しています。しかし、いくつかの個体のDNAでは、Aのピークに、その4分の1ほどの高さのGのピークが重なっている波形データ(面積比4:1)が得られました。これをAのホモ接合なのか、AとGのヘテロ接合なのか判断するのが非常に難しく、大変悩みました。そこでPCRからやり直すと、一部の個体では、Gの波形が消えてA/Aのホモ接合を示したり、2つのピークが重なるA/Gのヘテロ接合を示すといった綺麗な結果が得られたのですが、残りの個体では4回ほどPCRからやり直してシークエンスを行っても、4回ともAとGの面積比が4:1ほどの波形データが繰り返し得られました。これは逆方向から読んだ場合も全く同じ結果になっていました(TとCが4:1)。
PCRの段階でAを持つアレルが偶然多く増幅された可能性も考えたのですが、その上流にある別のSNPでは4回ともピタリとピークが重なるヘテロ接合が見られたことから、どうやらどちらのアレルも同じ量だけ増幅されているようです。シークエンサーの会社のHPや、サンガーシーケンスについてまとめた論文にも当たりましたが、このような現象についての記載はありませんでした。
 
- このトピックにメッセージを投稿する -



35件 ( 1 〜 20 )  前 |  1/ 1. 2. /2


ありがとうございました。 解決済み 削除/引用
No.12139-36 - 2024/02/20 (火) 18:23:36 - りすざる
ご回答、アドバイスくださった皆様、本当にありがとうございました!!!

波形の解釈にとどまらず、非常に多くのことを教えてくださり、大変勉強になりました。
私自身につきましても、助けられてばかりではなく他の研究者の力になれるよう、これからも研鑚を積んでまいります。

また機会があれば、皆様何卒よろしくお願いいたします。

(無題) 削除/引用
No.12139-35 - 2024/02/15 (木) 16:01:11 - りすざる
totoさん、ありがとうございます。
返信が遅くなってしまい、申し訳ございません。

>NGSのです。basecallされた生データ(コンセンサス配列でなく)をigvを使ってリファレンスゲノム配列に対してアラインさせてみると、探すまでもなく普通にそういう領域がintronに多くみれます。そういう生データはネットにも大量にあるでしょう。

NGSでのご経験であること、承知しました。私自身はまだNGSを用いた研究はしたことがないのですが、次に研究を行うとすれば、是が非でもNGSを使って大規模なゲノムデータを取り扱いたいと目論んでいたところでありまして、大変勉強になります。バイオインフォマティクスの知識をつけて、そのような生データも見てみます。

>NGSや増幅の技術的理由はともかくとして、すべての細胞が全く同じゲノム配列を持ってるわけではないという話は、一細胞のNGSからよく出てます。こちらの総説を参照下さい

このような文献を探していました!自分の知識が乏しかったり、検索キーワードが偏っていたためか、たどり着けずにおりました。また、今回の質問とは関係のない部分でも、大変勉強になる総説でした。教えてくださいまして、本当にありがとうございます!

>それから、AIで調べるときはchatGPTならGPT4やプラグインが使える有料版か、フリーのなら、perplexity、あとclaude2もこういう検索に使えます。他にもいろいろあるようです。おかしな回答がでてきたらだめ出しをして、しつこくやるとまともな答えがでてきますよ。

GPT3.5ではやや性能が物足りないことや、自分がそもそもAIを使いこなせてないことは痛感しておりました。フリーにのAIの方は、どちらも使ったことのないもので、これから使ってみます。このようなツールに関するアドバイスまでいただき、本当にありがとうございます。

大袈裟ではなく、非常に多くのことを学ばせていただきました。
改めまして、本当にありがとうございます。

(無題) 削除/引用
No.12139-34 - 2024/02/14 (水) 20:32:16 - toto
それから、先に聞かれていた件で、NGSや増幅の技術的理由はともかくとして、すべての細胞が全く同じゲノム配列を持ってるわけではないという話は、一細胞のNGSからよく出てます。こちらの総説を参照下さい。
www.frontiersin.org/journals/genetics/articles/10.3389/fgene.2019.00008/full

(無題) 削除/引用
No.12139-33 - 2024/02/14 (水) 09:46:47 - toto
> やりとりが長くなってしまい申し訳ないのですが、totoさんが前半部分で述べられている経験は、次世代シーケンサーを用いた際のものでしょうか?それともサンガーシーケンスにおける経験なのでしょうか?

NGSのです。basecallされた生データ(コンセンサス配列でなく)をigvを使ってリファレンスゲノム配列に対してアラインさせてみると、探すまでもなく普通にそういう領域がintronに多くみれます。そういう生データはネットにも大量にあるでしょう。

それから、AIで調べるときはchatGPTならGPT4やプラグインが使える有料版か、フリーのなら、perplexity、あとclaude2もこういう検索に使えます。他にもいろいろあるようです。おかしな回答がでてきたらだめ出しをして、しつこくやるとまともな答えがでてきますよ。

(無題) 削除/引用
No.12139-32 - 2024/02/14 (水) 02:25:42 - りすざる
totoさん、ありがとうございます。

>ほぼほぼintronのなかでですが、リピートがおおいと特に。が、私が今見てるゲノム配列でそういう不均衡な分配の箇所は、メチル化を受けそうな配列で、またbasecallingに失敗してるリードが多い箇所もあり、技術的な理由によることが多いそうです。イルミナだとほかにalignmentのミスもあるでしょう。また微量ゲノムの場合は増幅によるバイアスもあるでしょうし。

ホモポリマーをはじめとする反復配列や、メチル化(を受けそうな)領域など、そもそものPCRでの増幅が困難な領域で、不均衡なアレルの分配を示すヘテロが見られるということですね。確かにそのような箇所では非常に不平衡な分配が起こり得そうです。多くの可能性を提示してくださり、本当にありがとうございます。大変多くのことを勉強させていただきました。
やりとりが長くなってしまい申し訳ないのですが、totoさんが前半部分で述べられている経験は、次世代シーケンサーを用いた際のものでしょうか?それともサンガーシーケンスにおける経験なのでしょうか?少し気になったので、教えていただけますと幸いです。

>がんでない個体ではあまりないでしょうが、HeLaのような培養がん細胞で染色体が3本以上あるような細胞ではありえますね。技術的な原因と切り分けないといけないで面倒ですが。

恥ずかしいことに、がん細胞で異数体化が見られることを存じておりませんでした。確かにそのような場合は3つのアレルが現れますね。技術的な要因も考慮するとなると、正直かなり面倒そうだという感想です。

(無題) 削除/引用
No.12139-31 - 2024/02/14 (水) 00:11:57 - toto
> ChatGPTで調べたところ、技術的なことに関しては、シーケンスの読み取りエラー、アプリコンの歪み?によるバイアス等がヒットしました。私の今回のサンプルではこのようなことは起こっていなさそうですが、確かに遺伝子の塩基配列によっては起こりそうな気もします。また、それ以外の要因については、ずっと議論に上がっていたように後天的に発生する新たな突然変異がヒットしました。totoさんが仰られていたのは主に上記のようなことなのでしょうか?

ええ、それもあります。ほぼほぼintronのなかでですが、リピートがおおいと特に。が、私が今見てるゲノム配列でそういう不均衡な分配の箇所は、メチル化を受けそうな配列で、またbasecallingに失敗してるリードが多い箇所もあり、技術的な理由によることが多いそうです。イルミナだとほかにalignmentのミスもあるでしょう。また微量ゲノムの場合は増幅によるバイアスもあるでしょうし。

> また、3つのアレルが存在する(>A:C:T=2:6:2)というのは、遺伝子重複や偽遺伝子のことを仰られているのでしょうか?それとも1個体において同一の遺伝子の中に、人為的な介入なく3つのアレルが存在するということでしょうか?後者の場合、私の調べ方が悪く、信頼できるソースに辿り着けませんでした。もし何か文献やWebサイトなどご存知でしたら、教えていただけませんでしょうか。

がんでない個体ではあまりないでしょうが、HeLaのような培養がん細胞で染色体が3本以上あるような細胞ではありえますね。技術的な原因と切り分けないといけないで面倒ですが。

(無題) 削除/引用
No.12139-30 - 2024/02/13 (火) 19:21:05 - りすざる
totoさん、ありがとうございます。

>ヒトゲノムを読むと、A:G=3:7とか、A:C:T=2:6:2とかになってるところが特にexon以外でわりとよく見つかります。このようなモザイクになる理由は技術的なことも含めていろいろあります。ネットやAIで調べるとすぐ出てきますよ。

ChatGPTで調べたところ、技術的なことに関しては、シーケンスの読み取りエラー、アプリコンの歪み?によるバイアス等がヒットしました。私の今回のサンプルではこのようなことは起こっていなさそうですが、確かに遺伝子の塩基配列によっては起こりそうな気もします。また、それ以外の要因については、ずっと議論に上がっていたように後天的に発生する新たな突然変異がヒットしました。totoさんが仰られていたのは主に上記のようなことなのでしょうか?

また、3つのアレルが存在する(>A:C:T=2:6:2)というのは、遺伝子重複や偽遺伝子のことを仰られているのでしょうか?それとも1個体において同一の遺伝子の中に、人為的な介入なく3つのアレルが存在するということでしょうか?後者の場合、私の調べ方が悪く、信頼できるソースに辿り着けませんでした。もし何か文献やWebサイトなどご存知でしたら、教えていただけませんでしょうか。

お手数おかけしますが、ご返信いただけますと幸いです。
何卒よろしくお願いいたします。

(無題) 削除/引用
No.12139-29 - 2024/02/13 (火) 17:48:06 - りすざる
ぽーさん、ありがとうございます。

本当に仰る通りだと思いました。
今回の対象種に、Major homoとMiner homoを持つ個体がそれぞれ存在しますので、それらの個体のDNA量を調節して混ぜて解析したいと思います。
もし1:1で混ぜた時に、今回のような4:1の波形の重なりが見られないようであれば、先天的にヘテロである可能性はかなり低いと判断し、4:1で混ぜた時に、今回のような波形になるようであれば、後天的な体細胞変異の可能性が高いと判断してみます。

大変貴重なアドバイスをいただきありがとうございます。

(無題) 削除/引用
No.12139-28 - 2024/02/13 (火) 14:53:54 - toto
> これは生得的にヘテロ接合を持つ場合のことを仰られているのでしょうか?だとしたらなぜSNP割合が30%になることがあるのでしょうか?

ヒトゲノムを読むと、A:G=3:7とか、A:C:T=2:6:2とかになってるところが特にexon以外でわりとよく見つかります。このようなモザイクになる理由は技術的なことも含めていろいろあります。ネットやAIで調べるとすぐ出てきますよ。

(無題) 削除/引用
No.12139-27 - 2024/02/13 (火) 09:51:46 - ぽー
>しかし今回は、クロマトグラムが示す4:1の波形が、生得的なヘテロ接合と後
>天的な体細胞変異のどちらによるものなのかが分かればよく、正確なSNPの比
>率は必要としないため

この目的であれば、Major homoとMiner homoを持つとわかっている人由来のDNAを1:1〜10:1くらいの比率で混ぜて解析するだけでわかるのではないでしょうか?
PCRに用いるためのDNA量は揃えておけば、テンプレート量による影響も避けられますし。
そうすれば、どの量比であればどのくらいの高さの差が出るかを判断できるとおもいます。

(無題) 削除/引用
No.12139-26 - 2024/02/13 (火) 01:57:05 - りすざる
asanさん、totoさん、ありがとうございます。

おっしゃる通り、そのサンプルにおけるSNPの正確な比率を知りたいのであれば、NGSによるディープシーケンスが最も効果的な手法であることは間違いないと思います。
しかし今回は、クロマトグラムが示す4:1の波形が、生得的なヘテロ接合と後天的な体細胞変異のどちらによるものなのかが分かればよく、正確なSNPの比率は必要としないため、コストがかかるNGSを用いた解析は研究室の理解を得られそうにない状況です。
また、問題となっている波形が4:1を示すサンプルは、120ほどあるサンプルのうちの数サンプルであり(多くのサンプルではヘテロの場合1:1の波形が見られている)、最悪これらのサンプルを解析から省いてしまえばよいということもあり、シーケンスにお金をかけることは出来なさそうです。

皆様からいただいた回答を参考に、プライマーをデザインし直してシーケンスを行い、そこでも綺麗な波形が得られなければ、解析からは省いてしまおうと考えておりました。
せっかくアドバイスをいただいたにも関わらず、実行できず申し訳ないです。

>必要なコストや目的にもよると思いますけど、独自解釈で行くよりも自分が証明したいことと同じようなことをやってる発表論文を調べて、その方法に従った方が難癖はつきにくいですよ

基本的に先行研究ではサンガーシーケンスで、ホモかヘテロかを調べており、私もそのようにして研究を進めてきたのですが、今回のような波形が出た場合のトラブルシューティングについて述べているものは調べても出てこず、ここに質問させていただきました。

>組織の場合は、ガンでない領域でもSNPの割合が1:1でなくて30%などになったりすることもままあります。

これは生得的にヘテロ接合を持つ場合のことを仰られているのでしょうか?だとしたらなぜSNP割合が30%になることがあるのでしょうか?

どうぞよろしくお願いいたします。

(無題) 削除/引用
No.12139-25 - 2024/02/12 (月) 22:39:11 - toto
asanさんの言われるとおりで、サブクローニングしてクローンを大量に読んでもヘテロならその割合は正確にはわからないし、ホモでも何個読めばいいのかという話になります。PCRのダイレクトsangerで波形をソフトで調べるというのは、ちょっと悲しいかもしれない。
各サンプルのPCR産物にバーコードつけて、アンプリコンシークエンシングで一分子フラグメントを数百本でも読めば、いろんな部位でのSNPの割合が簡単かつ正確にわかります。組織の場合は、ガンでない領域でもSNPの割合が1:1でなくて30%などになったりすることもままあります。
近隣のラボでNGSしてくれるところがないなら、外注でも、PCRフラグメントのクローニング外注より安くできますよ。その方向に進めるのなら、ボスに言ってNGSをはじめた方がいいです。

(無題) 削除/引用
No.12139-23 - 2024/02/12 (月) 18:07:24 - asan

SNPの解析については素人なのであまり適当なことは言えないですが、
ちゃんとやりたければ次世代seqつかってディープシーケンスで読んだ方がはやくないですか?
っておもったりもするんですが。

もちろん全くローンをそれぞれ読めばコスト的に難しいですけど、重複リードを読むだけならインデックスを変えて混ぜて読めばそんなにリードなくてもたくさんのクローンを定量的に読めそうな気がします。

CRISPRのindel解析でも基本皆ディープシーケンスで定量解析してるので、
本質的にSNPの議論するなら混ざり物でサンガーシーケンスでは信頼性も低いって思われちゃうと思います。
正直結構限界あると思います。

必要なコストや目的にもよると思いますけど、独自解釈で行くよりも自分が証明したいことと同じようなことをやってる発表論文を調べて、その方法に従った方が難癖はつきにくいですよ。

(無題) 削除/引用
No.12139-22 - 2024/02/12 (月) 17:29:54 - りすざる
88さん、seventhさん、おおさん、ありがとうございます。
返信が遅くなってしまい、申し訳ございません。

>今後もシーケンスを行うならテンプレート量を調整してきれいな波形データを出したほうがケチがつきにくいと思います。

多くのサンプルをまとめて調製していることもあり、波形データが綺麗なサンプルとそうでないサンプルにわかれてしまいました。今後は、ご指摘いただいたように、シーケンスをやり直す際はテンプレート量からしっかり調整していきます。

>これそもそもsingle cellじゃないんですよね?
>だったらそうなっててもおかしくないと思うんだけど。。。

それはつまりモザイク変異の存在をご指摘いただいているのでしょうか?
どの細胞も基本的に同じ遺伝情報を持つと仮定すると、ヘテロでも4:1のようなピークの重なりは考えずらかったため、今回質問させていただきました。

(無題) 削除/引用
No.12139-21 - 2024/02/09 (金) 11:59:10 - おお
>[Re:19] 88さんは書きました :
> これそもそもsingle cellじゃないんですよね?
>
> だったらそうなっててもおかしくないと思うんだけど。。。


?

(無題) 削除/引用
No.12139-20 - 2024/02/09 (金) 10:48:23 - seventh
他の方も指摘されているようにテンプレート過剰でピークが低い部分が多くなっているので、今後もシーケンスを行うならテンプレート量を調整してきれいな波形データを出したほうがケチがつきにくいと思います。

(無題) 削除/引用
No.12139-19 - 2024/02/09 (金) 08:50:00 - 88
これそもそもsingle cellじゃないんですよね?

だったらそうなっててもおかしくないと思うんだけど。。。

(無題) 削除/引用
No.12139-18 - 2024/02/09 (金) 00:16:36 - りすざる
おおさん、ありがとうございます。

対象のSNPにより特化したプライマーをまずデザインする。
そして、A/Aのホモ接合、G/Gのホモ接合、AとGが1:1で存在するヘテロ接合のサンプルをコントロールとして、問題となっているサンプルの波形データと比較するということですね。

このSNPを持つ遺伝子は、どうやら脳での発現を通して表現型に影響を与えてそうであり、口内細胞での体細胞変異が原因のモザイク変異であった場合、その変異は口内細胞にしか存在せず、目的の表現型とは無関係な可能性も考えられるため、先天的なヘテロ接合と、後天的な体細胞変異によるモザイク変異は区別しておきたいと考えております。
ただ設備に限界がありますので、おおさんのおっしゃる通り、PCRの酵素や条件を変えてみて、そこでもヘテロだと判断できそうな差が見られなければ、これらのサンプルを除いて解析を行ってみます。

多くのアドバイスをいただきまして、本当にありがとうございます。

(無題) 削除/引用
No.12139-17 - 2024/02/08 (木) 04:57:06 - おお
クローニングできないという施設ということで書いてみます。

まず指摘があるようにシーケンサーの特性上ベストな位置に来るようにプライマーを設定する。
表裏両方読む。
確実にホモとわかっている両方のサンプル、あるいは合成したもの、ゲノムからBACとかファージに入れたものからのDNA、なんでもいいからポジコンとして使えるようなテンプレートを用意して、Aの場合の波形とGの場合の波形、1:1混合の場合の波形データーを作っておく。

モザイク変異は忘れてください。そんなの親のDNAなども解析しないと結論が出ないでしょう。要はその配列があれば何らかの形質が現れる可能性(リスク)があるという話でしょう?それにPCRの効率が違えば単純なヘテロであっても差が出てくる。そういう観点ではPCRの酵素を変えてみてもいいかもしれない。また、サイクル数も抑えて見てもいいかもしれない。

クローンを拾って読むなら外注という手はあると思います。

(無題) 削除/引用
No.12139-16 - 2024/02/08 (木) 01:15:39 - りすざる
ぽーさん、774Rさん、ご回答いただきありがとうございます。

みなさんのおっしゃる通り、正確な結果を得るためには、クローニングするしかなさそうですね。
自分の理解に少し不安があるので、確認させていただきたいのですが、

「PCR産物をクローニングして複数コロニーをシーケンシングすることで、まずマイナーアレルが含まれているのかどうかが判断できる。さらにマイナーアレルがあった場合には、各コロニーにおける結果を比較することで、PCR 産物を直接シーケンシングした時よりも、正確な存在比を把握できる」

という理解で合っていますでしょうか。

勉強不足を痛感するばかりです。
何卒ご返答よろしくお願いいたします。

35件 ( 1 〜 20 )  前 |  1/ 1. 2. /2


パスワードを入力してチェックした記事を チェックした記事を

このトピックにメッセージを投稿する
名前 
メール   アドレス非公開
   タイトル 
本文      
設定  クッキーを保存(次回の入力の手間を省けます)
上に上げない(トピックの一覧で一番上に移動させません)
解決(問題が解決した際にチェックしてください)
暗証  半角英数字8-12文字の暗証番号を入れると、あとで削除、修正ができます。
送信 

〔使い方〕
  • 「アドレス非公開」をチェックすれば、自分のメールアドレスを公開しないで他の方からメールを受け取れます。
  • 問題が解決した際には、解決ボタンをチェックして解決した旨のコメントをつけてください。これは、初めにトピックを作った人と管理人のみが可能です。
  • 半角カタカナ、機種依存文字(全角ローマ数字、○の中の数字等)は文字化けの原因となりますので使わないでください。