Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 新しいテーマで話を始める場合、質問をする場合は「新しいトピックを作る」から書き込みをしてください。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

新しいトピックを作る | トピック一覧 | 研究留学ネットに戻る

ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

RNA-seqについて トピック削除
No.12193-TOPIC - 2024/02/27 (火) 09:46:43 - ss
RNA-seqを解析するときに、データが2つ以上ある遺伝子の取り扱いはどうすべきでしょうか?平均値を採用するあるいはその遺伝子は削除するなどもありなのでしょうか??
 
- このトピックにメッセージを投稿する -



5件 ( 1 〜 5 )  前 | 次  1/ 1. /1


(無題) 削除/引用
No.12193-5 - 2024/02/28 (水) 12:53:06 - ss
みなさま

ご回答ありがとうございます。
とても参考になりました。
私のデータには数十個の遺伝子に2つのデータが検出されていました。
(アンダーバーなどはありません)
バリアントを示唆するのか、何らかの意味はあるとは思いますが、
あるソフトでこのseqデータを解析するときに重複遺伝子があるとエラーがでるために、
2つのデータが検出された遺伝子は削除するか、どちらか一方を採用するかなどをしなければならない状況でした。
UMIなどはよいと思うのですが、素人では難しいため外注先にも意見を聞いてみようと思います。

(無題) 削除/引用
No.12193-4 - 2024/02/28 (水) 02:06:31 - おお
https://dnatech.genomecenter.ucdavis.edu/faqs/should-i-remove-pcr-duplicates-from-my-rna-seq-data/

これも参考になるかな。

(無題) 削除/引用
No.12193-3 - 2024/02/28 (水) 01:29:26 - おお
nf-co.re/rnaseq/3.6/docs/output#alignment-post-processing

ここでは重複解消のツールが紹介されています。
UMI-tools dedup
picard MarkDuplicates

www.biostars.org/p/55648/
原因その他を含めて議論があります。最初の回答者は関連質問のリンクを貼ってくれてます。


bioinformatics.stackexchange.com/questions/2959/duplicate-genes-with-rsem-counts-which-one-to-choose

EnsemblではTranscriptsに対してアセンブルを当てるので、同じ遺伝子からの違うTranscriptsであることがあります。Isoformとしてどう考えるかですが、Isoformが違う(場合によっては反対の)効果をもたらすときは要注意かもしれません。また転写活性を見れればいいとすると合わせてしまってもいいのかもしれませんが、その時は合わせた数値に基づいて全体的な統計処理が必要なのでは?と思います(厳密にそこまで必要でないと言われればそうかも知れません)。そういうことを考えればEnsemblのTranscript単位で見ていったほうがいいような気がします。比較するもの両方ともそのTranscript単位で比較するわけですからごっちゃになることもないですし。

ちなみにリンクに示された例でENSG00000214338 and ENSG00000255330がLociがちがう別個の遺伝子と言う認識で書いてますが、みた感じ3’にAdditional exonsをもった同じ遺伝子由来のものに見えます。でEnsemblのリンクをみると片方はNMDを受けるTranscriptと見れますので、そういうものを一緒にしないほうが良さげだと思いました。

ただしこういうのは何を見たいかによって変わるだろうから、それぞれの対応があってもいいのかもしれません。

データー処理を誰かにしてもらった(外注とか?)であればその人と相談してみるといいでしょう。改善の余地があればそういう方向になるかもしれませんし、違ったやり方を試してもらえるかもしれません。またどう捉えるべきかもアドバイスがあるかもしれませんので。

表面的なことしかわからないのでこれぐらいのことしか書けませんが、実際にデーターを処理している人の意見が上がってくれることを願ってます。

(無題) 削除/引用
No.12193-2 - 2024/02/27 (火) 20:33:54 - あの
当方は専門家ではありませんが、レスがつきにくそうなので、レスします。

質問の意味が

遺伝子名のあとに、アンダーバーの後に1とか、2とかがついてしまう場合の解析でしょうか?

当方は、その場合には、単純に合計しています。

TPMの場合には、群間の比較する目的であれば、これで良いと割りきっています。
色々なパターンで解析はしてみましたが。

より詳しい方の御意見を当方も知りたいです。

RNA-seqについて 削除/引用
No.12193-1 - 2024/02/27 (火) 09:46:43 - ss
RNA-seqを解析するときに、データが2つ以上ある遺伝子の取り扱いはどうすべきでしょうか?平均値を採用するあるいはその遺伝子は削除するなどもありなのでしょうか??

5件 ( 1 〜 5 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を

このトピックにメッセージを投稿する
名前 
メール   アドレス非公開
   タイトル 
本文      
設定  クッキーを保存(次回の入力の手間を省けます)
上に上げない(トピックの一覧で一番上に移動させません)
解決(問題が解決した際にチェックしてください)
暗証  半角英数字8-12文字の暗証番号を入れると、あとで削除、修正ができます。
送信 

〔使い方〕
  • 「アドレス非公開」をチェックすれば、自分のメールアドレスを公開しないで他の方からメールを受け取れます。
  • 問題が解決した際には、解決ボタンをチェックして解決した旨のコメントをつけてください。これは、初めにトピックを作った人と管理人のみが可能です。
  • 半角カタカナ、機種依存文字(全角ローマ数字、○の中の数字等)は文字化けの原因となりますので使わないでください。