Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

トピック一覧 | 研究留学ネットに戻る

最新のフォーラム | このフォーラム | ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

多数遺伝子の名前同士の比較(バイオインフォマティクス) トピック削除
No.3634-TOPIC - 2010/12/07 (火) 14:07:37 - あと3日で30台
例えば全遺伝子50000VS特定の機能の遺伝子700
などの場合、遺伝子の名前だけを比較するにはどうすればいいでしょうか?
いわゆるベン図を作成したいと思っています。

データベースの整備が不十分で全遺伝子50000には漏れが
あるようです。
 
- このトピックにメッセージを投稿する -



7件 ( 1 〜 7 )  前 | 次  1/ 1. /1


試してないので合ってるかどうかわかりませんが 削除/引用
No.3634-7 - 2010/12/08 (水) 00:21:08 - キレネンコ
遺伝子のリストがallgenes.txtとspecificgenes.txtとすると、unixのコマンドラインから

% cat allgenes.txt specificgenes.txt | sort | uniq -d > intersection.txt

などとやれば積集合の遺伝子リストが得られるはずですね。

あとは

% cat specificgenes.txt intersection.txt | sort | uniq -u

とやればallgenes.txtには含まれずspecificgenes.txtにのみ含まれる遺伝子のリストが得られるはずです。一行で済ますもっとエレガントな方法もありそうですが、すぐ思いつくのはこんな感じで。

改行コードに注意しましょう。

(無題) 削除/引用
No.3634-6 - 2010/12/07 (火) 16:45:16 - あと3日で30台
~さんサンクス、Tさんも。

さすがに700回はきついと思ったので、今後も考えて。

追記ですが、blastとclustalWだけだと猛烈に追い上げている
中国人にすら勝てませんので、いろいろアルゴリズム等も含めて
勉強中です。数学とプログラミングが難しいです。

スクリプトは分かりませんがエクセルで単純に 削除/引用
No.3634-5 - 2010/12/07 (火) 15:39:49 - ~
700個の遺伝子と同じ名前の遺伝子が5万個のデータベース中にあるかどうかを分かればいいのでしょうか。
データベースと読んでいるのですから、各遺伝子名の抽出位はできるものなのですよね。

エクセルが65536行、256列まで対応しているので、
シートを3枚用意して、
両方のシートの列Aの2行目からに縦に50,000個の遺伝子名を並べて、
3枚のシートの一行目の列B以降に横に700個の遺伝子名を並べて、
=$A2=B$1
(B2セルに書き込んだ後、A列、1行目以外にペースト)
のようにそれぞれの遺伝子が等しいかを比較して、
TRUEになったものが、700個と5万個に共通してある遺伝子です。

数さえ分かればいいのであれば、
=if($A2=B$1,1,0)
のようにすれば、同じ場合に1になるので、
sumで合計数を求めれば、TRUEの数が分かります。

(無題) 削除/引用
No.3634-4 - 2010/12/07 (火) 15:16:36 - T
> もっと詳しく

と言われても、データベースの詳細などが分からないとどうしようもないですが…

流れとしては、
・データーベースから遺伝子の名前だけを取り出してリストを作る。
・機能遺伝子1について、リストの中に含まれているかどうか検索する
・上の処理を700回繰り返す。
だけの事です。

もっと詳しく 削除/引用
No.3634-3 - 2010/12/07 (火) 14:47:18 - あと3日で30台
お願いします。みんなblast-clustralwばっかりの解説しかないので。

(無題) 削除/引用
No.3634-2 - 2010/12/07 (火) 14:32:23 - T
簡単なスクリプトでできそうです。

多数遺伝子の名前同士の比較(バイオインフォマティクス) 削除/引用
No.3634-1 - 2010/12/07 (火) 14:07:37 - あと3日で30台
例えば全遺伝子50000VS特定の機能の遺伝子700
などの場合、遺伝子の名前だけを比較するにはどうすればいいでしょうか?
いわゆるベン図を作成したいと思っています。

データベースの整備が不十分で全遺伝子50000には漏れが
あるようです。

7件 ( 1 〜 7 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を