はじめて利用させて頂きます。ばいおと申します。
表題の通りのことを知りたいです。
具体的には、エクセルファイル(テキスト)で、
gi|xxxxxxxxxx|ref|xx_XXXXXXXX.X|_種名
gi|xxxxxxxxxx|ref|xx_XXXXXXXX.X|_種名
gi|xxxxxxxxxx|ref|xx_XXXXXXXX.X|_種名
gi|xxxxxxxxxx|ref|xx_XXXXXXXX.X|_種名
gi|xxxxxxxxxx|ref|xx_XXXXXXXX.X|_種名
gi|xxxxxxxxxx|ref|xx_XXXXXXXX.X|_種名
といった具合に1500前後のNCBIからの配列データの名前部分が列挙してあります(配列部分と名前は分割しました)。
これらがどのような分類群(鋼から種まで)に属するのかを一つずつ手作業で調べるのは大変ですし、今後の解析でウン十万とこのようなデータが増えるであろうことが分かっております。
なので、いちいちコピペで検索をかけて調べるのは、現実的ではないと考えております。
一度は、スクリプトを作成し、自動でアクセスして結果を返すようなことをしようかとも思ったのですが、以前、某大学がスクリプトを使ってNCBIにアクセスしてアクセス禁止を食らったことを思い出し、断念いたしました。
知恵をお借りしたく思います。 |
|