BioTechnicalフォーラム [RAxMLのコンパイル]

RAxMLのコンパイル

No.3449-TOPIC - 2010/10/31 (日) 12:29:33 - protein

RAxMLのコンパイルをcygwinで行っているんですが、
rax7.04のディレクトリに移動してから、
make -f makefile.gccと入力しても
bash: make: command not foundと表示されて、exeが作れないのですが、
解決法はないでしょうか。
　

- このトピックにメッセージを投稿する -

全13件 ( 1 ～ 13 )　前 | 次　1/ 1. /1

(無題)

削除/引用

No.3449-13 - 2010/11/04 (木) 11:15:32 - 橘

私は7.2.6と7.0.4の精度の違いの話なんてしていません。
RapidBootstrapよりNormalBootstrapの方が今はまだ良いかもしれないと言っているのです。
7.0.4にもRapidBootstrapはあります。

ガンマ補正はRAxMLでは無効にできません。
どうしても無効にしたければソースコードを書き換えるかPHYMLとかを使って下さい。

(無題)

削除/引用

No.3449-12 - 2010/11/02 (火) 19:56:49 - protein

おっしゃるとおり勉強したいと思います。
2.2.6のバージョンを勧めてくださったのですが、
精度を考えると7.0.4の方がいいということなんでしょうか。
あとマニュアルを読むとガンマ補正が必ずついてくるようなので、
痛いですね。
今の段階ではどちらがいいかまったくわからないのですが、
かなりブロードなサンプリングをしているので、
補正がないほうがいいと考えています。

(無題)

削除/引用

No.3449-11 - 2010/11/01 (月) 22:24:32 - 橘

>ブートストラップ⇒系統樹
というのが何なのかはっきりしませんが、RAxMLのRapidBootstrap+ML樹形探索のことと仮定して書きます。
ML法(注:RAxMLではない)は、NJ法(というより距離行列法全般)より明らかに優れていると思いますが、ブートストラップ解析のやり方とは「全く」関係ありません。
単に距離行列を計算するためのモデルを客観的に得る方法が存在しない＆分岐点の祖先形質状態を考慮していないからNJがMLより良いワケがない、というだけです。
樹形探索法と、系統樹推定法と、系統樹の信頼性の推定法はいずれも全く別の問題ですので区別して下さい。
RAxMLのRapidBootstrapが信頼性の推定方法として優れているかどうかはまた別問題ですし、RapidBootstrapをやってから、その結果を用いて?元データのML樹形探索を行うのが優れているかどうかも別問題です。
どちらも評価は固まっていないと思います。
個人的にはまだNormalBootstrapの方が良いと思いますが、ものすごい大規模データならRapidBootstrapでもしょうがないかなと思います。

次の「上位の分岐点」って何でしょうか。
とりあえず根っこの分岐点と仮定して書きます。
既に書いたように、ブートストラップ解析は「内分枝」の再現確率を得ます。
「分岐点」の再現確率は得られません。
そもそも根っこの分岐点は表示上折りたたんでいるに過ぎません。
折りたたみ方は解析者が主観的に指定します。
外群(outgroup)の指定がそれです。
折りたたんで表示しているだけですので、そもそも根っこの分岐点は分岐点ですらありません。
ですから、根っこの分岐点の信頼性があることがそもそもおかしいのです。
これはRAxMLに限りません。
これは系統学の基本中の基本ですので、理解できないようでしたら『分子進化と分子系統学』辺りをお読み下さい。

(無題)

削除/引用

No.3449-10 - 2010/11/01 (月) 21:12:05 - protein

つまり
系統樹⇒ブートストラップ
ではなく
ブートストラップ⇒系統樹
の概念で系統樹とブートストラップを描いたほうが的確な結果が得られるということでしょうか。
そういう意味では、NJより優れているのは、明らかなんですかね。

いろいろと論文を見ているのですが、
RAXMLの場合、上位の分岐点のブートストラップは記載されないものなんでしょうか。

(無題)

削除/引用

No.3449-9 - 2010/11/01 (月) 20:41:42 - 橘

bipartitionはOTU (端点、もしくはその点の生物)を系統樹上で2グループに分けるもの、つまり「枝」です。
基本的には内分枝(両端に枝が付いている枝)です。

従来の論文・書籍などでは「クレード」とか「系統群」と呼んでいるものの支持率をブートストラップ解析で得るなどと書かれていますが、実際に計算されている無根系統樹の場合、ある系統群(がまとまるという仮説)の支持率は「その系統群のOTU以外のOTUからなる系統群」(がまとまるという仮説)の支持率と同じです。
そして、これは「系統樹上のOTUが、『ある系統群』と『それ以外』の2グループに分けられるという仮説」の支持率とも言えます。
実際にブートストラップ解析でやっていることは、内分枝の再現率の計算なので、後者の捉え方の方が的確でしょう。
大抵の場合、クレードと読み替えても通じるでしょうが、以上のような違いがあるので注意して下さい。

(無題)

削除/引用

No.3449-8 - 2010/11/01 (月) 19:53:26 - protein

懇切なご説明ありがとうございます。
昨日から二日格闘しております。。
とりあえずv7.0.4で成功しましたので、
いろいろ試してみようと思います。
慣れたら7.2.6に変えてみます。
あと、bipartionsの概念がよくわからないのですが、
お教え願えますか？
聞いてばっかりで申し訳ありません。

(無題)

削除/引用

No.3449-7 - 2010/11/01 (月) 12:00:52 - 橘

マルチCPUを使う場合を書き忘れていましたが、その場合は
raxmlHPC
を
raxmlHPC-PTHREADS -T 4
とかに変えてコマンドを打って下さい。
数字は使用するCPUの数です。
8CPUあるなら8にして下さい。

(無題)

削除/引用

No.3449-6 - 2010/11/01 (月) 11:53:39 - 橘

私が書いたのは7.0.4マニュアルで言えばEasy&Fast wayに相当します。
Hard&Slow wayはやりたければどうぞ。
多分あまり変わらないと思いますが。
アミノ酸配列の場合、RAxML 7.2.8で対応モデルがかなり増えていますので、7.2.8でやった方が良い可能性もありますが、alpha版なのでおすすめはしません。

BayesとMLのどちらが良いかというのは結論の出る問題ではありません。
今RAxMLによる最尤法が流行っているのは単に速いからで、それ以上の意味はありません。
以前MrBayesによるベイズ法が流行ったのも、単に速かったからで、その論理が優れていると見なされたからではありません。
ただ、よく分かってないアホな査読者はMLだけだとBayesもやれと言ってきますので(むしろ追加するならMPだと思うんだが)、言われたらやるか、データがでかすぎて無理と泣きを入れるか、必要無い(最尤法と同じモデルをベイズ法で適用するのはあまり意味が無い、むしろ事後確率は信頼できない問題がある、とか)と説明する必要があります。

なお、ベイズ法でないと適用不能かそれに近いモデル(CovarionとかNonhomogeneousモデル)を使って推定すべき場合にはベイズ法もやった方が良いでしょう。

(無題)

削除/引用

No.3449-5 - 2010/11/01 (月) 11:35:53 - protein

ご返信感謝いたします。
アドバイス非常に参考になります。

manualを読んでいると最初に元となる系統樹を簡単に作成する(ST 0-4)という話もあるのですが、
この作業はいらないんでしょうか。
それとも自動でやってくれるんでしょうか。

私が原理をよくわかっていないために、
こんな質問をしてしまうんだと思いますが、
コマンドの複雑さとからめるとますますわからなくなってしまいます。。。。

それと、高速のraxmlはbayesに劣るのでしょうか。
そうだとすると、raxmlがbayesより主流になっている理由が理解できません。
raxmlで描いて、rogue sequenceを排除して、bayesで描くということも考えていますが。。

(無題)

削除/引用

No.3449-4 - 2010/11/01 (月) 10:45:36 - 橘

http://wwwkramer.in.tum.de/exelixis/software.html
から7.2.6正式版のコンパイル済みバイナリが落とせますよ。
コマンドがマニュアルから少し変わっていますが、だいたいは同じです。
モデルの～MIXの指定が無くなって、～CATで以前の～MIXと同じ動作をするようになっていたりするのが大きな変更点でしょうか。
Cygwinで作成したバイナリは少し遅いので、こちらの方が速く計算できるでしょう。
詳しい使い方は
raxmlHPC -h
で表示されます。
raxmlHPC -h > manual.txt
とかやればファイルに保存されますのでじっくり見られるはずです。

raxmlHPC -n 出力ファイルのprefix -s 配列ファイル -f a -x 12345 -N 100 -m PROTGAMMAJTT
とかやればJTT+Gammaモデルで100反復の高速ブートストラップ解析とML樹形探索が走ります。
JTTの部分は適当に変えて下さい。

(無題)

削除/引用

No.3449-3 - 2010/11/01 (月) 10:25:05 - protein

非常に的確なアドバイスありがとうございます。
とりあえず、ここまでは、大成功しました。

この後のステップもv704のmanualに従って行こうと思っているのですが、
どれを選択したら不明です。。
コマンドとその順番が私には理解できません。
Proteinの系統樹なんですが、
どうしたらよろしいんでしょうか。
(hard and slowの方が正確な絵が描けそうですが。。）
そもそもphylip形式で作ったファイルの認識のさせ方がmanualだとはっきり書かれていなくて、よくわかりません。
周りに同様のことをやっている人もいません。

サーバーが楽なんですが、
CIPRESは、調子が悪いみたいで結果が出ません。
またlarge scaleなので、Black Boxでは結果が制限時間内に出ないようです。

(無題)

削除/引用

No.3449-2 - 2010/10/31 (日) 17:16:25 - tki

gccは入れてありますか。

http://www2.ktokai-u.ac.jp/~kfuji/cygwin/cygwin.htm

RAxMLのコンパイル

削除/引用

No.3449-1 - 2010/10/31 (日) 12:29:33 - protein

全13件 ( 1 ～ 13 )　前 | 次　1/ 1. /1

パスワードを入力してチェックした記事を

チェックした記事を