>NCBIでのCDSは4.2 kb
CDSと書かれているので蛋白のアミノ酸配列(1400アミノ酸長)がコードされてますね。アミノ酸をコードしない調節領域ではないと思われます。
まず情報を精査する必要があると思います。
NCBIの情報はプレディクションなのかどうか、
複数の翻訳開始点が存在する可能性があるか(複数の蛋白がコードされている場合も)、
ゲノムに複数の転写開始、ターミネーターがあるか、
あなたの得られた約1000アミノ酸の情報はどこから得られたのか?
翻訳後プロセッシングを受けるかどうかなど。
通常その蛋白を発現させて精製するとかであれば、CDSを入れればいいです。
ほんとによくわからなくて、その遺伝子としての機能が知りたいなら、非翻訳領域を含めて発現させる手はあります、その時は翻訳開始点より上流の配列も含みますからタグの設計を工夫する必要があります。 |
|