共同研究・競争的資金等の研究課題

2006年 - 2007年

配列相同性検索に依存しない生物系統と機能推定法の確立と分子進化学への応用

日本学術振興会  科学研究費助成事業 基盤研究(C)  基盤研究(C)

課題番号
18570216
体系的課題番号
JP18570216
配分額
(総額)
4,020,000円
(直接経費)
3,600,000円
(間接経費)
420,000円

塩基やアミノ酸配列の相同性検索は解読されたゲノムの、生物系統や遺伝子機能推定に不可欠の技術として利用されゲノム解析の基本手法となった。しかしながら、新規性の高いゲノムが解読された際には、配列相同性検索でタンパク質の機能が推定できない遺伝子は半数近くに及ぶ。タンパク質の機能については機能部品類の3次元上での配置が重要であり、同一ないしは類似の機能を持つタンパク質間でも1次元配列上での有意な相同性を見付けられない例が見られる。異なった原理に基づくタンパク質の機能推定法の確立が急務と言える。タンパク質の連続アミノ酸頻度を対象にしたBLSOM法を開発した。機能カテゴリー別のデータベースであるCOGに収録されたタンパク質を解析に用いた。2連アミノ酸頻度、アミノ酸を物理化学的な類似性で11のカテゴリーに集約した上での3連アミノ酸頻度、ならびに6カテゴリーに集約した上での4連アミノ酸頻度に着目したBLSOMを行った。地球シミュレータを用いてBLSOMを試みたところ、タンパク質がCOG別に自己組織化する傾向を示し、特にアミノ酸を11カテゴリーヘグループ化した3連アミノ酸のBLSOMは機能に基づく分離の度合いが最も高かった。
難培養性微生物類のゲノム混合物のメタゲノム解析由来の配列は新規性が高く、生物系統や遺伝子機能に関するアノテーションもほとんどついておらず、利用価値が低いままにデータベースに登録されている。機能既知の大量なCOGタンパク質とメタゲノム解析で得られた多数の機能未知のタンパク質を混合したデータを対象に、大規模BLSOM解析を行いメタゲノム解析で得られた多数のタンパク質の機能推定を行った。2連アミノ酸頻度、11に集約した3連アミノ酸頻度、6に集約した4連アミノ酸頻度の解析で同じ機能が推定できた機能未知タンパク質から、生物系統推定の結果と合わせて、推定機能を公開する予定である。

リンク情報
KAKEN
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-18570216
ID情報
  • 課題番号 : 18570216
  • 体系的課題番号 : JP18570216