2003年度 修士論文要旨


FCANAL( Fast Calculable protein function analyzer)の開発〜タンパク質立体構造を利用した機能予測法の解発〜

浅岡 丈生

 タンパク質の機能を理解するには、配列、構造や物性の情報が重要である。現在のタンパク質機能予測は、アミノ酸配列情報が蓄積され 膨大化していった影響を受け、アミノ酸配列を利用したホモロジー検索やモチーフ検索が主な手法である。しかし、タンパク質の機能は アミノ酸配列が折りたたまることによってできる複雑な立体構造により決定される。このことをうけ、タンパク質立体構造を系統的に決定 しようと構造ゲノム科学が新しい研究分野として生まれた。構造ゲノム科学の進展により、今後はタンパク質立体構造情報が急激に増加し ていくことが期待される。このことは、立体構造情報に基づくタンパク質機能予測法を開発する基盤が整いつつあることを示すと同時に、 構造情報を利用した高速・高効率な機能予測法の確立がますます重要視されていくことを示唆している。そこで、本研究では、立体構造情 報を利用した高速・高効率な機能予測法(FCANAL)の開発を行った。予測ターゲットとしては、構造情報の充実している9種類のPROSITEパタ ーンを用いた。

 FCANALでは、タンパク質の機能ごとにスコア行列を作成し、このスコア行列を用いて機能を予測する。スコア行列作成の第一段階として、 局所構造におけるアミノ酸の出現頻度及び局所構造内部に見られるCα間の距離を構造情報として抽出した。次に、機能部位とその他の局所 構造で見られる構造情報の特徴差を数値化してスコア行列を作成した。このスコア行列を用いて、検証データ中の全てのタンパク質を局所 構造に分割・スコア化したところ、得られたスコア分布は機能部位とその他の局所構造の双峰性分布であった。さらに、予測精度・網羅性 に対して、スコア行列の作成に使用する活性部位の組み合わせを最適化した。また、得られたスコア行列の各要素に対しても同様に最適化 を行った。最適化したスコア行列を使用して機能予測を実行した結果、予測ターゲット全ての検証データにおいて網羅的且つ高精度な機能 予測が可能であった。距離情報を用いることで、膨大化した立体構造情報の高速且つ網羅的な解析が可能になると期待できる。今後、他の 機能部位に対しても同様の手法を用いてFCANALの有効性を検討していくと共に、Web上での公開を進めていく必要があると考えている。


Back to "Master Thesis" Home Page "修士論文リスト"のページへ戻る