1 モチーフ抽出問題

モチーフとは、同種のタンパク質に共通して見られるアミノ酸配列バターンで
ある。モチーフはタンパク質の機能、構造を特徴づけ・進化の過程でも保存され
てきたと考えられている。代表的なモチーフの例をあげる。

P.94 Figure 1
2 記述長最小基準(MDL)によるモチーフ評価 モチーフの評価基準として、MDL基準を採用した。MDL基準は、次式で与 えられる記述長が小さいモチーフをより良いモチーフと考える基準である。
記述長=モチーフの複雑さ+分類誤りの程度
MDL基準は、下図のような、分類誤りはあるが単純なモチーフと分類誤りは ないが複雑なモチーフとの比較基準を与える。
P.94 Figure 2
- 94 -