パターンの種類
配列解析を行うにあたってパターン認識は重要課題のひとつ。
とある本によるとパターンは以下の3種類があるという。
"Solid pattern" : 文字列(DNAなら{ATGC}のみ)からなるパターン
"Rigid pattern" : 文字列+ワイルドカード(N)からなるパターン、Solid patternに比べて
数が膨大になる可能性がある。
"Extensive pattern" : []や()でいくつかの候補を指定したり、位置特異性を指定したりする。
例えば、C..[FYWI]....C-(8,19)など
個人的な観点からするとExtensive patternはそんなに使わず、もっぱらSolidかRigidなパターン
を使用している。こういった概念はモチーフ探索の方法を考えるときなどに重要かも???
もうすぐこの果物がおいしくなる季節(*^o^*)
このときはまだ実ってなかったけど、近々スーパーにも顔見せするのでしょう。