文字列の数値化
今日の自主セミナーのテーマは文字列の数値化。
例えば以下のような文字列Slに
Sl = a b c d e f g
なんらかの重みをつけて数値列Svをつくる。
Sv = 0.56 0.47 0.21 0.30 0.37 0.01 0.11
こうすることで、文字列に対し様々な数値解析を適応することが
できる。文字に与える重みとしてはアミノ酸配列なら親水性など
が使えるだろう。
また文字列から数値列に再変換するにはパラメータδを使って
x - y < δ x : 与えられた数値、 y : 文字→数値変換に用いた値
例えばδ=0.05とすれば、以下のような範囲内の数値をそれぞれの
文字列に変換できる。
f : -0.04 < x < 0.06
g : 0.06 < x < 0.16
c : 0.16 < x < 0.26
d : 0.26 < x < 0.35
e : 0.35 < x < 0.42
b : 0.42 < x < 0.52
a : 0.52 < x < 0.61