おべんきょうwiki

Tamura features

最終更新:

yahirohumpty

- view
管理者のみ編集可

Tamura features


画像処理における特徴量.

特徴量の詳細


以下の六つの要素から特徴ベクトルを構成する.

 (f_{crs}, f_{con}, f_{dir}, f_{lin}, f_{reg}, f_{rgh})

Coarsness


まず各点の  2^n \times 2^n サイズの近傍の平均を求める.
1-32あたりまでを使う?
 (x,y)  2^k \times 2^k 近傍の平均は以下のように求められる.

 A_k(x,y) = \sum _{i=x-2^{k-1}} ^{x+2^{k-1}-1} \sum _{i=y-2^{k-1}} ^{y+2^{k-1}-1} f(i,j)/2^{2k}

 f(i,j) は点  (i,j) のグレーレベル.

次に自分の点を中心として対称となる位置にある
重なり合うことの無い領域同士の平均の差分を
各方向において各点で計算する.

水平の場合は
 E_{k,h} (x,y) = | A_k(x+2^{k-1},y) - A_k(x-2^{k-1},y) |
(???何方向くらいいるだろうか???)

次に各点において  E を最大化する  k を求め,ベストなウインドウサイズを求める.
 S_{best}(x,y)=2^k
 E_k = E_{max} = \max (E_1,E_2, \cdots E_L)
1-Lはkの範囲.

最後に画像中の各ピクセルのS_{best}の平均をとる.
 F_{crs} = (1/(m \times n)) \sum _i ^m \sum _j ^n S_{best}(i,j)
m,nは有効な画素範囲を示す.

(???Fとfの違いは何???)


Contrast


コントラストの定義は
 f_2 = \sum _n n^2 ( \sum \sum _{|i-j|=n} p(i,j))
 p(i,j)  n \times n の gray-level spatial dependence matrix
(???この上の定義は触れただけで使っていないのでは???)

画像中のグレーレベルの分布から
尖度 \alpha _4 を以下のように求める.
 \alpha _4 = \mu _4 / \sigma ^4
 \mu _4 は四次モーメント,
 \sigma ^2 は分散, \sigma は標準偏差.
 F_{con} = \sigma / \alpha _4 ^n
nは実験的に1/4がよいらしい.


Directionality


各画素のエッジのマグニチュードと角度を求める.
 | \Delta G | = (| \Delta _H | + | \Delta _V |)/2
 \theta = \tan ^{-1} ( \Delta _V / \Delta _H ) + \pi /2
 \Delta _H , \Delta _V はそれぞれ水平,垂直方向のPrewittフィルタをかけた画像.

次にヒストグラム  H_D を求める.

 H_D (k) = N _{\theta} (k) / \sum _{i=0} ^{n-1} N _{\theta} (i)
kは0から(n-1)まで.
 N _{\theta} (k)
 (2k-1) \pi /2n \le \theta < (2k+1) \pi /2n 且つ  | \Delta G | \ge t を満たす点の数.

元の文献ではn=16,t=12としている.

ここから  F_{dir} を以下のように求める.
 F_{dir} = 1-r n_p \sum _p ^{n_p} \sum _{ \phi \in w_p } ( \phi - \phi _p ) ^2 H_D ( \phi )
 n_p はピークの数,
 \phi _p  H_D のp番目のピーク,
 w_p はp番目のピークの範囲,
 r  \phi に関連した正規化要素,
 \phi は0からn-1までの方向をあらわすコード.

ただし,ピークが二つ以上のときは考慮していない.

 H_D (v_{12}) / H_D ( \phi _2 ) < 0.5 ,
 H_D (v_{21}) / H_D ( \phi _2 ) < 0.5 ,
 H_D ( \phi _2 ) / H_D ( \phi _1 ) > 0.2
の三条件を満たすなら n_p=2 ,そうでないなら n_p=1 .
ここで
 v_{12} はピーク  \phi _1 , \phi _2 の間の極小値の位置.
 v_{21} はピーク  \phi _2 , \phi _1 の間の極小値の位置.

(???サイクリックなので成り立つということか???)
(???二つのピークはどう決めるか???)


Line-likeness


 F_{lin} = \sum _i ^n \sum _j ^n P_{Dd}(i,j) \cos |(i-j)2 \pi / n | / \sum _i ^n \sum _j ^n P_{Dd}(i,j)

 P_{Dd}  n \times n の local direction co-occurrence matrix of points at distance.
ここのnというのはDirectionalityで作ったnと同じ,つまりエッジ勾配の方向を表している.
i,jもエッジ勾配の方向で,つまり画像中の各点において,
ある点pにおける勾配方向がiであったときにその勾配方向にdだけ移動し,
そのときの点qの勾配方向をjとする.これで(i,j)を決定できる.
そのときのp,qにおける勾配の大きさが \Delta |G_p| \le t , \Delta |G_q| \le t を満たすなら+1.

(???ここの解釈は果てしなく怪しい???)
(???dの決め方についてはd=4でRosenfeldのd4距離関数を使っていると書いてあるように読める???)


Regularity


上の四つの各特長量の標準偏差から計算する.
 F_{reg} = 1-r ( \sigma _{crs} + \sigma _{con} + \sigma _{dir} + \sigma _{lin})
(???標準偏差はどうやって計算するの???)
(???一般的かどうかを見ているということだから複数の画像から出揃ったところで計算するもの???)

Roughness


Coarsness と Contrast の和.従属変数?
 F_{rgh} = F_{crs} + F_{con}


参考文献

  • Tamura, H., Mori, S., & Yamawaki, T. (1978). Textural features corresponding to visual perception. IEEE Transaction on Systems, Man, and Cybernetics, 8(6), 460–472.

タグ:

画像処理
目安箱バナー