「Tamura features」の編集履歴(バックアップ)一覧はこちら
「Tamura features」(2010/11/26 (金) 16:09:07) の最新版変更点
追加された行は緑色になります。
削除された行は赤色になります。
* Tamura features
画像処理における特徴量.
** 特徴量の詳細
以下の六つの要素から特徴ベクトルを構成する.
$$ (f_{crs}, f_{con}, f_{dir}, f_{lin}, f_{reg}, f_{rgh}) $$
*** Coarsness
まず各点の $$ 2^n \times 2^n $$ サイズの近傍の平均を求める.
1-32あたりまでを使う?
点 $$ (x,y) $$ の $$ 2^k \times 2^k $$ 近傍の平均は以下のように求められる.
$$ A_k(x,y) = \sum _{i=x-2^{k-1}} ^{x+2^{k-1}-1} \sum _{i=y-2^{k-1}} ^{y+2^{k-1}-1} f(i,j)/2^{2k} $$
$$ f(i,j) $$ は点 $$ (i,j) $$ のグレーレベル.
次に自分の点を中心として対称となる位置にある
重なり合うことの無い領域同士の平均の差分を
各方向において各点で計算する.
水平の場合は
$$ E_{k,h} (x,y) = | A_k(x+2^{k-1},y) - A_k(x-2^{k-1},y) | $$
(???何方向くらいいるだろうか???)
次に各点において $$ E $$ を最大化する $$ k $$ を求め,ベストなウインドウサイズを求める.
$$ S_{best}(x,y)=2^k $$
$$ E_k = E_{max} = \max (E_1,E_2, \cdots E_L) $$
1-Lはkの範囲.
最後に画像中の各ピクセルの$$S_{best}$$の平均をとる.
$$ F_{crs} = (1/(m \times n)) \sum _i ^m \sum _j ^n S_{best}(i,j) $$
m,nは有効な画素範囲を示す.
(???Fとfの違いは何???)
*** Contrast
コントラストの定義は
$$ f_2 = \sum _n n^2 ( \sum \sum _{|i-j|=n} p(i,j)) $$
$$ p(i,j) $$ は $$ n \times n $$ の gray-level spatial dependence matrix
(???この上の定義は触れただけで使っていないのでは???)
画像中のグレーレベルの分布から
尖度$$ \alpha _4 $$を以下のように求める.
$$ \alpha _4 = \mu _4 / \sigma ^4 $$
$$ \mu _4 $$ は四次モーメント,
$$ \sigma ^2 $$ は分散,$$ \sigma $$ は標準偏差.
$$ F_{con} = \sigma / \alpha _4 ^n $$
nは実験的に1/4がよいらしい.
*** Directionality
各画素のエッジのマグニチュードと角度を求める.
$$ | \Delta G | = (| \Delta _H | + | \Delta _V |)/2 $$
$$ \theta = \tan ^{-1} ( \Delta _V / \Delta _H ) + \pi /2 $$
$$ \Delta _H , \Delta _V $$ はそれぞれ水平,垂直方向のPrewittフィルタをかけた画像.
次にヒストグラム $$ H_D $$ を求める.
$$ H_D (k) = N _{\theta} (k) / \sum _{i=0} ^{n-1} N _{\theta} (i) $$
kは0から(n-1)まで.
$$ N _{\theta} (k) $$ は
$$ (2k-1) \pi /2n \le \theta < (2k+1) \pi /2n $$ 且つ $$ | \Delta G | \ge t $$を満たす点の数.
元の文献ではn=16,t=12としている.
ここから $$ F_{dir} $$ を以下のように求める.
$$ F_{dir} = 1-r n_p \sum _p ^{n_p} \sum _{ \phi \in w_p } ( \phi - \phi _p ) ^2 H_D ( \phi ) $$
$$ n_p $$ はピークの数,
$$ \phi _p $$ は $$ H_D $$ のp番目のピーク,
$$ w_p $$ はp番目のピークの範囲,
$$ r $$ は $$ \phi $$ に関連した正規化要素,
$$ \phi $$ は0からn-1までの方向をあらわすコード.
ただし,ピークが二つ以上のときは考慮していない.
$$ H_D (v_{12}) / H_D ( \phi _2 ) < 0.5 ,$$
$$ H_D (v_{21}) / H_D ( \phi _2 ) < 0.5 ,$$
$$ H_D ( \phi _2 ) / H_D ( \phi _1 ) > 0.2 $$
の三条件を満たすなら$$ n_p=2 $$,そうでないなら$$ n_p=1 $$.
ここで
$$ v_{12} $$ はピーク $$ \phi _1 , \phi _2 $$ の間の極小値の位置.
$$ v_{21} $$ はピーク $$ \phi _2 , \phi _1 $$ の間の極小値の位置.
(???サイクリックなので成り立つということか???)
(???二つのピークはどう決めるか???)
*** Line-likeness
$$ F_{lin} = \sum _i ^n \sum _j ^n P_{Dd}(i,j) \cos |(i-j)2 \pi / n | / \sum _i ^n \sum _j ^n P_{Dd}(i,j) $$
$$ P_{Dd} $$ は $$ n \times n $$の local direction co-occurrence matrix of points at distance.
ここのnというのはDirectionalityで作ったnと同じ,つまりエッジ勾配の方向を表している.
i,jもエッジ勾配の方向で,つまり画像中の各点において,
ある点pにおける勾配方向がiであったときにその勾配方向にdだけ移動し,
そのときの点qの勾配方向をjとする.これで(i,j)を決定できる.
そのときのp,qにおける勾配の大きさが$$ \Delta |G_p| \le t , \Delta |G_q| \le t $$を満たすなら+1.
(???ここの解釈は果てしなく怪しい???)
(???dの決め方についてはd=4でRosenfeldのd4距離関数を使っていると書いてあるように読める???)
*** Regularity
上の四つの各特長量の標準偏差から計算する.
$$ F_{reg} = 1-r ( \sigma _{crs} + \sigma _{con} + \sigma _{dir} + \sigma _{lin}) $$
(???標準偏差はどうやって計算するの???)
(???一般的かどうかを見ているということだから複数の画像から出揃ったところで計算するもの???)
*** Roughness
Coarsness と Contrast の和.従属変数?
$$ F_{rgh} = F_{crs} + F_{con} $$
** 参考文献
- Tamura, H., Mori, S., & Yamawaki, T. (1978). Textural features corresponding to visual perception. IEEE Transaction on Systems, Man, and Cybernetics, 8(6), 460–472.
* Tamura features
画像処理における特徴量.
** 特徴量の詳細
以下の六つの要素から特徴ベクトルを構成する.
$$ (f_{crs}, f_{con}, f_{dir}, f_{lin}, f_{reg}, f_{rgh}) $$
*** Coarsness
まず各点の $$ 2^n \times 2^n $$ サイズの近傍の平均を求める.
1-32あたりまでを使う?
点 $$ (x,y) $$ の $$ 2^k \times 2^k $$ 近傍の平均は以下のように求められる.
$$ A_k(x,y) = \sum _{i=x-2^{k-1}} ^{x+2^{k-1}-1} \sum _{i=y-2^{k-1}} ^{y+2^{k-1}-1} f(i,j)/2^{2k} $$
$$ f(i,j) $$ は点 $$ (i,j) $$ のグレーレベル.
次に自分の点を中心として対称となる位置にある
重なり合うことの無い領域同士の平均の差分を
各方向において各点で計算する.
水平の場合は
$$ E_{k,h} (x,y) = | A_k(x+2^{k-1},y) - A_k(x-2^{k-1},y) | $$
(???何方向くらいいるだろうか???)
次に各点において $$ E $$ を最大化する $$ k $$ を求め,ベストなウインドウサイズを求める.
$$ S_{best}(x,y)=2^k $$
$$ E_k = E_{max} = \max (E_1,E_2, \cdots E_L) $$
1-Lはkの範囲.
最後に画像中の各ピクセルの$$S_{best}$$の平均をとる.
$$ F_{crs} = (1/(m \times n)) \sum _i ^m \sum _j ^n S_{best}(i,j) $$
m,nは有効な画素範囲を示す.
(???Fとfの違いは何???)
*** Contrast
コントラストの定義は
$$ f_2 = \sum _n n^2 ( \sum \sum _{|i-j|=n} p(i,j)) $$
$$ p(i,j) $$ は $$ n \times n $$ の gray-level spatial dependence matrix
(???この上の定義は触れただけで使っていないのでは???)
画像中のグレーレベルの分布から
尖度$$ \alpha _4 $$を以下のように求める.
$$ \alpha _4 = \mu _4 / \sigma ^4 $$
$$ \mu _4 $$ は四次モーメント,
$$ \sigma ^2 $$ は分散,$$ \sigma $$ は標準偏差.
$$ F_{con} = \sigma / \alpha _4 ^n $$
nは実験的に1/4がよいらしい.
*** Directionality
各画素のエッジのマグニチュードと角度を求める.
$$ | \Delta G | = (| \Delta _H | + | \Delta _V |)/2 $$
$$ \theta = \tan ^{-1} ( \Delta _V / \Delta _H ) + \pi /2 $$
$$ \Delta _H , \Delta _V $$ はそれぞれ水平,垂直方向のPrewittフィルタをかけた画像.
次にヒストグラム $$ H_D $$ を求める.
$$ H_D (k) = N _{\theta} (k) / \sum _{i=0} ^{n-1} N _{\theta} (i) $$
kは0から(n-1)まで.
$$ N _{\theta} (k) $$ は
$$ (2k-1) \pi /2n \le \theta < (2k+1) \pi /2n $$ 且つ $$ | \Delta G | \ge t $$を満たす点の数.
元の文献ではn=16,t=12としている.
ここから $$ F_{dir} $$ を以下のように求める.
$$ F_{dir} = 1-r n_p \sum _p ^{n_p} \sum _{ \phi \in w_p } ( \phi - \phi _p ) ^2 H_D ( \phi ) $$
$$ n_p $$ はピークの数,
$$ \phi _p $$ は $$ H_D $$ のp番目のピーク,
$$ w_p $$ はp番目のピークの範囲,
$$ r $$ は $$ \phi $$ に関連した正規化要素,
$$ \phi $$ は0からn-1までの方向をあらわすコード.
ただし,ピークが二つ以上のときは考慮していない.
$$ H_D (v_{12}) / H_D ( \phi _2 ) < 0.5 ,$$
$$ H_D (v_{21}) / H_D ( \phi _2 ) < 0.5 ,$$
$$ H_D ( \phi _2 ) / H_D ( \phi _1 ) > 0.2 $$
の三条件を満たすなら$$ n_p=2 $$,そうでないなら$$ n_p=1 $$.
ここで
$$ v_{12} $$ はピーク $$ \phi _1 , \phi _2 $$ の間の極小値の位置.
$$ v_{21} $$ はピーク $$ \phi _2 , \phi _1 $$ の間の極小値の位置.
(???サイクリックなので成り立つということか???)
(???二つのピークはどう決めるか???)
*** Line-likeness
$$ F_{lin} = \sum _i ^n \sum _j ^n P_{Dd}(i,j) \cos |(i-j)2 \pi / n | / \sum _i ^n \sum _j ^n P_{Dd}(i,j) $$
$$ P_{Dd} $$ は $$ n \times n $$の local direction co-occurrence matrix of points at distance.
ここのnというのはDirectionalityで作ったnと同じ,つまりエッジ勾配の方向を表している.
i,jもエッジ勾配の方向で,つまり画像中の各点において,
ある点pにおける勾配方向がiであったときにその勾配方向にdだけ移動し,
そのときの点qの勾配方向をjとする.これで(i,j)を決定できる.
そのときのp,qにおける勾配の大きさが$$ \Delta |G_p| \le t , \Delta |G_q| \le t $$を満たすなら+1.
(???ここの解釈は果てしなく怪しい???)
(???dの決め方についてはd=4でRosenfeldのd4距離関数を使っていると書いてあるように読める???)
*** Regularity
上の四つの各特長量の標準偏差から計算する.
$$ F_{reg} = 1-r ( \sigma _{crs} + \sigma _{con} + \sigma _{dir} + \sigma _{lin}) $$
(???標準偏差はどうやって計算するの???)
(???一般的かどうかを見ているということだから複数の画像から出揃ったところで計算するもの???)
*** Roughness
Coarsness と Contrast の和.従属変数?
$$ F_{rgh} = F_{crs} + F_{con} $$
** 参考文献
- Tamura, H., Mori, S., & Yamawaki, T. (1978). Textural features corresponding to visual perception. IEEE Transaction on Systems, Man, and Cybernetics, 8(6), 460–472.
表示オプション
横に並べて表示:
変化行の前後のみ表示: