Dywergencja Jensena-Shannona

Dywergencja Jensena-Shannona – miara rozbieżności między dwoma rozkładami prawdopodobieństwa[1].

Definicja

Miara opisana jest następującym wzorem:

J S D ( p 1 , p 2 ) = H ( π 1 p 1 + π 2 p 2 ) π 1 H ( p 1 ) π 2 H ( p 2 ) , {\displaystyle \mathrm {JSD} (p_{1},p_{2})=H(\pi _{1}p_{1}+\pi _{2}p_{2})-\pi _{1}H(p_{1})-\pi _{2}H(p_{2}),}

gdzie π 1 {\displaystyle \pi _{1}} i π 2 {\displaystyle \pi _{2}} oznaczają wagi, p 1 {\displaystyle p_{1}} i p 2 {\displaystyle p_{2}} oznaczają porównywane rozkłady, a H {\displaystyle H} jest funkcją entropii Shannona[1].

W przypadku dwóch rozkładów opisujących zmienną losową X {\displaystyle X} i równych wag ( π 1 = π 2 = 0 , 5 ) {\displaystyle (\pi _{1}=\pi _{2}=0{,}5)} wzór na dywergencję Jensena-Shannona jest następujący[1]:

J S D ( p 1 , p 2 ) = 1 2 x X p 1 ( x ) log 2 p 1 ( x ) 1 2 p 1 ( x ) + 1 2 p 2 ( x ) + 1 2 x X p 2 ( i ) log 2 p 2 ( x ) 1 2 p 1 ( x ) + 1 2 p 2 ( x ) , {\displaystyle \mathrm {JSD} (p_{1},p_{2})={\frac {1}{2}}\sum _{x\in X}p_{1}(x)\log _{2}{\frac {p_{1}(x)}{{\frac {1}{2}}p_{1}(x)+{\frac {1}{2}}p_{2}(x)}}+{\frac {1}{2}}\sum _{x\in X}p_{2}(i)\log _{2}{\frac {p_{2}(x)}{{\frac {1}{2}}p_{1}(x)+{\frac {1}{2}}p_{2}(x)}},}

co oznacza, że dywergencję Jensena-Shannona można wyrazić jako średnią dywergencji Kullbacka-Leiblera ( K L D ) : {\displaystyle (KLD){:}}

J S D ( p 1 , p 2 ) = 1 2 K L D ( p 1 , m ) + 1 2 K L D ( p 2 , m ) , {\displaystyle \mathrm {JSD} (p_{1},p_{2})={\frac {1}{2}}KLD(p_{1},m)+{\frac {1}{2}}KLD(p_{2},m),}

gdzie m = 1 2 p 1 + 1 2 p 2 {\displaystyle m={\frac {1}{2}}p_{1}+{\frac {1}{2}}p_{2}} [2].

Własności

Dywergencja Jensena-Shannona jest nieujemna i równa 0 w przypadku identyczności rozkładów. W przeciwieństwie do wielu miar dywergencji rozkładów pozwalających porównywać dwa rozkłady, dywergencja Jensena-Shannona może być uogólniona na dowolną skończoną liczbę rozkładów[1].

Przypisy

  1. a b c d JianhuaJ. Lin JianhuaJ., Divergence Measures Based on the Shannon Entropy, „IEEE Transactions on Information Theory”, 37 (1), 1991, s. 145–151, DOI: 10.1109/18.61115 .
  2. JinghuiJ. Lu JinghuiJ., MaeveM. Henchion MaeveM., Brian MacB.M. Namee Brian MacB.M., Diverging Divergences: Examining Variants of Jensen Shannon Divergence for Corpus Comparison Tasks, „Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020)”, Marsylia 2020, s. 6740–6744 .