Wikipedia preview

出典(authority):フリー百科事典『ウィキペディア（Wikipedia）』「2020/07/18 17:47:13」(JST)

wiki ja

この項目では、情報量（エントロピー）の概念の情報理論的側面について説明しています。熱力学的側面については「エントロピー」をご覧ください。

「データ量」とは異なります。

情報量（じょうほうりょう）やエントロピー（英: entropy）は、情報理論の概念で、あるできごと（事象）が起きた際、それがどれほど起こりにくいかを表す尺度である。ありふれたできごと（たとえば「風の音」）が起こったことを知ってもそれはたいした「情報」にはならないが、逆に珍しいできごと（たとえば「曲の演奏」）が起これば、それはより多くの「情報」を含んでいると考えられる。情報量はそのできごとが本質的にどの程度の情報を持つかの尺度であるとみなすこともできる。

なおここでいう「情報」とは、あくまでそのできごとの起こりにくさ（確率）だけによって決まる数学的な量でしかなく、個人・社会における有用性とは無関係である。たとえば「自分が宝くじに当たった」と「見知らぬAさんが宝くじに当たった」は、前者の方が有用な情報に見えるが、両者の情報量は全く同じである（宝くじが当たる確率は所与条件一定のもとでは誰でも同じであるため）。

選択情報量（自己エントロピー）と平均情報量（エントロピー）

それぞれのできごとの情報量だけでなく、それらのできごとの情報量の平均値も情報量と呼ぶ。両者を区別する場合には、前者を選択情報量（自己エントロピーとも）、後者を平均情報量（エントロピーとも）と呼ぶ。

選択情報量

事象 $E$ が起こる確率を $P(E)$ とするとき、事象 $E$ が起こったことを知らされたとき受け取る（選択）情報量 $I(E)$ を

I(E)=\log {\frac {1}{P(E)}}=-\log P(E)

と定義する。

起こりにくい事象（＝生起確率が低い事象）の情報量ほど、値が大きい。

上式中の対数 ( $\log$

 
   
     
       log
     
   
   {\displaystyle \log }

) の底として何を選んでも、情報量の値が定数倍変わるだけなので、本質的な差はないものの、底としては2を選ぶことが多い。

底が2の場合、 $1/2^{n}$

 
   
     
       1
       
         /
       
       
         2
         
           n
         
       
     
   
   {\displaystyle 1/2^{n}}

の確率で起こる事象の情報量は

n

 
   
     
       n
     
   
   {\displaystyle n}

である。

直観的意味

整数 $u$ に対し、 $u$ の対数 $\log _{m}u$ は $m$ 進法での $u$ の桁数にほぼ等しい値を表す。したがって、確率 $1/u$ で起こる事象の情報量は、ほぼ $u$ の桁数になる。

情報量の加法性

AとBが独立な事象の場合、「AもBも起こる」という事象の情報量は、Aの情報量とBの情報量の和である。

情報量には加法性がある。例えば、52枚のトランプから無作為に1枚を取り出すという試行を考える。「取り出したカードはハートの4である」という事象の情報量は、前述の定義からlog52 であると分かる。ここで、「取り出したカードのスートはハートである」という事象と「取り出したカードの数字は4である」という事象の二つを考えると、前者の情報量はlog4、後者はlog13 である。この両者の和はlog4 + log13 = log(4×13) = log52 となり、「取り出したカードはハートの4である」という事象の情報量と等しい。これは直感的要請に合致する。

平均情報量（エントロピー）

$\Omega$ を、台が有限集合である確率空間とする。 $\Omega$ 上の確率分布Pが与えられたとき、各事象 $A\in \Omega$ の選択情報量 $-\log P(A)$ の期待値

H(P)=-\sum _{A\in \Omega }P(A)\log P(A)

をPのエントロピーと呼ぶ（平均情報量、シャノン情報量、情報論のエントロピーとも）。

ただし、ここでP(A)=0のときは、 $P(A)\log P(A)=0$

 
   
     
       P
       (
       A
       )
       log
       ⁡
       P
       (
       A
       )
       =
       0
     
   
   {\displaystyle P(A)\log P(A)=0}

とみなす。これは

\lim _{p\to +0}p\log p=0

 
   
     
       
         lim
         
           p
           →
           +
           0
         
       
       p
       log
       ⁡
       p
       =
       0
     
   
   {\displaystyle \lim _{p\to +0}p\log p=0}

であることによる。

また有限集合U上の値を取る確率変数Xが確率分布Pに従う場合には、XのエントロピーをH(X)=H(P)によって定める。すなわち、

H(X)=-\sum _{x\in U}\Pr(X=x)\log \Pr(X=x)

。

エントロピーは常に非負の値（または無限大）を取る。

値x、yがそれぞれ確率変数X、Yに従う場合には、組 $(x,y)$

 
   
     
       (
       x
       ,
       y
       )
     
   
   {\displaystyle (x,y)}

も確率変数とみなせる。この確率変数を

(X,Y)

 
   
     
       (
       X
       ,
       Y
       )
     
   
   {\displaystyle (X,Y)}

と書くことにすると、確率変数 $(X,Y)$

 
   
     
       (
       X
       ,
       Y
       )
     
   
   {\displaystyle (X,Y)}

のエントロピーは

H(X,Y)=-\sum _{x,y}\Pr(X=x,Y=y)\log \Pr(X=x,Y=y)

になる。これを結合エントロピーと呼ぶ。

$X,Y$

 
   
     
       X
       ,
       Y
     
   
   {\displaystyle X,Y}

が互いに独立な確率変数である場合には、

H(X,Y)

 
   
     
       H
       (
       X
       ,
       Y
       )
     
   
   {\displaystyle H(X,Y)}

は $H(X)+H(Y)$

 
   
     
       H
       (
       X
       )
       +
       H
       (
       Y
       )
     
   
   {\displaystyle H(X)+H(Y)}

に一致する。すなわち、全体の情報量 $H(X,Y)$

 
   
     
       H
       (
       X
       ,
       Y
       )
     
   
   {\displaystyle H(X,Y)}

は、それぞれの確率変数の情報量の和である。

しかし、XとYが互いに独立ではない場合は、 $H(X,Y)$

 
   
     
       H
       (
       X
       ,
       Y
       )
     
   
   {\displaystyle H(X,Y)}

と

H(X)+H(Y)

 
   
     
       H
       (
       X
       )
       +
       H
       (
       Y
       )
     
   
   {\displaystyle H(X)+H(Y)}

は一致せず、前者より後者の方が大きい値になる。両者の情報量の差を相互情報量と呼び、

I(X,Y)=H(X)+H(Y)-H(X,Y)

で表す。相互情報量は常に非負の値になる。

事象Bが生じているという条件下における事象Aの条件付き情報量を $-\log \Pr(A|B)$

 
   
     
       −
       log
       ⁡
       Pr
       (
       A
       
         |
       
       B
       )
     
   
   {\displaystyle -\log \Pr(A|B)}

によって定める。確率変数Xが与えられたとき、事象「

X=x

 
   
     
       X
       =
       x
     
   
   {\displaystyle X=x}

」の条件付き情報量 $-\log \Pr(X=x|B)$

 
   
     
       −
       log
       ⁡
       Pr
       (
       X
       =
       x
       
         |
       
       B
       )
     
   
   {\displaystyle -\log \Pr(X=x|B)}

のxに関する平均値を条件付きエントロピーといい、

H(X|B)=-\sum _{x}\Pr(X=x|B)\log \Pr(X=x|B)

で表す。

さらに確率変数Yが与えられたとき、事象「 $Y=y$

 
   
     
       Y
       =
       y
     
   
   {\displaystyle Y=y}

」が生じているという条件下における事象「

X=x

 
   
     
       X
       =
       x
     
   
   {\displaystyle X=x}

」の条件付きエントロピー $H(X|Y=y)$

 
   
     
       H
       (
       X
       
         |
       
       Y
       =
       y
       )
     
   
   {\displaystyle H(X|Y=y)}

のyに関する平均値

H(X|Y)=\sum _{y}\Pr(Y=y)H(X|Y=y)

もやはり条件付きエントロピーと呼ぶ。

エントロピーの基本的性質

情報量は確率だけによって決まる。
情報量は非負の値または無限大を取る。
nビットのビット列の空間（情報源）から（一様ランダムとは限らない方法で）ランダムにビット列を選んだときのエントロピーは、n以下になる。エントロピーがnになる必要十分条件は、ビット列が一様ランダムに選ばれることである。
確率変数XとYが独立である必要十分条件は、 $H(X)+H(Y)=H(X,Y)$ が成立することである。

コイン投げの例

あるコインを投げたときに表が出る確率を $p$ 、裏が出る確率を $1-p$ とする。このコインを投げたときに得られる平均情報量（エントロピー）は、

\left.H(X)=-p\log {p}-(1-p)\log {(1-p)}\right.

である。

この関数 $f(p)=-p\log {p}-(1-p)\log {(1-p)}$

 
   
     
       f
       (
       p
       )
       =
       −
       p
       log
       ⁡
       
         p
       
       −
       (
       1
       −
       p
       )
       log
       ⁡
       
         (
         1
         −
         p
         )
       
     
   
   {\displaystyle f(p)=-p\log {p}-(1-p)\log {(1-p)}}

をエントロピー関数と呼ぶ。

図を見ると分かるように、 $p=0$

 
   
     
       p
       =
       0
     
   
   {\displaystyle p=0}

と

p=1

 
   
     
       p
       =
       1
     
   
   {\displaystyle p=1}

では $H$

 
   
     
       H
     
   
   {\displaystyle H}

はゼロである。つまり、コインを投げる前から裏または表が出ることが確実に分かっているときに得られる平均情報量は、ゼロである。 $H$

 
   
     
       H
     
   
   {\displaystyle H}

が最大になるのは $p=1/2$

 
   
     
       p
       =
       1
       
         /
       
       2
     
   
   {\displaystyle p=1/2}

のときであり、一般にすべての事象（できごと）が等確率になるときにエントロピーが最大になる。

連続系のエントロピー

実数値を取る確率変数Xの確率密度関数をp(x)とするとき、Xのエントロピーを

h(X)=-\int _{-\infty }^{\infty }p(x)\log p(x)dx

によって定義する。

Xが有限集合に値を取る確率変数である場合には、Xのシャノン情報量 $H(X)$

 
   
     
       H
       (
       X
       )
     
   
   {\displaystyle H(X)}

も定義できる。Xがn通りの値を取るとき、

H(X)

 
   
     
       H
       (
       X
       )
     
   
   {\displaystyle H(X)}

と $h(X)$

 
   
     
       h
       (
       X
       )
     
   
   {\displaystyle h(X)}

は、

h(X)=H(U_{n})-H(X)

を満たす。

ただし、ここで $U_{n}$

 
   
     
       
         U
         
           n
         
       
     
   
   {\displaystyle U_{n}}

はn元集合上の一様分布とする（すなわち

H(U_{n})=\log n

 
   
     
       H
       (
       
         U
         
           n
         
       
       )
       =
       log
       ⁡
       n
     
   
   {\displaystyle H(U_{n})=\log n}

）。

Renyiエントロピー

$\Omega$ を、台が有限集合である確率空間とする。Pを $\Omega$ 上の確率分布とし、 $\alpha$ を非負の実数とする。

$\alpha \neq 1$

 
   
     
       α
       ≠
       1
     
   
   {\displaystyle \alpha \neq 1}

のとき、Pのdegee

\alpha

 
   
     
       α
     
   
   {\displaystyle \alpha }

のRenyiエントロピーを

H_{\alpha }(P)={\frac {\log(\sum _{A\in \Omega }P(A)^{\alpha })}{1-\alpha }}

によって定義する。また、 $\alpha =1,\infty$ の場合には、Renyiエントロピーを

\left\{{\begin{array}{lll}H_{1}(P)&=\lim _{\alpha \to 1}&H_{\alpha }(P)\\H_{\infty }(P)&=\lim _{\alpha \to \infty }&H_{\alpha }(P)\end{array}}\right.

によって定義する。

単にRenyiエントロピーと言った場合は $H_{2}(P)$

 
   
     
       
         H
         
           2
         
       
       (
       P
       )
     
   
   {\displaystyle H_{2}(P)}

を意味することも多い。

さらに、確率変数Xが確率分布Pに従うとき、 $H_{\alpha }(X)$

 
   
     
       
         H
         
           α
         
       
       (
       X
       )
     
   
   {\displaystyle H_{\alpha }(X)}

を

H_{\alpha }(X)=H_{\alpha }(P)

 
   
     
       
         H
         
           α
         
       
       (
       X
       )
       =
       
         H
         
           α
         
       
       (
       P
       )
     
   
   {\displaystyle H_{\alpha }(X)=H_{\alpha }(P)}

によって定義する。

Renyiエントロピーは以下の性質を満たす：

$H_{0}(P)=\log \#\Omega$ が成立する。
$H_{1}(P)$ はシャノン情報量 $H(P)=-\sum _{A\in \Omega }P(A)\log P(A)$ と一致する。
$\alpha$ が2以上の整数の場合には、 $H_{\alpha }(P)={\frac {1}{1-\alpha }}\log \Pr(X_{1}=\cdots =X_{\alpha })$ が成立する。ここで、 $X_{1},\ldots ,X_{\alpha }$ は確率分布 $P$ に従う独立同一分布であって、 $\Pr(X_{1}=\cdots =X_{\alpha })$ は $x_{1},\ldots ,x_{\alpha }$ をそれぞれ $X_{1},\ldots ,X_{\alpha }$ に従って選んだときに $x_{1}=\cdots =x_{\alpha }$ が成立する確率とする。
$H_{\infty }(P)=\min _{A\in \Omega }\{-\log P(A)\}$ が成立する。この $H_{\infty }(P)$ をminエントロピーともいう。

歴史

「エントロピー」の概念は1865年にルドルフ・クラウジウスがギリシャ語の「変換」を意味する言葉を語源として、熱力学における気体のある状態量として導入した。これは統計力学では微視的な状態数の対数に比例する量として表される。1929年にはレオ・シラードが、気体についての情報を観測者が獲得することと統計力学におけるエントロピーとの間に直接の関係があることを示し、現在 1 ビット（1 シャノン）と呼ぶ量が統計力学で k ln 2 に対応するという関係を導いていた^[1]。

現在の情報理論におけるエントロピーの直接の導入は1948年のクロード・シャノンによるもので、その論文『通信の数学的理論』でエントロピーの概念を情報理論に応用した^[2]。シャノン自身は熱統計力学でこの概念と関連する概念がすでに使われていることを知らずにこの定義に到達したが、その名称を考えていたとき同僚フォン・ノイマンが、熱統計力学のエントロピーに似ていることから示唆したもので、フォン・ノイマンは「統計エントロピーが何なのかを理解してる人は少ないから、議論になったら有利であろう」と語ったとされる^[3]^[4]。しかしシャノンはフォン・ノイマンの影響を否定している^[5]。

なお、シャノン以前にもラルフ・ハートレーが1928年に、集合Aに対して $\log \#A$

 
   
     
       log
       ⁡
       #
       A
     
   
   {\displaystyle \log \#A}

という量を考察している（“

\#A

 
   
     
       #
       A
     
   
   {\displaystyle \#A}

”はAの元数）。 $\log \#A$

 
   
     
       log
       ⁡
       #
       A
     
   
   {\displaystyle \log \#A}

はA上の一様分布のエントロピーに一致する。現在では、 $\log \#A$

 
   
     
       log
       ⁡
       #
       A
     
   
   {\displaystyle \log \#A}

をAのハートレー・エントロピーと呼ぶ。

単位

情報量は本来無次元の量である。しかし、対数の底として何を用いたかによって値が異なるので，単位を付けて区別している。前述のように、情報量は確率の逆数の桁数の期待値なので、単位も桁数のそれを流用する。この為、対数の底として2、e、10を選んだときの情報量の単位は、それぞれビット(bit)、ナット(nat)、ディット(dit)である。

また、今のところ主流ではないものの、1997年に日本工業規格 JIS X 0016:1997（これは国際規格 ISO/IEC 2382-16:1996と一致している）は、これらの量を表す単位を別に定めている（ノートも参照）。

**対数の底と単位**
底	通常の単位	JISおよびISOが定めた単位	備考
2	ビット (bit)	シャノン (shannon)	lb, 二進対数
e=2.718…	ナット (nat)	ナット (nat)	ln, 自然対数
10	ディット (dit)	ハートレー (hartley)	lg, 常用対数

単位「シャノン」、「ハートレー」の名称は、それぞれ情報量の概念を提案したクロード・シャノン、ラルフ・ハートレーにちなむ。

脚注

[脚注の使い方]

Shannon entropy calculator (English)
A Mathematical Theory of Communication Shannon 1948 (English)

^ Szilard, L. (1929) "Über die Entropieverminderung in einem Thermodynamischen System bei Eingriffen Intelligenter Wesen", Zeitschrift für Physik 53:840–856
^ Cover & Thomas 2006, Historical note.
^ 『ファインマン計算機科学』 p. 96 ファインマンによる脚注*8で、「言い伝えによれば」と断りのうえでこの説を紹介している。
^ 韓太舜、小林欣吾『情報と符号の数理』
^ CLAUDE E. SHANNON: An Interview Conducted by Robert Price, 28 July 1982

参考文献

Cover, Thomas M.; Thomas, Joy A. (2006). Elements of information theory (Second ed.). John Wiley & Sons. ISBN 978-0-471-24195-9. MR2239987

外部リンク

情報量 - 脳科学辞典

UpToDate Contents

全文を閲覧するには購読必要です。 To read the full text you will need to subscribe.

1. 遺伝カウンセリング：家族歴の解釈とリスク評価genetic counseling family history interpretation and risk assessment [show details]
…verify information. Medical information from blood relatives on the maternal and paternal sides of the family should be included, along with the causes of death and/or previous testing information. The patient …
2. 集中治療室（ICU）の倫理：インフォームドコンセントethics in the intensive care unit informed consent [show details]
…surrogate has decision-making capacity Discussing pertinent medical information Ensuring adequate understanding of the information Ensuring voluntariness of patient' or surrogate decision Jointly …
3. 遺伝子検査での二次的所見secondary findings from genetic testing [show details]
…disorders, 1 to 8 percent of individuals opted out of receiving information on secondary findings, with the higher percentage of opt outs for information about recessive disorders and pharmacogenomic variants …
4. 糖尿病を有する小児の自己マネージメントに関する教育self management education for the child with diabetes mellitus [show details]
…should receive the same safety-related information as that provided to the child. Schoolteachers and coaches, bus drivers, and the school nurse particularly need information about the child diabetes. This can …
5. 睡眠不足：評価とマネージメントinsufficient sleep evaluation and management [show details]
…can be quantified using the Epworth Sleepiness Scale (ESS) . Sleep diaries provide valuable information about sleep patterns and practices to ensure patients are getting a sufficient amount of habitual …

Japanese Journal

多値文書分類のための情報理論的基準による2元符号語表の構成法

雲居玄道,八木秀樹,後藤正幸,平澤茂一
情報処理学会論文誌数理モデル化と応用（TOM） 13(1), 1-12, 2020-03-25
多値分類器の構成法の1つに符号理論の枠組を導入した誤り訂正符号に基づく多値分類法がある．本研究では，この枠組に基づく多値分類器の構成に対し，分類誤り率に対して性能の良い符号語構成法を検討する．実データによる実験結果では，冗長な判別器を削除して得られるすべての二値判別器の組合せを並べたExhaustive Codeよりも短い符号長において性能の良い構成が存在する．分類誤り率という点においては，個々の …
NAID 170000181811

Fisher情報量と量子ジャイロセンサ : 量子確率論の池原解釈 (信号処理)

廣田修
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 119(377), 191-196, 2020-01-23
NAID 40022156377

Fisher情報量と量子ジャイロセンサ : 量子確率論の池原解釈 (情報理論)

廣田修
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 119(376), 191-196, 2020-01-23
NAID 40022155860

Related Pictures

消化可能情報量」はほぼ消費情報量流通情報量消費第1回情報量の多さが拡大してここに現代人の気持ちを端的に 2009年度の流通情報量、DVDなら1 メディアグループ別の情報量の情報量を大きくしている図表我が国における情報量の

★リンクテーブル★

拡張検索	「赤池の情報量基準」
関連記事	「量」「情報」

「赤池の情報量基準」

　　[★]

英: Akaike information criterion、AIC

「量」

　　[★]

英: amount、volume、content、quantity
関: 巻、含有量、含量、体積、達する、容積、内容物、内容、ボリューム

「情報」

　　[★]

英: information、informational
関: 案内、通知

[1] Szilard, L. (1929) "Über die Entropieverminderung in einem Thermodynamischen System bei Eingriffen Intelligenter Wesen", Zeitschrift für Physik 53:840–856

[FOOTNOTECoverThomas2006Historical_note-2] Cover & Thomas 2006, Historical note.

[3] 『ファインマン計算機科学』 p. 96 ファインマンによる脚注*8で、「言い伝えによれば」と断りのうえでこの説を紹介している。

[4] 韓太舜、小林欣吾『情報と符号の数理』

[5] CLAUDE E. SHANNON: An Interview Conducted by Robert Price, 28 July 1982

匿名

検索

案内

案内

情報量

Wikipedia preview

wiki ja

目次

選択情報量（自己エントロピー）と平均情報量（エントロピー）

選択情報量

直観的意味

情報量の加法性

平均情報量（エントロピー）

エントロピーの基本的性質

コイン投げの例

連続系のエントロピー

Renyiエントロピー

歴史

単位

脚注

参考文献

関連項目

外部リンク

UpToDate Contents

Japanese Journal

Related Links

Related Pictures

★リンクテーブル★

「赤池の情報量基準」

「量」

「情報」

情報理論

情報量
情報量微分エントロピー条件付きエントロピー交差エントロピー結合エントロピー相互情報量カルバック・ライブラー情報量エントロピーレート
通信路
情報源符号化定理通信路容量通信路符号化定理シャノン＝ハートレーの定理
単位
シャノンナットハートレー
その他
漸近等分割性（英語版）レート歪み理論（英語版）
表話編歴