それでは毛玉諸君、これにて失敬

日々の精進を備忘録的に綴ります。

ビジネスマンがはじめて学ぶベイズ統計学2

引き続き読んでます。
数式に加え、その式のお気持ちや導出を数弱の自分にも理解しやすく書かれているので、入門に最適な気がしています。

ビジネスマンがはじめて学ぶ ベイズ統計学 ―ExcelからRへステップアップ― | 朝野 煕彦, 朝野 煕彦 |本 | 通販 | Amazon

第4章 事前分布を組み入れた推定

例)テレビドラマの視聴率を予測する

状況

  • あるテレビ番組をオンエア前にテストしたい
  • テストの目的は「オンエア後の視聴率を予測する」こと
  • 類似作品の過去の視聴率は15%(600世帯)
  • 一般の視聴者100人を集めて試写テストを行い、このシリーズの番組を見たいと思ったか調査
    •  Y = 1: みたい
    • te Y = 0: みたくない
  • 今回の試写会では X = 10、100人中10人が見たいと回答
  • これらをもとに、新番組の視聴率 \thetaを予測する

ステップ1. 関心のある変数の確率分布を決める

変数Xがどのような確率分布に従うか検討しよう。

  • Xは非負の整数なので、正規分布は候補から外れそう
  • 試行回数は100
  • 視聴率 \thetaは一般視聴者の間では共通だと仮定する

これらを踏まえて、二項分布を用いることにする。

ステップ2. 尤度関数にスイッチする

テストが終わっているのでXは定数になる。
Xが与えられた時の \thetaを尤度関数で求めると、


f(X = 10 | \theta) = \binom{100}{10} \cdot {\theta}^{10} {(1 - \theta)}^{90}

ステップ3. 事前分布を導入する

経験則として、

  • 固定ファン層がついている
  • 過去の平均視聴率は15%超え
  • 制作スタッフ的に視聴率は10~20%に大体おさまる

ベータ分布を使うとこのような既存知識をうまく表現することが出来る。
パラメータは a=90, b=510と定義する。


f(\theta) = \frac{{\theta}^{90 - 1} {(1 - \theta)}^{510 - 1}}{B}

分母の Bは正規化定数でベータ関数を使うと求めることができる。

ステップ4: いよいよ事後分布を求める

尤度関数と事前分布を掛けると、、、


f(X=10|\theta)f(\theta) = \binom{100}{10} \cdot {\theta}^{10} {(1 - \theta)}^{100 - 10} \cdot {\theta}^{90-1} {(1 - \theta)}^{510 - 1} \cdot \frac{1}{B}

定数項を無視すると、事後分布は a=100, b=600のベータ分布と表すことができる。

ステップ5: 事後分布から分かること

視聴率の平均:事前分布 \frac{90}{90 + 510} = 0.150 、事後分布 \frac{100}{100 + 600} = 0.143
ので、目的のテレビ番組の視聴率は、過去作品よりやや低くなると予測されます。

事前分布の選び方

テキストにありがたい図がありました。

敬意が足りずブレてしまっている

上の図で、ケースAは事後分布が理論的に導けるのでシミュレーションの必要はない。
その他のケースではどうやって事後分布を推定すればよいか?
本書ではMCMCを使う方法を紹介する(後の章で)。