第5回の教材 (2)   AIシステムの性能評価

機械学習・深層学習も万能ではないので

 前回、機械学習・深層学習も万能ではない、というお話をしました。 ですから、AI システムには性能評価が必要です。

AI システムの性能評価指標

 たとえば、AIシステムに 真/偽 を判定させる場合
  • 正解率 ... 判定の何%が正解であったか
  • 再現率 ... 本当は真であるケースの、何%を真と判定できたか
  • 適合率(= 精度)... 真と判定した中で、何%が正解であったか
といった指標で性能を評価します。例えば $100$ 件の事例があって
本当は真本当は偽
AI が真と判定$34$ 件$23$ 件
AI が偽と判定$5$ 件$38$ 件
であったとすると
  • 正解率 $=\displaystyle{\frac{34+38}{100}} = 72\%$
  • 再現率 $=\displaystyle{\frac{34}{34+5}}=87.2\%$
  • 適合率 $=\displaystyle{\frac{34}{34+23}}=59.6\%$
ということになります。

例えばコロナ診断 AI システムがあったとして

  • 再現率は高いが適合率が低い
    ⇒ 陽性者を高確率で発見できるが、陰性者も陽性と判定しまう確率が高い
  • 再現率は低いが適合率が高い
    ⇒ 陰性者を陽性と誤判定することは少ないが、陽性の人を見逃す確率が高い
再現率も適合率も高いのが理想ですが、なかなかそうはいきません。状況によって、重視すべき指標を考える必要があります。