前回までのエントリでは、二項分類(パーセプトロン)を扱っていましたが、 今回は、3種以上の分類を行う線形多項分類。
基本は、予測関数 f(x1,x2) で形成される平面を考える
今回の線形多項分類では、以下の予測関数 f(x1,x2) と x1, x2, f(x1,x2) により形成される平面を利用します。
3種へ分類する場合、交差する3平面による交点を算出
今回の多項分類では3種に分類しますが、 この分類の為に、交差する3平面による交点を算出します。
上記の3平面の交点は、次の連立方程式により求めることができます
この連立方程式を行列で表すと、次の通り
よって、3平面の工程は、Mの逆行列により求まります
f1(x1,x2), f2(x1,x2) , f3(x1,x2) をソフトマックスにより確率で表現
ある点(x1, x2)が、領域(1)~(3)に属する確率を、 P1(x1,x2), P2(x1,x2), P2(x1,x2) としたとき、 P1(x1,x2) + P2(x1,x2) + P2(x1,x2) = 1 が成立しますが、 これをソフトマックス関数で表すと、次のようになります。
ソフトマックス関数からシグモイド関数を導出
先程のソフトマックス関数までで、線形多項分類の内容は、ほぼ完了ですが、 おまけでソフトマックス関数からシグモイド関数を導出します。
先程のソフトマックス関数において、j=2 のとき、i=1の式は次のようになります。
この分母分子を で割り、少々、変更すると シグモイド関数を導出できます。
ソフトマックス関数の微分 (導関数)
もう一つおまけで、ソフトマックス関数の微分 (導関数)を記載しておきます。
以前のエントリでシグモイド関数の微分(導関数)の導出を行っていますので、 今回、ソフトマックス関数の微分の導出は記載しません。