Skip to content

Commit

Permalink
feat: 主成分分析
Browse files Browse the repository at this point in the history
  • Loading branch information
xhiroga committed Jul 23, 2024
1 parent 276d440 commit 4b2d7af
Showing 1 changed file with 5 additions and 0 deletions.
5 changes: 5 additions & 0 deletions computer-science/machine-learning/README.md
Original file line number Diff line number Diff line change
Expand Up @@ -112,6 +112,11 @@ $P = \prod_{n=1}^{N} N(t_n|f(x_n), \sigma^2)$

#### 主成分分析

次元の多いデータを説明するにあたって、主な成分とそれを補う成分で説明できると全体像が分かりやすい。例えば、中学校のある学年のテストの成績のばらつきを説明する時に、「国語は〇〇で得意不得意が分かれて、数学は✗✗で〜」と全て説明するより、「総合成績で見ると3グループに分けられます。平均的なグループは、文系科目と理系科目で次のように分かれます...」のような説明の方が、頭の中で順を追って思い出しやすい。次元削減の手法の中でも、データの特徴を最もよく表す次元から順に見出す方法として主成分分析(PCA, Principal Component Analysis)がある。[^intage_401]手順としては、初めに射影した時にすべての次元の特徴の分散が最大になるような線を引き、次にその線と直行する線の中で、同様に射影すると分散が最大になるような線を選ぶ。このようにして、データを説明できると判断できるところまで線、つまり成分を選ぶ。なお、これは相関行列の固有値分解と等価であるそうだ。
[^intage_401]: [主成分分析とは](https://www.intage.co.jp/glossary/401/)

PCAはニューラルネットワークに対しても適用することができる。例えば、隠れ層の値を視覚化し、似たデータが近くにあるかを分析することは、モデルが適切に学習できてない場合の原因を探ることに役立つ。

#### 隠れマルコフモデル

### 機械学習の評価方法
Expand Down

0 comments on commit 4b2d7af

Please sign in to comment.