機械学習における3つの学習方法

機械学習には「教師あり学習」「教師なし学習」「強化学習」と言った3つの学習方法があります。今回はAIを活用する上で知っておきたい3つの学習方法についてご紹介します。

AIと機械学習(Machine Leaning)の位置付け

3つの学習方法をご紹介する前に、AIと機械学習の位置付けを整理したいと思います。
AIとは「人工的に作られた人間と同じ知能を実現させたもの」です。しかし実は、AIには明確な定義はありません。そのため様々な研究者によって定義が定められています。
そしてこのAIですが、大きくは強いAI(汎用型AI)と弱いAI(特化型AI)の2種類に分類されます。強いAIとは、人間のように意思決定し処理を行うAIのことです。一方で弱いAIとは、ある特定の仕事を処理することに特化したAIのことです。現在、様々な分野でAIが実用化されているAIは、実は全て弱いAIとなります。

この弱いAIのアプローチ手法の1つに機械学習があります。機械学習とは「データの中から規則性や判断基準を発見し予測する方法」です。予測を行う際、人ではなくプログラムが自ら学んで予測の精度を高めていくのが機械学習であり、この学習方法として「教師あり学習」「教師なし学習」「強化学習」の3つが存在します。

では3つの学習方法についてご紹介します。

教師あり学習(Supervised Learning)

教師あり学習とは、データを学習する際に予め正解データ(教師データ)を与えてパターンを学習する方法です。機械学習において使用される頻度の高い方法となります。例えば動物の画像から犬か猫を予測する場合、事前に用意した学習用データに「この画像は犬」「この画像は猫」とあらかじめ正解のデータを与えます。正解データは「教師データ」と呼ばれます。このデータをAIが学習して、新たな動物画像から「70%の確率で猫です」という様に予測を立てます。教師あり学習は、学習を繰り返すことで予測精度を上げていくことができます。

教師なし学習(Unsupervised Learning)

教師なし学習とは、データを学習する際に正解データ(教師データ)を与えずに学習する方法です。例えば大量のデータがあり、かつ正解データが与えられていないデータが存在する場合、教師なし学習を利用することで、このデータをグループ化するすることができます。但しグループ化はできますが、何故このグループに分けたかと言った理由は分かりません。色で判断したのか、形で判断したのか、または別の要因で判断したのかは人が類推する必要があります。

強化学習(Reinforcement Learning)

強化学習とは、正解データ(教師データ)を与えず、その代わりに「報酬」を与えて学習させる方法です。エージェントと呼ばれる対象者が行動を起こした際、その行動を観測し、良い状態になった場合には報酬を与えます。この結果をコンピューターが学習していき、より良い状態(結果)を導き出していくのが強化学習となります。強化学習には、累積報酬という考え方がありますので、直近の良し悪しだけで判断するのではなく、長い目で見てより多くの報酬を貰えるように学習をしていきます。

学習方法別の得意分野

3つの学習方法についてご紹介を差し上げましたが、AIを活用をする際はそれぞれの得意分野に応じて学習方法を使い分ける必要があります。

教師あり学習は「分類・予測」が得意です。例えば通販企業において、初回購入者のリストから2回目購入をしそうな顧客を予測したい場合は、教師あり学習を利用します。
教師なし学習は「分割(グループ化)」が得意です。例えば大量の口コミを教師なし学習で学習した場合、文章の特徴からグループ分けをすることができます。但し、前述の通りグループ化した理由は分かりませんので、実際にグループ化された結果を人が見て「これは良い口コミが書かれているグループ」「こちらは悪い口コミが書かれているグループ」と言ったように類推する必要があります。
強化学習は「行動ルールやパターンの学習」が得意です。例えば一時期話題となった「AlphaGo(アルファ碁)」には、強化学習が活用されています。囲碁にはルールがありますが、決まったルールの中で最適な行動をとらせるには強化学習が有効となります。

AIを活用する際は、実施したい内容に合わせた学習方法を選択する必要があります。是非ご参考にしていただければ幸いです。