ライフハック

AIのキホン、機械学習・統計学・アルゴリズムを学んでみた!【エンジニアなら知っておきたい】

AIのキホン、機械学習・統計学・アルゴリズムを学んでみた

「AIって何ができるの?」

「そもそもAIって何?」

AIって言葉、良く耳にするようになりましたよね。

一つのバズワードになっています。

何でもかんでもAIですが、分かったようで分からないのがAI。

ヨシタカ
ヨシタカ
ロボット?ドラえもん?AIって何かな?

今回、『エンジニアなら知っておきたいAIのキホン』を読んで、機械学習・統計学・アルゴリズムを学んでみました!

AmazonでAIのキホンを購入してみた

2019年7月15日に購入して、半年ほどかけてちょっとずつ読み進めていきました。

このAIのキホンを読むとこんなことが分かります。

AIのキホン
  1. 現在使われてるAI技術って何?
  2. 機械学習とディープラーニングの違いって何?
  3. AI技術が3~5年後のビジネスでどう活用されるの?

これからAIに取り組むエンジニア既にAIに取り組んでいるエンジニア向け、さらには一般の方でもAIについて理解できるように書かれている本。

Amazonの人工知能の売れ筋ランキングで第一位です(2020.2.16時点)。

本書の特長は、古い歴史には触れず、(1)ディープラーニング登場以降の5年間の流れを知り(過去)、(2)今のAI技術の全体像を把握し(現在)、(3)5年後のAI活用イメージを掴む(未来)、の3点。書き下ろしコラムによるていねいな補足もあり、広大で難解なAIの世界をやさしく学ぶことができる。Amazon-エンジニアなら知っておきたいAIのキホンより引用

ヨシタカ
ヨシタカ
AIの入門から専門的なディープなところまで学べます♪

今回はそんなAIのキホンについて学んでみましょう!

そもそもAIって何?

AIのキホン

AIはArtificial Intelligence(アーティフィシャル インテリジェンス)の略称。

Artificial(アーティフィシャル)とは「人工的な」という意味で、Intelligence(インテリジェンス)は「知性」という意味。

日本語では「人工知能」と言われています。

ヨシタカ
ヨシタカ
いやいや、AI(人工知能)ってそもそも何なの?

そう、AIは「人工知能」です!と言われてもよく分からないんですよね。。

AIと一言で言われても・・・

自動運転、異常検知、レコメンド、マッチング、グラフ解析、分析、最適化、予測、検索、RPA、ロボティクス、スマートスピーカー、セキュリティカメラ、パーソナルアシスタント、自然言語理解、意思決定支援、機械翻訳、自動コンテンツ認識、自動分類、テキスト分析、文章生成、音声認識、音声合成、画像認識、画像分析、感情認識・・・

などなど。

色々な言葉をひっくるめて、AI(エーアイ)と言われています。

身近でAI技術が活用されているものだと例えば以下があります。

  • 写真を自動で分類する
  • 英文を他の言語の文に翻訳する
  • 検索エンジンの検索結果を『適切な』順序で並べる

ただし、AIは万能ではなく、人間と同じように、常識を持ち、意識を持って自ら考えるというところまでAIはまだ達していないんです。

AIのメリットって何?

AIを活用するメリットは主に3つあります。

AIを活用するメリット
  1. AIを適切に活用すると、これまで人手に頼ってきた作業を低コストで自動化できるケースもある
  2. AIを適切に活用すると、人の時間をより生産性の高い用途に使えるケースもある
  3. プログラミングの初心者でも AI の活用は可能

例えば、きゅうりの等級を分類するような今まで経験のある人だけが判別していたものを、AI によって誰がやっても同じ基準で判別することを実現しています。

参考記事元組み込みエンジニアの農家が挑む「きゅうり選別AI」 試作機3台、2年間の軌跡

ヨシタカ
ヨシタカ
人間のノウハウを機械に落とし込むことで「効率化」が図れるわけですね。

AIのしくみって何?

2012年頃からのAIブームの火付け役が『機械学習』です。

機械学習はこれまでの普通のITとはちょっと違います。

普通のIT:仕様やルールは人間が決める

一方で、機械学習では最初に数多くのデータを集めます。

機械学習:見分けるルールを自動的に探してくれる

仕様やルールを人間が決める普通のITとは違い、『機械学習』では最初に大量のデータを集め、そのデータの中からコンピュータがルールを自動的に見つけてくれるんです。

ここで、機械学習が主に活用されているのが3つあります。

  • 画像認識
  • 音声認識
  • 文章理解

その画像が何を表しているものなのか判別する技術を「画像認識」、音声が文字情報に変換される技術を「音声認識」、文字情報の構文分析や感情分析をする技術を「文章理解」と呼ばれています。

ただし、機械学習は万能ではありません。

例えばこの写真。

モップ犬
ヨシタカ
ヨシタカ
これって、モップかな?えっ!?犬?!

機械学習を使った画像認識は人間と同じかそれ以上の精度を達成できるケースもありますが、機械学習をすれば100%の精度が出る!と過信してはいけないんです。

機械学習の注意点:機械学習でも100%の精度は出せない

機械学習のしくみとは?

機械学習のしくみ(流れ)は以下の通り。

機械学習のしくみ
  1. 学習データの準備
  2. 機械学習の「モデル」の学習
  3. モデルの利用

まず、お手本となる数百件~数十万件のデータを人間が集めて準備しておく必要があります。

その後、学習データに含まれるパターンを機械学習によって抽出します。

そして、学習済みのモデルを分類や予測に利用するんです。

ヨシタカ
ヨシタカ
でも、「モデル」の学習ってどうするの?

そう、機械学習の「モデル」の学習がキーポイントになります。

ニューラルネットワークとは?

ニューラルネットワーク

画像出典:総務省-人工知能と機械学習

機械学習のアルゴリズムの1つが、『ニューラルネットワーク』

上図の「重み付け」するものを「ニューロン」と言います。

脳の動きにヒントを得て、直感的な判断をするための方法として考え出されたアルゴリズムが、『ニューラルネットワーク』

  1. ニューラルネットワークの個々のニューロンは、複数の情報を集約する働きをする
  2. ニューラルネットワークは人間のような直感的な判断に適した計算方法である
  3. ニューラルネットワークでは、問題を解くためのルール(最適なパラメータ)をコンピュータが自分で探す

ただし、ニューラルネットワークは人間の脳の動きを再現するまでには至っていません。

それぞれの入力をどんな重み付け(パラメータ)で足し合わせれば最適化されるのか、計算機が探します。

そして、正解となるデータ(教師データ)を照会しながら、間違いが少なくなる重み付けの係数を計算機が探していきます。

ルール(重み付け係数)をコンピュータが自分で探す。

ニューラルネットワークデモ
画像出典:TensorFlow Playground

下記サイトでニューラルネットワークの動きが確認できます。

自分で重み付け係数も変更できるので直感的に学ぶことが出来ます。

参考サイトTensorFlow Playground

ディープラーニングとは?

ディープラーニング

画像出典:総務省-人工知能と機械学習

そして、『ニューラルネットワーク』が発展した、深い階層を持つニューラルネットワークのことを『ディープラーニング』と呼びます。

ヨシタカ
ヨシタカ
「ディープ」な「ラーニング」?

そう、ニューロンの数を増やしたり階層を深くすることで賢くなり、3段以上の深い階層を持つニューラルネットワークディープラーニングと言います。

このディープラーニングによって画像認識や音声認識はめざましく発展しました。

ディープラーニングでは、ニューラルネットワークの階層を重ねることでより複雑なパターンを見分けることが可能になるんです。

例えば画像に動物が写っている場合、その輪郭や模様、目や鼻、鼻頭や足などのさまざまな要素を識別し、最終的に写っている動物の品種の判定も可能になります。

  1. 数字やアルファベットの画像を識別できる
  2. 画像内の物体の輪郭やパターンを見分けられる
  3. ディープラーニングを使わない従来の画像認識アルゴリズムよりも多くのケースで認識性能が良い

このディープラーニングの発展により、人の声が音声認識によって文字情報に変換され、その文字情報が文章理解され、最後に画像認識によってロボットが動く、というような技術が実現しています。

「ニューラルネットワーク」や「ディープラーニング」のイメージを確認できるウェブサイトもあります。

内側と外側を分類する、という学習の様子を実際に体験することができます。

ディープラーニング学習

参考サイトA Neural Network Playground

ヨシタカ
ヨシタカ
ディープラーニングの雰囲気がなんとなく分かりますよ♪

AIを使って何がしたいの?

ここまで、AIとは?機械学習とは?ディープラーニングとは?について、ざっくりと分かった気になったかもしれません。

・・・が。

重要なのは、AIを使って何がしたいのかってことです。

AIを使ってなにかやろうと考える場合に心得ておくべきことが3つあります。

  1. データの準備、『品質の良い』データを集めよう!
  2. 目的とデータに合ったアルゴリズムを選ぼう!
  3. トレーニングにはかなり時間が必要だぞ!

ただし、機械学習について、学習しすぎることを『過学習』と言います。

過学習とは、学習データにあまりに適合しすぎて、学習データでは正解率が高いのに学習データとは異なるデータでは正解率が低くなってしまうこと。つまり、学習データだけに最適化されてしまって汎用性がない状態に陥ること。

未知のデータに弱い(応用の効かない)、いわゆる『ガリ勉くん』になってしまうわけです。

そのためにも、『品質の良い』データだったり、最適なアルゴリズム(重み付け係数の求め方)が必要になります。

AIを『育てる』とどうなるの?

AIを『育てる』とどうなるのか?

育て方次第ですが、様々な可能性を秘めています。

  1. 単純作業を黙々とミスなくやってくれる『働き者』
  2. 24時間戦える現在の『企業戦士』
  3. 熟練者の技術を習得して継承する『熟練社員』
  4. 大量データを即時に読んで判断する『聖徳太子』
  5. 人間ができなかったことをやってくれる『天才社員』
ヨシタカ
ヨシタカ
どうAIを『育てる』かあなた次第。

AIって実はあらゆる場面で既に活用されています。

  1. Google翻訳
  2. AIりんな
  3. Googleアシスタント
  4. Siri
  5. SNOW

などなど。

こう見てみると、AIって、既にあらゆるシーンで活用されてますよね。

さあAIのキホンを学んでみよう!

今回はAIのキホンについて学んでみました。

AIは一日してならず。

AIのキホン
  1. 機械学習ではたくさんのデータからルールを見つける
  2. 機械学習のアルゴリズムのひとつがニューラルネットワーク
  3. ニューラルネットワークの階層を深くしたものがディープラーニング

AIのことがちょっとでも分かった気になって、興味を持っていただければ、これ幸いです。

さらに深く学びたい方は、ぜひ本書『AIのキホン、機械学習・統計学・アルゴリズム』を読んでみてください。

全3部構成。
●第1部「人工知能の基礎を理解する」では、AIの基礎と全体像をしっかり理解できるように解説。
●第2部「機械学習のアルゴリズムを学ぶ」では、AIの心臓部となる<機械学習><統計学><アルゴリズム>の3要素とその関係を解説。<機械学習>には「教師あり学習」「教師なし学習」「強化学習」などが、その背後には「回帰」「分類」「クラスタリング」などの<統計学>があり、その解を求める方法には「決定木」「サポートベクターマシーン」「k平均法」など、多くの<アルゴリズム>がある。これらの三角関係をやさしく紐解く。
●第3部「ビジネスに活用するための人工知能を学ぶ」では、著者の調査による最新動向を踏まえ、AIビジネスの将来について業界別に考察。RPA (Robotic Process Automation) の現状についても解説する。Amazon-エンジニアなら知っておきたいAIのキホンより引用

専門用語もけっこうあり、かなりディープな世界まで学べますよ^^

ヨシタカ
ヨシタカ
そう、それがディープラーニング♪(違)

(追伸)

今回ご紹介した『エンジニアなら知っておきたいAIのキホン』Kindle Unlimitedの読み放題でも読むことが出来ます。

一昔前は新刊はほとんどありませんでしたが、最近はビジネス本など新刊も増えてきた感じです。

Kindle Unlimitedに既に加入されている方もぜひ試しに読んでみてみてください♪

Kindle Unlimitedで探してみる

関連記事【Beyond the Internet】未来のインターネットと持続可能な成長に向けた課題とは?【Interop2019 基調講演】

関連記事Python環境構築の方法を解説!機械学習をはじめるためには?

COMMENT

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です