メディア

無料で始める機械学習 「AWS認定」でML技術を学ぶ方法とは

IT人材の不足が深刻化する中でAWSが自社の認定試験を通して機械学習を学ぶサービスを提供している。4つの出題分野とサンプル問題、学習方法をまとめて解説する。

» 2022年06月15日 07時00分 公開
[福永理美キーマンズネット]

 ITエンジニアやデジタル人材の不足が深刻化する中、能力を客観的に測れる「資格」が注目される。その中でもベンダーが設定する認定資格は専門性や実務能力を証明するものとして、キャリア人材や即戦力人材の評価に有効な指標となる。

 2022年5月25〜26日に開催された「AWS Summit Online 2022」(2022年6月30日までオンデマンド配信予定)でAWSジャパンでテクニカルトレーナーを務める佐中 晋氏が「認定資格から始めるAWSの機械学習〜AWS Certified Machine Learning-Specialty攻略〜」と題する講演に登壇し、AWSの機械学習に関する認定資格について解説した。

サマリー

  • AWS Certified Machine Learning-Specialtyとは
  • 出題分野と問題例(データエンジニアリング/探索的データ分析/モデリング/機械学習の実装とその運用)
  • 認定取得に向けた参考資料と学習モデル

AWS Certified Machine Learning-Specialtyとは

 AWS認定とは、AWSに関する技術スキルとクラウドの専門知識を保持することを認定する制度だ。「取得したい資格」として人気が高い。認定資格は実務経験の有無によって「基礎」「アソシエイト」「プロフェッショナル」の三段階に区分され、これに6つの知識分野に関する専門知識を問う専門知識認定資格を加えた4種類の認定が存在する。

AWS認定の概要(出典:AWS Summit講演資料)

 今回講演の題材となった「Certified Machine Learning-Specialty」は機械学習(MLモデル)の構築とトレーニング、チューニング、デプロイに関する専門知識を認定するものだ。内容はAWSに限らず、機械学習の基本的な知識についても問われるため、認定の取得を通して機械学習を体系的に学べる。

 試験は所定のテストセンターかオンライン(監督付き)で受けられる。180分で65問の複数選択または複数応答式の問題が出題され、費用は3万円(税別)となる(2022年6月時点)。

出題分野と問題例

 Certified Machine Learning-Specialtyは具体的に、以下における知識を認定する。

  • 特定のビジネス課題に対して適切なMLアプローチを選択し、その理由を説明する
  • MLソリューションの実装に適したAWSのサービスを特定する
  • スケーラビリティ、コスト効率、信頼性、安全性に優れたMLソリューションを設計、実装する

 認定試験の出題分野は、下記の4分野に分かれる。

分野 出題比率
1.データエンジニアリング 20%
2.探索的データ分析 24%
3.モデリング 36%
4.機械学習の実装とその運用 20%

 第1分野の「データエンジニアリング」では、機械学習で利用するデータの収集や変換、保存に関する知識が問われる。具体的には「機械学習のデータリポジトリを作成する」「データ取り込みソリューションを特定、実装する」「データ変換ソリューションを特定、実装する」内容だ。例えば以下の問題であれば、2分程度で正答を選ぶことが想定される。

データエンジニアリングに関するサンプル問題(出典:AWS Summit講演資料)

 上記のケースの目的は「ストリーミングデータをリアルタイム分析してデバイスの異常を検知すること」となる。この場合、サーバレスでフルマネージドなApache Flink環境でストリーミングデータを分析できる「Amazon Kinesis Data Analytics」が正解となる。同分野では機械学習関連のサービスの他、AWSのビッグデータやIoT、データ変換サービスに関する問題も出題される。

 第2分野の「探索的データ分析」では、データの前処理に関する知識が問われる。具体的には「モデリング用のデータをサニタイズ、準備する」「特徴エンジニアリングを実行する」「機械学習のデータを分析し、視覚化する」内容だ。

探索的データ分析に関するサンプル問題(出典:AWS Summit講演資料)

 上記は機械学習に関する一般的な知識を問う問題だ。構築するモデルに強い相関関係のある特徴量が含まれると、モデルの精度や計算量に問題が発生することがあるため、探索的データ分析のフェーズで特徴量間の相関を確かめる必要がある。上記の問題では相関係数が負の値を持つため、Bの「特徴量Aが増加すると、特徴量Bが減少する」が正解となる。

 第3分野の「モデリング」は、ビジネスの課題を機械学習の問題に落とし込んで適切なモデルを選択し、そのモデルを適切にチューニング、評価できるかが問われる。具体的には「ビジネスの課題を機械学習の課題として捉え直す」「適切なモデルを選択する」「機械学習モデルのトレーニング」「 ハイパーパラメータの最適化」「機械学習モデルの評価」について出題される。

モデリングに関するサンプル問題(出典:AWS Summit講演資料)

 上記は数値予測のために使用可能なアルゴリズムを選択する問題だ。数値予測のアルゴリズムを「回帰問題」と呼ぶ。4つの選択肢のうち回帰問題に使えるのはAの「ロジスティック回帰」かBの「線形回帰」となるが、ロジスティック回帰で得られるのは「0か1か」といった2種類の値を対象に「発生する確率」を求めるものだ。そのため上記の問題ではBの線形回帰が正答となる。

 第4分野の「機械学習の実装とその運用」では、一般的な機械学習の実装、運用方法から、AWSのAIサービスのユースケースなどに関する問題が出題される。具体的には「パフォーマンス、可用性、スケーラビリティ、回復性、耐障害性を備えた機械学習ソリューションの構築」「特定の課題に対する適切な機械学習サービスと機能の提案、実装」「基本的なAWSセキュリティプラクティスの適用」「 機械学習のデプロイと運用」に関する内容だ。

機械学習の実装とその運用に関するサンプル問題(出典:AWS Summit講演資料)

 AWSは機械学習をすぐに利用したいユーザーに向けた学習済みモデルを提供するサービス群「AIサービス」を展開する。上記はそれらの中から目的に応じたサービスを選択する問題で、目的は「メタデータの抽出」だ。Aの「Amazon Textract」はスキャンした文書からテキストを抽出するサービスなので選択肢としては最適ではない。機械学習を利用してテキストデータを分析し「キーフレーズの抽出」や「感情分析」を実施する自然言語処理として、Dの「Amazon Comprehend」が正答となる。

 これまでの試験概要やサンプル問題はWebサイトでも公開されており、無料でダウンロードできる。

認定取得に向けた参考資料と学習モデル

 認定取得に向けた学習方法として、AWSは学習環境と実践環境、試験対策用の問題集を提供している。

 オンデマンドで学習できる環境としては「AWS Skill Builder」のデジタルトレーニングがある。40超の機械学習に関するデジタルトレーニングコンテンツが公開され、無料で受講できる(2022年6月時点)。入門者向きのトレーニングとして推奨されるのが以下の4つだ。

  • Introduction to Machine Learning: Art of the Possible (入門者に向けた、事例を中心としたコンテンツ)
  • Process Model: CRISP-DM on the AWS Stack (機械学習に関するタスクを解説するフレームワークのコンテンツ)
  • The Elements of Data Science (機械学習モデルの構築と改善方法に関するトレーニング)
  • Exam Readiness: AWS Certified Machine Learning-Specialty (試験の詳細やサンプル問題を紹介するコンテンツ)

 また、AWS認定インストラクターによるライブ授業「クラスルームトレーニング」では、機械学習の基礎からデプロイまでを4日間通して学ぶ「The Machine Learning Pipeline on AWS」や、1日でAWSの機械学習サービスを体験できる「Practical Data Science with Amazon SageMaker」、DevOpsを取り入れて機械学習の開発や運用を効率化する方法を学ぶ「MLOps Engineering on AWS」などがある。

 学んだ内容を実践できる環境としては「AWS初心者向けハンズオン」「Amazon SageMaker Studio Lab」などがある。前者は操作手順の解説が記載された資料で、UIの理解から始めたい初心者をサポートする。後者は無料のAWSコンピューティングリソースを利用しながら機械学習を実装できる。2022年5月時点ではパブリックプレビュー中で、制限時間内であればCPU/GPU環境での機械学習トレーニングが誰でも受けられる。

 試験直前対策用の模擬問題も提供されている。AWS Skill Builderの「Exam Readiness」で、試験に必要な知識の復習と、例題や練習問題による知識のチェックができる。

 2022年時点、AIイノベーションの多くが黎明期に位置する。企業としても人材としても、機械学習技術を習得するメリットは大きい。

Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。