GoogleのML(Machine Learning)トレーニングプログラムに挑戦した件
Contents
ML Study Jamsについて
ゴールデンウィークの少し前にGoogleよりML Study Jams Vol.4 : Machine Learning トレーニングプログラムの無料提供の発表があった。
期間は5月1より31日までの一ヶ月間、Qwicklabsハンズオンクラウドトレーニングを使ってオンラインでGoogleの機械学習に関する学習が無料とあった。
コロナウィルスの関係で自宅に居ることが多かったので、5月は勉強月間に位置づけてハンズオントレーニングを受けてみることにした。
24日(本日)までに対象ハンズオンを4つ終了させるとマグカップなどの記念品、8つ以上終了させるとTシャツやバック等の記念品が貰えるとあったので結構張り切って受けたのだが24日13:00現在で11個のハンズオンを終了させる事ができた。
またQwicklabsにログインをして分かったのだがML(機械学習)以外のハンズオンも全て無料で受けることが出来たので、この際なので色々と受けさせてもらった。
AWS(Amazon Web Services)は結構使っているがGCP(Google Cloud Platform)はそれ程使い込んでいなかったので勉強する良い機会になったと思っている。
終了したハンズオン
機械学習関連
ML(Machine Learning)に関するハンズオン
AI Platform | AI Platformの基本について学習 米国国勢調査所得データセットを使用して個人の属性(住所、教育水準、婚姻、性別、etc)から任意の人の所得が5万ドル以上か未満かをai-platformを使って予測する 例題がアメリカらしい。。。 |
Cloud Natural Language API | Natural Language API(自然言語API)を使ってのテキストのエンティティ分析を行う 例題、「Michelangelo Caravaggio, Italian painter, is known for ‘The Calling of Saint Matthew」のテキストを使用すると、”Michelangelo Caravaggio”はPERSON(人)と分析される! ミケランジェロは確かに人なので正しいのだが。。。AI恐るべし。 ※例題は英語だが日本語も使える |
Natural Language API によるエンティティ感情分析 | 上記と同様テキストをエンティティ分析した後に感情分析を行う 例文は「I liked the sushi but the service was terrible.」 sushi(寿司)が”好き”という感情だと分析される |
Natural Language API を使用してテキストをカテゴリに分類する | テキストをカテゴリ分類してBigQueryにて集計する BBCの2004年~2005年までに書かれた5つの分野(ビジネス、エンターテインメント、政治、スポーツ、技術)の記事が2,225件含まれている一般公開データセットを読み込んでテキストの内容から記事の分類を行う スマートニュースは記事のカテゴリ分けをAIを使っていると聞いたことがあるが似たような手法なのか |
Google Cloud Speech API | FLACでエンコードされた音声データを読みこんでSppech APIを使ってテキストに変換する 録音データからの文字起こしに利用するパターン 例題では英語だったが日本語にも対応している |
Cloud Speech API を使用した音声文字変換 | FLACでエンコードされた音声データをテキストに変換する 英語以外のフランス語をベースに変換した |
Cloud Vision API で画像内の物体(ラベル)、顔、ランドマークを検出する | 画像を読み込んでCloud Vision APIで何が写っているのかを検出する ドーナッツの写真、複数の人物が写っている写真を読み込んで画像内のオブジェクトの位置を推測している 例えば人物の顔の位置(X、Y座標)を推測する また背景にラクダとエジプトの遺跡っぽい物が写っている写真から”ペトラ遺跡”(ヨルダン)と場所まで推測する(流石!) |
Cloud ML API を使用して画像内のテキストの抽出、分析、翻訳を行う | フランス語の標識の写真を読み込んで画像から文字部分を抽出して分析した後、英語に翻訳する |
AI Platform を使用したオンライン予測での scikit-learn モデル提供 | 国勢調査所得データセットをベースにXGBoostでモデルをトレーニングしてincome-level(所得水準)を予測する 例題がエグいね |
TensorFlow での機械学習 | 米国運輸統計局のデータ(出発地、到着地、出発遅延、平均出発遅延、到着遅延等)を元に飛行機が目的地に遅延せずに到着するかどうかをTensorFlowの線形モデルを使って予測する |
AutoML Vision でクラウド内の雲の画像を分類する | AutoML Visionに3種類の雲の画像をそれぞれ20枚ずづ読み込ませてアノテーションした後、学習させる 新たな雲の画像を読み込んで雲の種類を推測する
例題ではそれぞれ読み込ませる画像の枚数が若干少ない(20枚)だがそれなりの精度がでている もう少し枚数を増やせば更に精度が上がるとの事 Google Cloud(雲) Platformで雲を例題にする辺り、洒落ている |
Google Cloud ML による分散型機械学習 | –scale-tierの指定で最大8つのVMで分散学習させる |
ベースライン インフラストラクチャ
GCP(Google Cloud Platform)に基本に関するハンズオン。
今回の機械学習とは直接関係は無いがGCPの基本を理解するために追加で学習した。
Cloud Storage | データ保存用のCloud Storage バケットの作成、ファイルのアップロード、フォルダとサブフォルダの作成についての学習 |
Cloud IAM | Identity and Access Management(IAM)サービスに関する学習 ユーザと権限の管理 |
Cloud Monitoring | クラウドで実行されるアプリケーションのパフォーマンスや稼働時間をモニタリングする機能について学習する |
Cloud Functions | サーバーレスのランタイム環境 イベントに関連する関数を作成する事ができる AWSのλ(ラムダ)に近いのか |
Google Cloud Pub/Sub | アプリケーションやサービスの間でデータを交換するためのメッセージング サービス AWS IoT Coreに近いイメージ |
ベースライン インフラストラクチャ: チャレンジラボ | 上記の知識をベースとした演習問題 合格するとクエスト達成 |
その他
その他、関連知識に関するハンズオン。
Google で使用される API の概要 | Google APIの概要 |
API Explorer | API Explorerで画像をアップロードする |
Qwiklabs と Google Cloud Platform の概要 | QwiklabsとGoogle Cloud Platform 概要 一番最初に受講した |
仮想マシンの作成 | クラウド上にVMのインスタンスを立ち上げるまで |
Cloud Shell と gcloud のスタートガイド | Cloud Shellでのgcloudコマンドの使い方 |
Kubernetes Engine | Kubernetes Engineでのコンテナを作成し、アプリケーションのデプロイまで |
ネットワーク ロードバランサと HTTP ロードバランサを設定する | ネットワーク ロードバランサと HTTP ロードバランサを設定の実践演習 |
Google Cloud の基礎:チャレンジラボ | 上記Google Cloudの知識をベースとした演習問題 合格するとクエストの達成 |
Gmail: スタートガイド | Gmailの基本的な使い方 普段使っているがついでに受講してみた |
感想
ハンズオンの日本語は若干怪しげな部分もあり、間違っている事もちょいちょいあった。
英語の方が正しいことが多く英語で受け直して終了したハンズオンもいくつかあったので日本語はもう少し何とかして欲しい。
ただチャットでの対応は迅速で的確、満足がいく対応だったのと、専用のSlackがあったので受講者同士で情報交換をしながら進めることができた。
今回無料に釣られてやってきたが有料でも受けたいハンズオンがいくつもあった。
ここまで来るとGoogle Cloud 認定資格を受講したくなるのは、やっぱりGoogleのプロモーションにやられたのだろうなと思のだが、まぁそれでも良いと思う。
最近のコメント